npm - @empiricalrun/test-gen - Versions diffs - 0.80.3 → 0.81.1 - Mend

@empiricalrun/test-gen 0.80.3 → 0.81.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

package/CHANGELOG.md +31 -0
package/dist/agent/chat/index.d.ts.map +1 -1
package/dist/agent/chat/index.js +1 -9
package/dist/agent/chat/prompt/pw-utils-docs.d.ts +1 -1
package/dist/agent/chat/prompt/pw-utils-docs.d.ts.map +1 -1
package/dist/agent/chat/prompt/pw-utils-docs.js +0 -56
package/dist/agent/chat/prompt/skills.d.ts +1 -2
package/dist/agent/chat/prompt/skills.d.ts.map +1 -1
package/dist/agent/chat/prompt/skills.js +34 -20
package/dist/recorder/index.d.ts.map +1 -1
package/dist/recorder/index.js +5 -3
package/dist/tools/diagnosis-fetcher.d.ts +6 -2
package/dist/tools/diagnosis-fetcher.d.ts.map +1 -1
package/dist/tools/diagnosis-fetcher.js +1 -1
package/dist/tools/executor/index.d.ts.map +1 -1
package/dist/tools/executor/index.js +0 -2
package/dist/tools/index.d.ts.map +1 -1
package/dist/tools/index.js +3 -1
package/dist/tools/run-test.js +2 -2
package/dist/tools/test-run-fetcher/index.d.ts.map +1 -1
package/package.json +11 -11
package/tsconfig.tsbuildinfo +1 -1
package/dist/agent/browsing/index.d.ts +0 -15
package/dist/agent/browsing/index.d.ts.map +0 -1
package/dist/agent/browsing/index.js +0 -60
package/dist/agent/master/action-tool-calls.d.ts +0 -42
package/dist/agent/master/action-tool-calls.d.ts.map +0 -1
package/dist/agent/master/action-tool-calls.js +0 -87
package/dist/agent/master/element-annotation.d.ts +0 -30
package/dist/agent/master/element-annotation.d.ts.map +0 -1
package/dist/agent/master/element-annotation.js +0 -175
package/dist/agent/master/execute-browser-action.d.ts +0 -24
package/dist/agent/master/execute-browser-action.d.ts.map +0 -1
package/dist/agent/master/execute-browser-action.js +0 -121
package/dist/agent/master/next-action.d.ts +0 -22
package/dist/agent/master/next-action.d.ts.map +0 -1
package/dist/agent/master/next-action.js +0 -97
package/dist/agent/master/planner.d.ts +0 -15
package/dist/agent/master/planner.d.ts.map +0 -1
package/dist/agent/master/planner.js +0 -142
package/dist/agent/master/run.d.ts +0 -17
package/dist/agent/master/run.d.ts.map +0 -1
package/dist/agent/master/run.js +0 -156
package/dist/agent/master/scroller.d.ts +0 -15
package/dist/agent/master/scroller.d.ts.map +0 -1
package/dist/agent/master/scroller.js +0 -369
package/dist/agent/master/with-hints.d.ts +0 -17
package/dist/agent/master/with-hints.d.ts.map +0 -1
package/dist/agent/master/with-hints.js +0 -103
package/dist/agent/planner/run-time-planner.d.ts +0 -15
package/dist/agent/planner/run-time-planner.d.ts.map +0 -1
package/dist/agent/planner/run-time-planner.js +0 -98
package/dist/agent/planner/run.d.ts +0 -7
package/dist/agent/planner/run.d.ts.map +0 -1
package/dist/agent/planner/run.js +0 -128
package/dist/browser-injected-scripts/annotate-elements.js +0 -612
package/dist/browser-injected-scripts/annotate-elements.spec.d.ts +0 -2
package/dist/browser-injected-scripts/annotate-elements.spec.d.ts.map +0 -1
package/dist/browser-injected-scripts/annotate-elements.spec.js +0 -202
package/dist/browser-injected-scripts/annotate-elements.spec.ts +0 -327
package/dist/generate-summary/frame-sampling.d.ts +0 -12
package/dist/generate-summary/frame-sampling.d.ts.map +0 -1
package/dist/generate-summary/frame-sampling.js +0 -72
package/dist/generate-summary/generate-error-stack-summary.d.ts +0 -11
package/dist/generate-summary/generate-error-stack-summary.d.ts.map +0 -1
package/dist/generate-summary/generate-error-stack-summary.js +0 -41
package/dist/generate-summary/generate-failed-step-screenshot-diff-summary.d.ts +0 -58
package/dist/generate-summary/generate-failed-step-screenshot-diff-summary.d.ts.map +0 -1
package/dist/generate-summary/generate-failed-step-screenshot-diff-summary.js +0 -460
package/dist/generate-summary/generate-grouped-summary.d.ts +0 -18
package/dist/generate-summary/generate-grouped-summary.d.ts.map +0 -1
package/dist/generate-summary/generate-grouped-summary.js +0 -88
package/dist/generate-summary/merge-summary.d.ts +0 -16
package/dist/generate-summary/merge-summary.d.ts.map +0 -1
package/dist/generate-summary/merge-summary.js +0 -43
package/dist/generate-summary/pick-videos-for-comparison.d.ts +0 -9
package/dist/generate-summary/pick-videos-for-comparison.d.ts.map +0 -1
package/dist/generate-summary/pick-videos-for-comparison.js +0 -54
package/dist/tools/slack-message/index.d.ts +0 -3
package/dist/tools/slack-message/index.d.ts.map +0 -1
package/dist/tools/slack-message/index.js +0 -69
package/dist/tools/test-run-fetcher/types.d.ts +0 -79
package/dist/tools/test-run-fetcher/types.d.ts.map +0 -1
package/dist/tools/test-run-fetcher/types.js +0 -2
package/dist/utils/env.d.ts +0 -2
package/dist/utils/env.d.ts.map +0 -1
package/dist/utils/env.js +0 -7

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,36 @@
 # @empiricalrun/test-gen
+## 0.81.1
+### Patch Changes
+- Updated dependencies [76d0872]
+  - @empiricalrun/shared-types@0.14.0
+  - @empiricalrun/llm@0.27.0
+  - @empiricalrun/cua@0.4.1
+  - @empiricalrun/dashboard-client@0.3.0
+  - @empiricalrun/reporter@0.29.0
+  - @empiricalrun/test-run@0.17.0
+  - videostil@0.3.6
+## 0.81.0
+### Minor Changes
+- 6fb8170: feat: playwright utils upgraded to use new core
+### Patch Changes
+- Updated dependencies [6fb8170]
+- Updated dependencies [aa78c40]
+  - @empiricalrun/cua@0.4.0
+  - @empiricalrun/reporter@0.29.0
+  - @empiricalrun/shared-types@0.13.0
+  - @empiricalrun/test-run@0.17.0
+  - @empiricalrun/dashboard-client@0.3.0
+  - @empiricalrun/llm@0.26.0
+  - videostil@0.3.5
 ## 0.80.3
 ### Patch Changes

package/dist/agent/chat/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/agent/chat/index.ts"],"names":[],"mappings":"AAAA,OAAO,KAAK,EAAE,WAAW,EAAE,MAAM,uCAAuC,CAAC;AACzE,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qCAAqC,CAAC;~~AAsBpE~~,OAAO,EAAE,SAAS,EAAE,MAAM,SAAS,CAAC;AAOpC,qBAAa,SAAS,CAAC,CAAC,CAAE,SAAQ,SAAS,CAAC,CAAC,CAAC;IAC5C,SAAS,CAAC,QAAQ,IAAI,WAAW;~~IA8B3B~~,iBAAiB,CACrB,eAAe,EAAE,MAAM,OAAO,CAAC,QAAQ,CAAC,GACvC,OAAO,CAAC,MAAM,CAAC;~~CA0GnB~~"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/agent/chat/index.ts"],"names":[],"mappings":"AAAA,OAAO,KAAK,EAAE,WAAW,EAAE,MAAM,uCAAuC,CAAC;AACzE,OAAO,KAAK,EAAE,QAAQ,EAAE,MAAM,qCAAqC,CAAC;AAoBpE,OAAO,EAAE,SAAS,EAAE,MAAM,SAAS,CAAC;AAOpC,qBAAa,SAAS,CAAC,CAAC,CAAE,SAAQ,SAAS,CAAC,CAAC,CAAC;IAC5C,SAAS,CAAC,QAAQ,IAAI,WAAW;IA2B3B,iBAAiB,CACrB,eAAe,EAAE,MAAM,OAAO,CAAC,QAAQ,CAAC,GACvC,OAAO,CAAC,MAAM,CAAC;CA2GnB"}

package/dist/agent/chat/index.js CHANGED Viewed

@@ -2,15 +2,12 @@
 Object.defineProperty(exports, "__esModule", { value: true });
 exports.ChatAgent = void 0;
 const tools_1 = require("../../tools");
-const api_client_1 = require("../../tools/api-client");
 const analyse_video_1 = require("../../tools/definitions/analyse-video");
 const grep_1 = require("../../tools/definitions/grep");
 const list_tests_and_projects_1 = require("../../tools/definitions/list-tests-and-projects");
 const run_test_1 = require("../../tools/definitions/run-test");
-const test_gen_browser_1 = require("../../tools/definitions/test-gen-browser");
 const diagnosis_fetcher_1 = require("../../tools/diagnosis-fetcher");
 const fetch_file_1 = require("../../tools/fetch-file");
-const slack_message_1 = require("../../tools/slack-message");
 const base_1 = require("../base");
 const pw_utils_docs_1 = require("./prompt/pw-utils-docs");
 const repo_1 = require("./prompt/repo");
@@ -19,14 +16,11 @@ const test_case_def_1 = require("./prompt/test-case-def");
 const trace_utils_docs_1 = require("./prompt/trace-utils-docs");
 class ChatAgent extends base_1.BaseAgent {
     getTools() {
-        const hasSlackTool = this.featureFlags.includes("has_slack_tool");
-        const hasSkills = this.featureFlags.includes("useSkills");
         const hasAnalyseVideoTool = this.featureFlags.includes("has_analyse_video_tool");
         const custom = [
             ...(hasAnalyseVideoTool ? [analyse_video_1.analyseVideo] : []),
             run_test_1.runTestTool,
             grep_1.grepTool,
-            ...(hasSlackTool ? [slack_message_1.slackMessageTool] : []),
             fetch_file_1.fetchFileTool,
             list_tests_and_projects_1.listProjectsTool,
             list_tests_and_projects_1.listTestsForProjectTool,
@@ -35,7 +29,6 @@ class ChatAgent extends base_1.BaseAgent {
             tools_1.safeBashTool,
             ...(!(0, tools_1.hasBuiltInWebFetch)(this.selectedModel) ? [tools_1.scrapeHtmlTool] : []),
             ...tools_1.testGenerationToolsWithoutBrowserAgent,
-            ...(!hasSkills ? [api_client_1.apiClientTool, test_gen_browser_1.generateTestWithBrowserAgent] : []),
         ];
         return {
             custom,
@@ -48,8 +41,7 @@ class ChatAgent extends base_1.BaseAgent {
     async buildSystemPrompt(repoInfoBuilder) {
         const repoInfo = await repoInfoBuilder();
         const repoContext = await (0, repo_1.getRepoContextPrompt)(repoInfo);
-        const hasSkills = this.featureFlags.includes("useSkills");
-        const skillsInToolsPrompt = hasSkills ? skills_1.skillsToolsPrompt : "";
+        const skillsInToolsPrompt = await (0, skills_1.getSkillsToolsPrompt)(this.workerEnv?.HIVE_API_KEY);
         const preamble = `
 You are a helpful assistant that can answer questions and help with tasks related to writing and maintaining Playwright tests.

package/dist/agent/chat/prompt/pw-utils-docs.d.ts CHANGED Viewed

@@ -1,2 +1,2 @@
-export declare const playwrightUtilsDocs = "\nYou can refer to the following recipes to learn how to write or diagnose tests for different scenarios.\n\n<email-automation>\n\n# Email automation\n\n## Example usage\n\n### Dynamic email\n\nThis dynamically generates a random email address that can \nbe used for the test (e.g. invite a new user).\n\n```ts\nimport { EmailClient } from \"@empiricalrun/playwright-utils\";\nimport { expect } from \"@playwright/test\";\n\nconst client = new EmailClient();\nconst address = client.getAddress();\n\n// Input the `address` in the application\n// that sends the email.\n\n// Get email received on the `address`\nconst email = await client.waitForEmail();\nexpect(\n  email.links.find((l) => l.text === \"Join your team\")\n).toBeTruthy();\n```\n\n### Static email\n\nThis uses a known (static) email that can be used to login\ninto an application.\n\nThis needs an email id (e.g. `test-login-user`). The email id\nis appended with the domain (managed internally) to get the full\nemail address.\n\n```ts\nimport { EmailClient } from \"@empiricalrun/playwright-utils\";\n\nconst emailId = `test-login-user`;\n\nconst client = new EmailClient({ emailId });\nconst address = client.getAddress(); // Returns full address with domain\n\n// Get email received on the `address`\nconst email = await client.waitForEmail();\n\n// Get login OTP\nconst loginCode = email.codes[0];\n```\n\n</email-automation>\n\n<fixtures>\n\nThe playwright-utils package provides fixtures that wrap around Playwright's built-in\n`page`, `context` fixtures to provide a mouse highlighter (which makes it easier to\nsee actions taken in a video).\n\nTo use this, you can use the `baseTestFixture` and `extendExpect` imports\nin your fixtures file.\n\n```ts\nimport { test as base, expect as baseExpect } from \"@playwright/test\";\nimport { baseTestFixture, extendExpect } from \"@empiricalrun/playwright-utils/test\";\n\nexport const test = baseTestFixture(base);\nexport const expect = extendExpect(baseExpect);\n```\n\n### Get a new browser context\n\nThis package provides a fixture `customContextPageProvider` which is a good way to create\na fresh, new browser context, and a page inside it.\n\nThere are two benefits of using this to create contexts or pages:\n1. Videos get recorded and attached to the test report\n2. Mouse highlights are available\n\n```ts\nimport { test, expect } from \"./fixtures\";\n\ntest(\"Example test\", async ({ page: builtInPage, customContextPageProvider }) => {\n  // builtInPage is from default browser context\n  const { page: newPage, context } = await customContextPageProvider();\n  // newPage is from this other browser context\n});\n```\n\ncustomContextPageProvider can accept options to customize the browser context.\n\n```\n  customContextPageProvider: (\n    options?: BrowserContextOptions,\n  ) => Promise<{ context: BrowserContext; page: Page }>;\n```\n\nFor example, pass { storageState: undefined } to create a new browser context without\nthe auth state of the current browser context. This is useful for multi-user scenarios.\n\n</fixtures>\n\n<video-labels>\n\n# Video Labels\n\nPages generate video recordings after test execution, with 1 page generating 1 video file (webm). \n\nIf your test case relies on multiple pages (e.g. for multi-user or multi-app flows), it can get difficult to\nknow which page does \"video-1.webm\" belong to.\n\nTo solve this, you should set video labels for pages. This will enable you to identify videos faster.\n\n## Usage\n\n```typescript\nimport { setVideoLabel } from '@empiricalrun/playwright-utils/test';\n\ntest('my test', async ({ page }) => {\n  setVideoLabel(page, 'checkout-flow');\n  // Video will be saved as 'checkout-flow.webm'\n});\n```\n\n## Multiple Contexts\n\n```typescript\ntest('multi-user scenario', async ({ page, customContextPageProvider }) => {\n  setVideoLabel(page, 'host-page');\n\n  const { page: guestPage } = await customContextPageProvider({ storageState: undefined });\n  setVideoLabel(guestPage, 'guest-page');\n  // Videos saved as 'guest-page.webm' and 'host-page.webm'\n});\n```\n\n## Notes\n\n- The default behavior is to label videos for multiple pages as: `video-0.webm`, `video-1.webm`, etc.\n- If setVideoLabel is called twice for the same page, the last label will be set\n\n</video-labels>\n\n";
+export declare const playwrightUtilsDocs = "\nYou can refer to the following recipes to learn how to write or diagnose tests for different scenarios.\n\n<fixtures>\n\nThe playwright-utils package provides fixtures that wrap around Playwright's built-in\n`page`, `context` fixtures to provide a mouse highlighter (which makes it easier to\nsee actions taken in a video).\n\nTo use this, you can use the `baseTestFixture` and `extendExpect` imports\nin your fixtures file.\n\n```ts\nimport { test as base, expect as baseExpect } from \"@playwright/test\";\nimport { baseTestFixture, extendExpect } from \"@empiricalrun/playwright-utils/test\";\n\nexport const test = baseTestFixture(base);\nexport const expect = extendExpect(baseExpect);\n```\n\n### Get a new browser context\n\nThis package provides a fixture `customContextPageProvider` which is a good way to create\na fresh, new browser context, and a page inside it.\n\nThere are two benefits of using this to create contexts or pages:\n1. Videos get recorded and attached to the test report\n2. Mouse highlights are available\n\n```ts\nimport { test, expect } from \"./fixtures\";\n\ntest(\"Example test\", async ({ page: builtInPage, customContextPageProvider }) => {\n  // builtInPage is from default browser context\n  const { page: newPage, context } = await customContextPageProvider();\n  // newPage is from this other browser context\n});\n```\n\ncustomContextPageProvider can accept options to customize the browser context.\n\n```\n  customContextPageProvider: (\n    options?: BrowserContextOptions,\n  ) => Promise<{ context: BrowserContext; page: Page }>;\n```\n\nFor example, pass { storageState: undefined } to create a new browser context without\nthe auth state of the current browser context. This is useful for multi-user scenarios.\n\n</fixtures>\n\n<video-labels>\n\n# Video Labels\n\nPages generate video recordings after test execution, with 1 page generating 1 video file (webm). \n\nIf your test case relies on multiple pages (e.g. for multi-user or multi-app flows), it can get difficult to\nknow which page does \"video-1.webm\" belong to.\n\nTo solve this, you should set video labels for pages. This will enable you to identify videos faster.\n\n## Usage\n\n```typescript\nimport { setVideoLabel } from '@empiricalrun/playwright-utils/test';\n\ntest('my test', async ({ page }) => {\n  setVideoLabel(page, 'checkout-flow');\n  // Video will be saved as 'checkout-flow.webm'\n});\n```\n\n## Multiple Contexts\n\n```typescript\ntest('multi-user scenario', async ({ page, customContextPageProvider }) => {\n  setVideoLabel(page, 'host-page');\n\n  const { page: guestPage } = await customContextPageProvider({ storageState: undefined });\n  setVideoLabel(guestPage, 'guest-page');\n  // Videos saved as 'guest-page.webm' and 'host-page.webm'\n});\n```\n\n## Notes\n\n- The default behavior is to label videos for multiple pages as: `video-0.webm`, `video-1.webm`, etc.\n- If setVideoLabel is called twice for the same page, the last label will be set\n\n</video-labels>\n\n";
 //# sourceMappingURL=pw-utils-docs.d.ts.map

package/dist/agent/chat/prompt/pw-utils-docs.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"pw-utils-docs.d.ts","sourceRoot":"","sources":["../../../../src/agent/chat/prompt/pw-utils-docs.ts"],"names":[],"mappings":"~~AA4IA~~,eAAO,MAAM,mBAAmB,~~itIAe~~/B,CAAC"}
1	+ {"version":3,"file":"pw-utils-docs.d.ts","sourceRoot":"","sources":["../../../../src/agent/chat/prompt/pw-utils-docs.ts"],"names":[],"mappings":"AAuFA,eAAO,MAAM,mBAAmB,s8FAW/B,CAAC"}

package/dist/agent/chat/prompt/pw-utils-docs.js CHANGED Viewed

@@ -1,58 +1,6 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
 exports.playwrightUtilsDocs = void 0;
-// Ref: packages/playwright-utils/docs/email.md
-const emailRecipe = `
-# Email automation
-## Example usage
-### Dynamic email
-This dynamically generates a random email address that can
-be used for the test (e.g. invite a new user).
-\`\`\`ts
-import { EmailClient } from "@empiricalrun/playwright-utils";
-import { expect } from "@playwright/test";
-const client = new EmailClient();
-const address = client.getAddress();
-// Input the \`address\` in the application
-// that sends the email.
-// Get email received on the \`address\`
-const email = await client.waitForEmail();
-expect(
-  email.links.find((l) => l.text === "Join your team")
-).toBeTruthy();
-\`\`\`
-### Static email
-This uses a known (static) email that can be used to login
-into an application.
-This needs an email id (e.g. \`test-login-user\`). The email id
-is appended with the domain (managed internally) to get the full
-email address.
-\`\`\`ts
-import { EmailClient } from "@empiricalrun/playwright-utils";
-const emailId = \`test-login-user\`;
-const client = new EmailClient({ emailId });
-const address = client.getAddress(); // Returns full address with domain
-// Get email received on the \`address\`
-const email = await client.waitForEmail();
-// Get login OTP
-const loginCode = email.codes[0];
-\`\`\`
-`;
 // Ref: packages/playwright-utils/docs/fixtures.md
 const fixturesRecipe = `
 The playwright-utils package provides fixtures that wrap around Playwright's built-in
@@ -141,10 +89,6 @@ test('multi-user scenario', async ({ page, customContextPageProvider }) => {
 exports.playwrightUtilsDocs = `
 You can refer to the following recipes to learn how to write or diagnose tests for different scenarios.
-<email-automation>
-${emailRecipe}
-</email-automation>
 <fixtures>
 ${fixturesRecipe}
 </fixtures>

package/dist/agent/chat/prompt/skills.d.ts CHANGED Viewed

@@ -1,3 +1,2 @@
-export declare const skillsToolsPrompt: string;
-export declare const skillsProactivenessPrompt = "\nIf your listed tools don't seem sufficient for a task, load a relevant skill file using the bash tool to learn how to accomplish the task with your existing tools.\n";
+export declare function getSkillsToolsPrompt(hiveApiKey?: string): Promise<string>;
 //# sourceMappingURL=skills.d.ts.map

package/dist/agent/chat/prompt/skills.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"skills.d.ts","sourceRoot":"","sources":["../../../../src/agent/chat/prompt/skills.ts"],"names":[],"mappings":"~~AAiCA~~,~~eAAO~~,~~MAAM~~,~~iBAAiB~~,~~QAO7B~~,CAAC~~;AAEF~~,~~eAAO~~,MAAM,~~yBAAyB~~,~~4KAErC~~,CAAC"}
1	+ {"version":3,"file":"skills.d.ts","sourceRoot":"","sources":["../../../../src/agent/chat/prompt/skills.ts"],"names":[],"mappings":"AAiEA,wBAAsB,oBAAoB,CACxC,UAAU,CAAC,EAAE,MAAM,GAClB,OAAO,CAAC,MAAM,CAAC,CAGjB"}

package/dist/agent/chat/prompt/skills.js CHANGED Viewed

@@ -1,18 +1,27 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.skillsProactivenessPrompt = exports.skillsToolsPrompt = void 0;
-const availableSkills = [
-    {
-        name: "empirical-api",
-        description: "Interact with the Empirical dashboard via API. Load this skill whenever you need to access dashboard data such as test runs, resources, or any project-level information.",
-        location: "/opt/skills/empirical-api/SKILL.md",
-    },
-    {
-        name: "playwright-cli",
-        description: "Interact with browsers via playwright-cli for test generation, debugging, and exploration. Use when asked to generate, modify, or fix Playwright tests, explore a website or debug test failures.",
-        location: "/opt/skills/playwright-cli/SKILL.md",
-    },
-];
+exports.getSkillsToolsPrompt = getSkillsToolsPrompt;
+const HIVE_URL = process.env.HIVE_URL || "https://hive.empirical.run";
+async function fetchSkillCatalog(hiveApiKey) {
+    const apiKey = hiveApiKey || process.env.HIVE_API_KEY;
+    if (!apiKey) {
+        console.warn("[skills] HIVE_API_KEY not set, no skills available");
+        return [];
+    }
+    const res = await fetch(`${HIVE_URL}/api/skills`, {
+        headers: { Authorization: `Bearer ${apiKey}` },
+    });
+    if (!res.ok) {
+        console.error(`[skills] Failed to fetch skill catalog: ${res.status} ${res.statusText}`);
+        return [];
+    }
+    const { data } = (await res.json());
+    return data.map((s) => ({
+        name: s.name,
+        description: s.description || "",
+        location: `/opt/skills/${s.name}/SKILL.md`,
+    }));
+}
 const skillToXml = (s) => {
     return `<skill>
     <name>${s.name}</name>
@@ -20,17 +29,22 @@ const skillToXml = (s) => {
     <location>${s.location}</location>
 </skill>`;
 };
-const skillCatalogXml = `<available_skills>
-  ${availableSkills.map(skillToXml).join("\n")}
+function buildSkillsPrompt(skills) {
+    if (skills.length === 0)
+        return "";
+    const catalogXml = `<available_skills>
+  ${skills.map(skillToXml).join("\n")}
 </available_skills>`;
-exports.skillsToolsPrompt = `
+    return `
 You have access to **skill files** — documentation that teaches you how to accomplish tasks using your existing safeBash tool.
 Skills are NOT callable functions. To use a skill, read its file with bash, then follow the instructions inside.
-${skillCatalogXml}
+${catalogXml}
 To use a skill: run \`cat <location>\` using the bash tool, then follow the instructions in the output.
 `;
-exports.skillsProactivenessPrompt = `
-If your listed tools don't seem sufficient for a task, load a relevant skill file using the bash tool to learn how to accomplish the task with your existing tools.
-`;
+}
+async function getSkillsToolsPrompt(hiveApiKey) {
+    const skills = await fetchSkillCatalog(hiveApiKey);
+    return buildSkillsPrompt(skills);
+}

package/dist/recorder/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/recorder/index.ts"],"names":[],"mappings":"~~AAsEA~~,UAAU,kBAAkB;IAC1B,QAAQ,EAAE,MAAM,GAAG,SAAS,CAAC;IAC7B,OAAO,EAAE,MAAM,GAAG,SAAS,CAAC;IAC5B,GAAG,EAAE,MAAM,GAAG,SAAS,CAAC;CACzB;~~AA4TD~~,wBAAsB,WAAW,CAAC,EAChC,QAAQ,EACR,OAAO,EACP,GAAG,GACJ,EAAE,kBAAkB,iBAGpB"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/recorder/index.ts"],"names":[],"mappings":"AAuEA,UAAU,kBAAkB;IAC1B,QAAQ,EAAE,MAAM,GAAG,SAAS,CAAC;IAC7B,OAAO,EAAE,MAAM,GAAG,SAAS,CAAC;IAC5B,GAAG,EAAE,MAAM,GAAG,SAAS,CAAC;CACzB;AAiUD,wBAAsB,WAAW,CAAC,EAChC,QAAQ,EACR,OAAO,EACP,GAAG,GACJ,EAAE,kBAAkB,iBAGpB"}

package/dist/recorder/index.js CHANGED Viewed

@@ -99,9 +99,9 @@ async function collectTestInfo({ testName, project, repoDir, }) {
 }
 async function collectTestInfoFromDiagnosis(url) {
     const slug = (0, slug_1.extractSlugFromDiagnosisUrl)(url);
-    const data = (await client_1.apiClient.request(`/api/diagnosis/${slug}/detailed`, {
+    const data = await client_1.apiClient.request(`/api/diagnosis/${slug}/detailed`, {
         method: "GET",
-    }));
+    });
     if (!data.data ||
         !data.data.error_stack?.file_info ||
         data.data.error_stack.file_info.length === 0) {
@@ -111,7 +111,9 @@ async function collectTestInfoFromDiagnosis(url) {
         ? data.data.test_case.file_path
         : `tests/${data.data.test_case.file_path}`;
     const testName = data.data.test_case.name;
-    const selectedProjects = [data.data.diagnosis.test_project];
+    const selectedProjects = data.data.diagnosis.test_project
+        ? [data.data.diagnosis.test_project]
+        : [];
     const fileInfo = data.data.error_stack.file_info.map((file) => ({
         fileName: file.file_name,
         filePath: file.file_path,

package/dist/tools/diagnosis-fetcher.d.ts CHANGED Viewed

@@ -1,8 +1,12 @@
-import type { TestCaseTestRunMetadataEntry, TestCaseWithSuitesAsArray } from "@empiricalrun/shared-types/api/test-cases";
+import type { TestCaseTestRunMetadataEntry } from "@empiricalrun/shared-types/api/test-cases";
 import type { Tool } from "@empiricalrun/shared-types/chat-agent";
+import { getDiagnosisDetailedContract, type InferResponse } from "@empiricalrun/shared-types/external-api";
 import type { PlaywrightMatchingTest } from "@empiricalrun/shared-types/playwright-utils";
+type DiagnosisData = InferResponse<typeof getDiagnosisDetailedContract>;
+type DiagnosisDetailedTestCase = DiagnosisData["test_case"];
 export declare const fetchDiagnosisReportTool: Tool;
-export declare function getDataForLastSuccessfulRuns(testCase: TestCaseWithSuitesAsArray): Promise<never[] | Record<string, TestCaseTestRunMetadataEntry & {
+export declare function getDataForLastSuccessfulRuns(testCase: DiagnosisDetailedTestCase): Promise<never[] | Record<string, TestCaseTestRunMetadataEntry & {
     test_case: PlaywrightMatchingTest;
 }>>;
+export {};
 //# sourceMappingURL=diagnosis-fetcher.d.ts.map

package/dist/tools/diagnosis-fetcher.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"diagnosis-fetcher.d.ts","sourceRoot":"","sources":["../../src/tools/diagnosis-fetcher.ts"],"names":[],"mappings":"~~AAEA~~,OAAO,KAAK,~~EACV~~,4BAA4B,~~EAC5B~~,~~yBAAyB,EAC1B,~~MAAM,2CAA2C,CAAC;~~AACnD~~,OAAO,KAAK,EAAE,IAAI,EAAE,MAAM,uCAAuC,CAAC;AAClE,OAAO,KAAK,EAAE,sBAAsB,EAAE,MAAM,6CAA6C,CAAC;~~AAiB1F~~,eAAO,MAAM,wBAAwB,EAAE,IAwItC,CAAC;AAEF,wBAAsB,4BAA4B,CAChD,QAAQ,EAAE,yBAAyB;eAKW,sBAAsB;IAkDrE"}
1	+ {"version":3,"file":"diagnosis-fetcher.d.ts","sourceRoot":"","sources":["../../src/tools/diagnosis-fetcher.ts"],"names":[],"mappings":"AACA,OAAO,KAAK,EAAE,4BAA4B,EAAE,MAAM,2CAA2C,CAAC;AAE9F,OAAO,KAAK,EAAE,IAAI,EAAE,MAAM,uCAAuC,CAAC;AAClE,OAAO,EACL,4BAA4B,EAC5B,KAAK,aAAa,EACnB,MAAM,yCAAyC,CAAC;AACjD,OAAO,KAAK,EAAE,sBAAsB,EAAE,MAAM,6CAA6C,CAAC;AAG1F,KAAK,aAAa,GAAG,aAAa,CAAC,OAAO,4BAA4B,CAAC,CAAC;AACxE,KAAK,yBAAyB,GAAG,aAAa,CAAC,WAAW,CAAC,CAAC;AAgB5D,eAAO,MAAM,wBAAwB,EAAE,IAwItC,CAAC;AAEF,wBAAsB,4BAA4B,CAChD,QAAQ,EAAE,yBAAyB;eAKW,sBAAsB;IAkDrE"}

package/dist/tools/diagnosis-fetcher.js CHANGED Viewed

@@ -104,7 +104,7 @@ In the above, the diagnosis id is after the double hyphen, which is "ULRHHNwiGZ2
 # Test Case Information
 - **Name**: ${test_case.name}
 - **Test suite** (Describe blocks): ${test_case.suites}
-- **File path**: tests/${test_case.file_path}
+- **File path**: ${test_case.file_path}
 - **Playwright project**: ${project}
 # Test Run #${test_run.id}

package/dist/tools/executor/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/tools/executor/index.ts"],"names":[],"mappings":"AA6BA,OAAO,EAAE,gBAAgB,EAAE,qBAAqB,EAAE,MAAM,QAAQ,CAAC;AAEjE,YAAY,EAAE,qBAAqB,EAAE,MAAM,QAAQ,CAAC;AACpD,OAAO,EAAE,gBAAgB,EAAE,MAAM,QAAQ,CAAC;AAC1C,YAAY,EACV,aAAa,EACb,sBAAsB,EACtB,oBAAoB,EACpB,mBAAmB,GACpB,MAAM,SAAS,CAAC;AACjB,OAAO,EAAE,cAAc,EAAE,MAAM,aAAa,CAAC;AAE7C,qBAAa,YAAa,SAAQ,gBAAgB;gBACpC,MAAM,EAAE,IAAI,CAAC,qBAAqB,EAAE,OAAO,CAAC;~~CAiCzD~~"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/tools/executor/index.ts"],"names":[],"mappings":"AA6BA,OAAO,EAAE,gBAAgB,EAAE,qBAAqB,EAAE,MAAM,QAAQ,CAAC;AAEjE,YAAY,EAAE,qBAAqB,EAAE,MAAM,QAAQ,CAAC;AACpD,OAAO,EAAE,gBAAgB,EAAE,MAAM,QAAQ,CAAC;AAC1C,YAAY,EACV,aAAa,EACb,sBAAsB,EACtB,oBAAoB,EACpB,mBAAmB,GACpB,MAAM,SAAS,CAAC;AACjB,OAAO,EAAE,cAAc,EAAE,MAAM,aAAa,CAAC;AAE7C,qBAAa,YAAa,SAAQ,gBAAgB;gBACpC,MAAM,EAAE,IAAI,CAAC,qBAAqB,EAAE,OAAO,CAAC;CAgCzD"}

package/dist/tools/executor/index.js CHANGED Viewed

@@ -22,7 +22,6 @@ const publish_markdown_report_1 = require("../publish-markdown-report");
 const rename_file_1 = require("../rename-file");
 const run_test_1 = require("../run-test");
 const safe_bash_1 = require("../safe-bash");
-const slack_message_1 = require("../slack-message");
 const test_gen_browser_1 = require("../test-gen-browser");
 const test_run_fetcher_1 = require("../test-run-fetcher");
 const trace_dot_zip_1 = require("../trace-dot-zip");
@@ -61,7 +60,6 @@ class ToolExecutor extends base_1.BaseToolExecutor {
             set_issue_description_1.setIssueDescriptionTool,
             update_issue_1.updateIssueTool,
             firecrawl_scrape_1.scrapeHtmlTool,
-            slack_message_1.slackMessageTool,
             ...file_operations_1.textEditorTools,
         ];
         super({ ...params, tools });

package/dist/tools/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/tools/index.ts"],"names":[],"mappings":"AAAA,OAAO,EACL,eAAe,EACf,mBAAmB,EACnB,IAAI,EACJ,cAAc,EACf,MAAM,uCAAuC,CAAC;AA+B/C,OAAO,EAAE,YAAY,EAAE,MAAM,yBAAyB,CAAC;AACvD,OAAO,EAAE,cAAc,EAAE,MAAM,oBAAoB,CAAC;AACpD,OAAO,EAAE,iBAAiB,EAAE,MAAM,yBAAyB,CAAC;AAE5D,KAAK,oBAAoB,GAAG,IAAI,GAAG,cAAc,CAAC;AAclD,eAAO,MAAM,sCAAsC,EAAE,oBAAoB,EAKxE,CAAC;AAEF,eAAO,MAAM,mBAAmB,EAAE,oBAAoB,EAGrD,CAAC;AAkBF,wBAAgB,oBAAoB,CAAC,KAAK,EAAE,mBAAmB,WAE9D;AAED,wBAAgB,kBAAkB,CAAC,KAAK,EAAE,mBAAmB,~~WAE5D~~;AAED,wBAAgB,uBAAuB,CACrC,KAAK,EAAE,mBAAmB,GACzB,oBAAoB,EAAE,CAExB;AAED,wBAAgB,qBAAqB,CACnC,KAAK,EAAE,mBAAmB,GACzB,oBAAoB,EAAE,CAExB;AAED,wBAAgB,gBAAgB,CAAC,SAAS,EAAE,eAAe,EAAE,WAM5D;AAED,wBAAgB,gBAAgB,CAAC,QAAQ,EAAE,eAAe,GAAG,MAAM,CAQlE"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/tools/index.ts"],"names":[],"mappings":"AAAA,OAAO,EACL,eAAe,EACf,mBAAmB,EACnB,IAAI,EACJ,cAAc,EACf,MAAM,uCAAuC,CAAC;AA+B/C,OAAO,EAAE,YAAY,EAAE,MAAM,yBAAyB,CAAC;AACvD,OAAO,EAAE,cAAc,EAAE,MAAM,oBAAoB,CAAC;AACpD,OAAO,EAAE,iBAAiB,EAAE,MAAM,yBAAyB,CAAC;AAE5D,KAAK,oBAAoB,GAAG,IAAI,GAAG,cAAc,CAAC;AAclD,eAAO,MAAM,sCAAsC,EAAE,oBAAoB,EAKxE,CAAC;AAEF,eAAO,MAAM,mBAAmB,EAAE,oBAAoB,EAGrD,CAAC;AAkBF,wBAAgB,oBAAoB,CAAC,KAAK,EAAE,mBAAmB,WAE9D;AAED,wBAAgB,kBAAkB,CAAC,KAAK,EAAE,mBAAmB,WAM5D;AAED,wBAAgB,uBAAuB,CACrC,KAAK,EAAE,mBAAmB,GACzB,oBAAoB,EAAE,CAExB;AAED,wBAAgB,qBAAqB,CACnC,KAAK,EAAE,mBAAmB,GACzB,oBAAoB,EAAE,CAExB;AAED,wBAAgB,gBAAgB,CAAC,SAAS,EAAE,eAAe,EAAE,WAM5D;AAED,wBAAgB,gBAAgB,CAAC,QAAQ,EAAE,eAAe,GAAG,MAAM,CAQlE"}

package/dist/tools/index.js CHANGED Viewed

@@ -74,7 +74,9 @@ function hasBuiltInTextEditor(model) {
     return model.includes("claude");
 }
 function hasBuiltInWebFetch(model) {
-    return model.includes("claude");
+    return (model.includes("claude") &&
+        !model.includes(":vertex") &&
+        !model.includes(":bedrock"));
 }
 function textEditorToolsForModel(model) {
     return !hasBuiltInTextEditor(model) ? Object.values(str_replace_editor_1.textEditorTools) : [];

package/dist/tools/run-test.js CHANGED Viewed

@@ -12,8 +12,8 @@ const utils_1 = require("../artifacts/utils");
 const json_1 = require("../utils/json");
 const run_test_1 = require("./definitions/run-test");
 const helpers_1 = require("./file-operations/shared/helpers");
-function buildReportUrl(projectName, testRunId) {
-    return `https://reports-r2.empirical.run/${projectName}/${testRunId}/index.html`;
+function buildReportUrl(projectSlug, testRunId) {
+    return `https://reports-r2.empirical.run/${projectSlug}/${testRunId}/index.html`;
 }
 function buildResult({ hasTestPassed, summaryJson, reportUrl, }) {
     const summaryWithoutConfig = { ...summaryJson, config: undefined };

package/dist/tools/test-run-fetcher/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/tools/test-run-fetcher/index.ts"],"names":[],"mappings":"~~AAAA~~,OAAO,KAAK,EAAE,IAAI,EAAE,MAAM,uCAAuC,CAAC;~~AAYlE~~,wBAAgB,0BAA0B,CAAC,QAAQ,EAAE,MAAM,GAAG,MAAM,CAOnE;AAED,eAAO,MAAM,uBAAuB,EAAE,IAgHrC,CAAC"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/tools/test-run-fetcher/index.ts"],"names":[],"mappings":"AACA,OAAO,KAAK,EAAE,IAAI,EAAE,MAAM,uCAAuC,CAAC;AAUlE,wBAAgB,0BAA0B,CAAC,QAAQ,EAAE,MAAM,GAAG,MAAM,CAOnE;AAED,eAAO,MAAM,uBAAuB,EAAE,IAgHrC,CAAC"}

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@empiricalrun/test-gen",
-  "version": "0.80.3",
+  "version": "0.81.1",
   "publishConfig": {
     "registry": "https://registry.npmjs.org/",
     "access": "public"
@@ -89,18 +89,18 @@
     "typescript": "^5.3.3",
     "zod": "^4.0.1",
     "@empiricalrun/ast-parser": "^0.0.10",
-    "@empiricalrun/cua": "^0.3.0",
+    "@empiricalrun/cua": "^0.4.1",
     "@empiricalrun/dashboard-client": "^0.3.0",
-    "@empiricalrun/shared-types": "0.12.1",
-    "@empiricalrun/llm": "^0.26.0",
+    "@empiricalrun/shared-types": "0.14.0",
+    "@empiricalrun/llm": "^0.27.0",
     "@empiricalrun/r2-uploader": "^0.9.1",
     "@empiricalrun/trace-utils": "^0.1.0",
-    "@empiricalrun/reporter": "^0.28.1",
-    "@empiricalrun/test-run": "^0.16.1",
-    "videostil": "0.3.5"
+    "@empiricalrun/reporter": "^0.29.0",
+    "@empiricalrun/test-run": "^0.17.0",
+    "videostil": "0.3.6"
   },
   "devDependencies": {
-    "@playwright/test": "1.58.2",
+    "@playwright/test": "1.60.0",
     "@types/async-retry": "^1.4.8",
     "@types/console-log-level": "^1.4.5",
     "@types/detect-port": "^1.3.5",
@@ -113,17 +113,17 @@
     "@types/pixelmatch": "^5.2.6",
     "@types/serve-handler": "^6.1.4",
     "js-levenshtein": "^1.1.6",
-    "playwright": "1.58.2",
+    "playwright": "1.60.0",
     "serve-handler": "^6.1.6",
     "ts-patch": "^3.3.0"
   },
   "scripts": {
     "dev": "tspc --build --watch",
-    "build": "tspc --build && cp -r src/browser-injected-scripts dist",
+    "build": "tspc --build",
     "clean": "tspc --build --clean",
     "lint": "biome check --unsafe",
     "test": "vitest run",
-    "test-browser": "pnpm build && RUNNING_BROWSER_TESTS_FOR_TEST_GEN=1 npx playwright test",
+    "test-browser": "pnpm build && npx playwright test",
     "test:watch": "vitest",
     "test:watch-files": "vitest $0 --watch"
   }

package/tsconfig.tsbuildinfo CHANGED Viewed

	@@ -1 +1 @@
1	- {"root":["./src/index.ts","./src/logger.ts","./src/actions/assert.ts","./src/actions/click.ts","./src/actions/done.ts","./src/actions/fill.ts","./src/actions/goto.ts","./src/actions/hover.ts","./src/actions/index.ts","./src/actions/next-task.ts","./src/actions/press.ts","./src/actions/text-content.ts","./src/actions/constants/index.ts","./src/actions/utils/index.ts","./src/agent/cli.ts","./src/agent/index.ts","./src/agent/base/index.ts","./src/agent/browsing/~~index.ts","./src/agent/browsing/~~run.ts","./src/agent/browsing/utils.ts","./src/agent/chat/agent-loop.ts","./src/agent/chat/exports.ts","./src/agent/chat/index.ts","./src/agent/chat/models.ts","./src/agent/chat/state.ts","./src/agent/chat/types.ts","./src/agent/chat/utils.ts","./src/agent/chat/prompt/pw-utils-docs.ts","./src/agent/chat/prompt/repo.ts","./src/agent/chat/prompt/skills.ts","./src/agent/chat/prompt/test-case-def.ts","./src/agent/chat/prompt/trace-utils-docs.ts","./src/agent/code-review/index.ts","./src/agent/code-review/types.ts","./src/agent/code-review/xml-parser.ts","./src/agent/code-review/executor/index.ts","./src/agent/fast-triage/index.ts","./src/agent/master/~~action-tool-calls.ts","./src/agent/master/element-annotation.ts","./src/agent/master/execute-~~browser-action.ts","./src/agent/master/next-action.ts","./src/agent/master/planner.ts","./src/agent/master/run.ts","./src/agent/master/scroller.ts","./src/agent/master/with-hints.ts","./src/agent/master/browser-tests/cua.spec.ts","./src/agent/master/browser-tests/fixtures.ts","./src/agent/master/browser-tests/index.spec.ts","./src/agent/~~planner/run-time-planner.ts","./src/agent/planner/run.ts","./src/agent/~~triage/index.ts","./src/artifacts/index.ts","./src/artifacts/utils.ts","./src/auth/cli-auth.ts","./src/auth/index.ts","./src/auth/token-store.ts","./src/bin/index.ts","./src/bin/setup.ts","./src/bin/logger/index.ts","./src/bin/utils/context.ts","./src/bin/utils/index.ts","./src/bin/utils/fs/index.ts","./src/bin/utils/platform/web/index.ts","./src/bin/utils/platform/web/test-files/ts-path-import-validate.ts","./src/bin/utils/scenarios/index.ts","./src/~~browser-injected-scripts/annotate-elements.spec.ts","./src/~~constants/index.ts","./src/dashboard/client.ts","./src/dashboard/index.ts","./src/dashboard/tool-response-from-sandbox.ts","./src/dashboard/tool-response.ts","./src/dashboard/totp.ts","./src/dashboard/types.ts","./src/errors/index.ts","./src/file/client.ts","./src/file/server.ts","./src/file-info/index.ts","./src/file-info/adapters/file-system/index.ts","./src/file-info/adapters/file-system/reader.ts","./src/file-info/adapters/github/reader.ts","./src/generate-summary/frame-sampling.ts","./src/generate-summary/generate-error-stack-summary.ts","./src/generate-summary/generate-failed-step-screenshot-diff-summary.ts","./src/generate-summary/generate-grouped-summary.ts","./src/generate-summary/merge-summary.ts","./src/generate-summary/pick-videos-for-comparison.ts","./src/human-in-the-loop/cli.ts","./src/human-in-the-loop/index.ts","./src/human-in-the-loop/ipc.ts","./src/page/index.ts","./src/prompts/lib/ts-transformer.ts","./src/recorder/env-variables.ts","./src/recorder/index.ts","./src/recorder/request.ts","./src/recorder/temp-files.ts","./src/recorder/upload.ts","./src/recorder/validation.ts","./src/telemetry/index.ts","./src/test-build/index.ts","./src/tools/diagnosis-fetcher.ts","./src/tools/index.ts","./src/tools/list-environments.ts","./src/tools/run-test.ts","./src/tools/test-gen-browser.ts","./src/tools/analyse-video/index.ts","./src/tools/api-client/index.ts","./src/tools/create-pull-request/index.ts","./src/tools/create-pull-request/utils.ts","./src/tools/definitions/analyse-video.ts","./src/tools/definitions/delete-file.ts","./src/tools/definitions/download-build.ts","./src/tools/definitions/grep.ts","./src/tools/definitions/list-tests-and-projects.ts","./src/tools/definitions/merge-conflicts.ts","./src/tools/definitions/publish-markdown-report.ts","./src/tools/definitions/rename-file.ts","./src/tools/definitions/run-test.ts","./src/tools/definitions/safe-bash.ts","./src/tools/definitions/str_replace_editor.ts","./src/tools/definitions/test-gen-browser.ts","./src/tools/definitions/trace-dot-zip.ts","./src/tools/definitions/utils.ts","./src/tools/delete-file/index.ts","./src/tools/download-build/index.ts","./src/tools/executor/base.ts","./src/tools/executor/index.ts","./src/tools/executor/types.ts","./src/tools/executor/utils/checkpoint.ts","./src/tools/executor/utils/git.ts","./src/tools/executor/utils/index.ts","./src/tools/executor/utils/pr-description.ts","./src/tools/fetch-file/index.ts","./src/tools/fetch-file/utils.ts","./src/tools/fetch-session-diff/index.ts","./src/tools/file-operations/create.ts","./src/tools/file-operations/index.ts","./src/tools/file-operations/insert.ts","./src/tools/file-operations/replace.ts","./src/tools/file-operations/shared/helpers.ts","./src/tools/file-operations/view/index.ts","./src/tools/firecrawl-scrape/index.ts","./src/tools/grep/index.ts","./src/tools/grep/types.ts","./src/tools/grep/ripgrep/index.ts","./src/tools/issues-v1/index.ts","./src/tools/issues-v1/list-issues.ts","./src/tools/issues-v1/utils.ts","./src/tools/issues-v2/create-issue.ts","./src/tools/issues-v2/set-issue-description.ts","./src/tools/issues-v2/update-issue.ts","./src/tools/list-tests-and-projects/index.ts","./src/tools/merge-conflicts/index.ts","./src/tools/publish-markdown-report/index.ts","./src/tools/rename-file/index.ts","./src/tools/safe-bash/index.ts","./src/tools/~~slack-message/index.ts","./src/tools/~~test-run-fetcher/index.ts","./src/tools/~~test-run-fetcher/types.ts","./src/tools/~~trace-dot-zip/index.ts","./src/tools/trace-dot-zip/types.ts","./src/tools/trace-dot-zip/utils/console-trace.ts","./src/tools/trace-dot-zip/utils/extract-screenshots.ts","./src/tools/trace-dot-zip/utils/extract-steps.ts","./src/tools/trace-dot-zip/utils/extract-zip.ts","./src/tools/trace-dot-zip/utils/network-trace.ts","./src/tools/triage-summary/index.ts","./src/tools/triage-summary/types.ts","./src/tools/triage-summary/utils.ts","./src/tools/utils/apply-line-limit.ts","./src/tools/utils/validate-schema.ts","./src/tools/utils/validators.ts","./src/types/handlebars.d.ts","./src/types/index.ts","./src/utils/~~env.ts","./src/utils/~~exec.ts","./src/utils/file.ts","./src/utils/hash.ts","./src/utils/html.ts","./src/utils/index.ts","./src/utils/json.ts","./src/utils/model.ts","./src/utils/playwright-test-id.ts","./src/utils/repo-tree.ts","./src/utils/slug.ts","./src/utils/string.ts","./src/utils/stripAnsi.ts","./src/utils/url-validation.ts","./src/utils/dedup/dedup-image.ts","./src/utils/dedup/find-threshold.ts","./src/video-core/index.ts","./src/video-core/model-limits.ts","./src/video-core/storage-manager.ts","./src/video-core/types.ts","./src/video-core/utils.ts"],"version":"5.8.3"}
1	+ {"root":["./src/index.ts","./src/logger.ts","./src/actions/assert.ts","./src/actions/click.ts","./src/actions/done.ts","./src/actions/fill.ts","./src/actions/goto.ts","./src/actions/hover.ts","./src/actions/index.ts","./src/actions/next-task.ts","./src/actions/press.ts","./src/actions/text-content.ts","./src/actions/constants/index.ts","./src/actions/utils/index.ts","./src/agent/cli.ts","./src/agent/index.ts","./src/agent/base/index.ts","./src/agent/browsing/run.ts","./src/agent/browsing/utils.ts","./src/agent/chat/agent-loop.ts","./src/agent/chat/exports.ts","./src/agent/chat/index.ts","./src/agent/chat/models.ts","./src/agent/chat/state.ts","./src/agent/chat/types.ts","./src/agent/chat/utils.ts","./src/agent/chat/prompt/pw-utils-docs.ts","./src/agent/chat/prompt/repo.ts","./src/agent/chat/prompt/skills.ts","./src/agent/chat/prompt/test-case-def.ts","./src/agent/chat/prompt/trace-utils-docs.ts","./src/agent/code-review/index.ts","./src/agent/code-review/types.ts","./src/agent/code-review/xml-parser.ts","./src/agent/code-review/executor/index.ts","./src/agent/fast-triage/index.ts","./src/agent/master/browser-tests/cua.spec.ts","./src/agent/master/browser-tests/fixtures.ts","./src/agent/master/browser-tests/index.spec.ts","./src/agent/triage/index.ts","./src/artifacts/index.ts","./src/artifacts/utils.ts","./src/auth/cli-auth.ts","./src/auth/index.ts","./src/auth/token-store.ts","./src/bin/index.ts","./src/bin/setup.ts","./src/bin/logger/index.ts","./src/bin/utils/context.ts","./src/bin/utils/index.ts","./src/bin/utils/fs/index.ts","./src/bin/utils/platform/web/index.ts","./src/bin/utils/platform/web/test-files/ts-path-import-validate.ts","./src/bin/utils/scenarios/index.ts","./src/constants/index.ts","./src/dashboard/client.ts","./src/dashboard/index.ts","./src/dashboard/tool-response-from-sandbox.ts","./src/dashboard/tool-response.ts","./src/dashboard/totp.ts","./src/dashboard/types.ts","./src/errors/index.ts","./src/file/client.ts","./src/file/server.ts","./src/file-info/index.ts","./src/file-info/adapters/file-system/index.ts","./src/file-info/adapters/file-system/reader.ts","./src/file-info/adapters/github/reader.ts","./src/human-in-the-loop/cli.ts","./src/human-in-the-loop/index.ts","./src/human-in-the-loop/ipc.ts","./src/page/index.ts","./src/prompts/lib/ts-transformer.ts","./src/recorder/env-variables.ts","./src/recorder/index.ts","./src/recorder/request.ts","./src/recorder/temp-files.ts","./src/recorder/upload.ts","./src/recorder/validation.ts","./src/telemetry/index.ts","./src/test-build/index.ts","./src/tools/diagnosis-fetcher.ts","./src/tools/index.ts","./src/tools/list-environments.ts","./src/tools/run-test.ts","./src/tools/test-gen-browser.ts","./src/tools/analyse-video/index.ts","./src/tools/api-client/index.ts","./src/tools/create-pull-request/index.ts","./src/tools/create-pull-request/utils.ts","./src/tools/definitions/analyse-video.ts","./src/tools/definitions/delete-file.ts","./src/tools/definitions/download-build.ts","./src/tools/definitions/grep.ts","./src/tools/definitions/list-tests-and-projects.ts","./src/tools/definitions/merge-conflicts.ts","./src/tools/definitions/publish-markdown-report.ts","./src/tools/definitions/rename-file.ts","./src/tools/definitions/run-test.ts","./src/tools/definitions/safe-bash.ts","./src/tools/definitions/str_replace_editor.ts","./src/tools/definitions/test-gen-browser.ts","./src/tools/definitions/trace-dot-zip.ts","./src/tools/definitions/utils.ts","./src/tools/delete-file/index.ts","./src/tools/download-build/index.ts","./src/tools/executor/base.ts","./src/tools/executor/index.ts","./src/tools/executor/types.ts","./src/tools/executor/utils/checkpoint.ts","./src/tools/executor/utils/git.ts","./src/tools/executor/utils/index.ts","./src/tools/executor/utils/pr-description.ts","./src/tools/fetch-file/index.ts","./src/tools/fetch-file/utils.ts","./src/tools/fetch-session-diff/index.ts","./src/tools/file-operations/create.ts","./src/tools/file-operations/index.ts","./src/tools/file-operations/insert.ts","./src/tools/file-operations/replace.ts","./src/tools/file-operations/shared/helpers.ts","./src/tools/file-operations/view/index.ts","./src/tools/firecrawl-scrape/index.ts","./src/tools/grep/index.ts","./src/tools/grep/types.ts","./src/tools/grep/ripgrep/index.ts","./src/tools/issues-v1/index.ts","./src/tools/issues-v1/list-issues.ts","./src/tools/issues-v1/utils.ts","./src/tools/issues-v2/create-issue.ts","./src/tools/issues-v2/set-issue-description.ts","./src/tools/issues-v2/update-issue.ts","./src/tools/list-tests-and-projects/index.ts","./src/tools/merge-conflicts/index.ts","./src/tools/publish-markdown-report/index.ts","./src/tools/rename-file/index.ts","./src/tools/safe-bash/index.ts","./src/tools/test-run-fetcher/index.ts","./src/tools/trace-dot-zip/index.ts","./src/tools/trace-dot-zip/types.ts","./src/tools/trace-dot-zip/utils/console-trace.ts","./src/tools/trace-dot-zip/utils/extract-screenshots.ts","./src/tools/trace-dot-zip/utils/extract-steps.ts","./src/tools/trace-dot-zip/utils/extract-zip.ts","./src/tools/trace-dot-zip/utils/network-trace.ts","./src/tools/triage-summary/index.ts","./src/tools/triage-summary/types.ts","./src/tools/triage-summary/utils.ts","./src/tools/utils/apply-line-limit.ts","./src/tools/utils/validate-schema.ts","./src/tools/utils/validators.ts","./src/types/handlebars.d.ts","./src/types/index.ts","./src/utils/exec.ts","./src/utils/file.ts","./src/utils/hash.ts","./src/utils/html.ts","./src/utils/index.ts","./src/utils/json.ts","./src/utils/model.ts","./src/utils/playwright-test-id.ts","./src/utils/repo-tree.ts","./src/utils/slug.ts","./src/utils/string.ts","./src/utils/stripAnsi.ts","./src/utils/url-validation.ts","./src/utils/dedup/dedup-image.ts","./src/utils/dedup/find-threshold.ts","./src/video-core/index.ts","./src/video-core/model-limits.ts","./src/video-core/storage-manager.ts","./src/video-core/types.ts","./src/video-core/utils.ts"],"version":"5.8.3"}

package/dist/agent/browsing/index.d.ts DELETED Viewed

@@ -1,15 +0,0 @@
-import { LLM, TraceClient } from "@empiricalrun/llm";
-import { Page } from "playwright";
-import { PlaywrightActions } from "../../actions";
-export type BrowserAgentAction = {
-    action: string;
-    code: string | undefined;
-};
-export declare function executeTaskUsingBrowsingAgent({ action, page, actions, llm, trace, }: {
-    action: string;
-    page: Page;
-    actions: PlaywrightActions;
-    llm?: LLM;
-    trace?: TraceClient;
-}): Promise<BrowserAgentAction | undefined>;
-//# sourceMappingURL=index.d.ts.map

package/dist/agent/browsing/index.d.ts.map DELETED Viewed

@@ -1 +0,0 @@

- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/agent/browsing/index.ts"],"names":[],"mappings":"AAAA,OAAO,EAAiB,GAAG,EAAE,WAAW,EAAE,MAAM,mBAAmB,CAAC;AACpE,OAAO,EAAE,IAAI,EAAE,MAAM,YAAY,CAAC;AAElC,OAAO,EAAE,iBAAiB,EAAE,MAAM,eAAe,CAAC;AAKlD,MAAM,MAAM,kBAAkB,GAAG;IAC/B,MAAM,EAAE,MAAM,CAAC;IACf,IAAI,EAAE,MAAM,GAAG,SAAS,CAAC;CAC1B,CAAC;AAEF,wBAAsB,6BAA6B,CAAC,EAClD,MAAM,EACN,IAAI,EACJ,OAAO,EACP,GAAG,EACH,KAAK,GACN,EAAE;IACD,MAAM,EAAE,MAAM,CAAC;IACf,IAAI,EAAE,IAAI,CAAC;IACX,OAAO,EAAE,iBAAiB,CAAC;IAC3B,GAAG,CAAC,EAAE,GAAG,CAAC;IACV,KAAK,CAAC,EAAE,WAAW,CAAC;CACrB,GAAG,OAAO,CAAC,kBAAkB,GAAG,SAAS,CAAC,CA0D1C"}

package/dist/agent/browsing/index.js DELETED Viewed

@@ -1,60 +0,0 @@
-"use strict";
-Object.defineProperty(exports, "__esModule", { value: true });
-exports.executeTaskUsingBrowsingAgent = executeTaskUsingBrowsingAgent;
-const llm_1 = require("@empiricalrun/llm");
-const constants_1 = require("../../constants");
-const promptTemplate_0 = "{{#section \"system\"}}\nYou are a browser automation agent who is given a task to generate code for navigation and assertion. This task is your\ngoal and you must achieve it.\n\nYou will be provided with already executed actions and basis that you need to pick the next step to achieve the task.\nRemember that the goal must be achieved.\n\nYou will be provided with the web page snapshot in the form of Document Object Model. Based on the goal and available\ntool calls you need to pick the appropriate tool call.\n\nInstructions:\n- Take actions one at a time. Do not try to take multiple actions\n- You can respond with multiple assertions in one shot\n- Do not repeat the same actions again otherwise your response will be marked INVALID\n- Avoid repeating errors which we got while executing the last action\n- Stick to the task provided to you and mark the task done once the task is complete\n- Do not execute any action which is not mentioned in the task\n- Do not repeat actions which are already executed more than twice otherwise your response will be marked INVALID\n- Always refer to \"Executed actions\" before deciding your next action for completion of the task.\n- End the task done if all actions required for task are executed\n{{/section}}\n\n{{#section \"user\"}}\nTask:\n{{task}}\n\nCurrent page snapshot:\n{{pageSnapshot}}\n{{/section}}";
-const html_1 = require("../../utils/html");
-async function executeTaskUsingBrowsingAgent({ action, page, actions, llm, trace, }) {
-    let generatedCodeSteps;
-    const tools = actions.getBrowsingActionSchemas();
-    const browsingAgentSpan = trace?.span({
-        name: `browsing-agent`,
-        input: {
-            action,
-        },
-    });
-    const pageContentSpan = browsingAgentSpan?.span({
-        name: "page-content",
-    });
-    const pageContent = await page.content();
-    pageContentSpan?.end({ output: { pageContent } });
-    const sanitizationSpan = browsingAgentSpan?.span({
-        name: "page-sanitization",
-    });
-    const pageSnapshot = (0, html_1.sanitizeHtml)(pageContent);
-    sanitizationSpan?.end({ output: { pageSnapshot } });
-    const promptSpan = browsingAgentSpan?.span({ name: "page-prompt" });
-    const messages = (0, llm_1.compilePrompt)(promptTemplate_0, { pageSnapshot, task: action });
-    promptSpan?.end({ output: { messages } });
-    llm =
-        llm ||
-            new llm_1.LLM({
-                provider: constants_1.DEFAULT_MODEL_PROVIDER,
-            });
-    const completion = await llm.createChatCompletion({
-        model: "o3-mini-2025-01-31",
-        messages,
-        tools,
-        trace: browsingAgentSpan,
-        modelParameters: {
-            tool_choice: "required",
-        },
-    });
-    const toolCalls = completion?.tool_calls || [];
-    const toolCallsSpan = browsingAgentSpan?.span({ name: "tool-calls" });
-    for (const i in toolCalls) {
-        const toolCall = toolCalls[i];
-        if ("function" in toolCall) {
-            const args = JSON.parse(toolCall.function.arguments);
-            const code = await actions.executeAction(toolCall.function.name, JSON.parse(toolCall.function.arguments), toolCallsSpan);
-            generatedCodeSteps = {
-                // Passing reason as action, in order to pass the correct action that took place to runtime planner
-                action: args.reason,
-                code,
-            };
-        }
-    }
-    toolCallsSpan?.end({ output: { toolCalls, generatedCodeSteps } });
-    return generatedCodeSteps;
-}

package/dist/agent/master/action-tool-calls.d.ts DELETED Viewed

@@ -1,42 +0,0 @@
-export declare enum ActionType {
-    FILL = "fill",
-    PAGE_GOTO = "page_goto",
-    CLICK = "click",
-    PRESS_ACTION = "keyboard_press_on_element",
-    ASSERT_TEXT = "assert_text",
-    HOVER = "hover_element",
-    SCROLL = "scroll",
-    OBSERVATION = "observation",
-    UNKNOWN = "unknown"
-}
-export declare function isValidActionType(value: string): value is ActionType;
-export declare function getActionToolCalls(): {
-    type: string;
-    function: {
-        name: string;
-        description: string;
-        parameters: {
-            type: string;
-            properties: {
-                reason: {
-                    type: string;
-                    description: string;
-                };
-                action: {
-                    type: string;
-                    description: string;
-                };
-                element_description: {
-                    type: string;
-                    description: string;
-                };
-                is_element_visible: {
-                    type: string;
-                    description: string;
-                };
-            };
-            required: string[];
-        };
-    };
-}[];
-//# sourceMappingURL=action-tool-calls.d.ts.map