npm - @hyperbrowser/sdk - Versions diffs - 0.43.0 → 0.44.0 - Mend

@hyperbrowser/sdk 0.43.0 → 0.44.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/README.md CHANGED Viewed

@@ -9,40 +9,125 @@ Hyperbrowser can be installed via npm by running:
 ```bash
 npm install @hyperbrowser/sdk
 ```
+or
+```bash
+yarn add @hyperbrowser/sdk
+```
 ## Usage
+### Playwright
+```typescript
+import { chromium } from "playwright-core";
+import { Hyperbrowser } from "@hyperbrowser/sdk";
+import { config } from "dotenv";
+config();
+const client = new Hyperbrowser({
+  apiKey: process.env.HYPERBROWSER_API_KEY,
+});
+const main = async () => {
+  const session = await client.sessions.create();
+  try {
+    const browser = await chromium.connectOverCDP(session.wsEndpoint);
+    const defaultContext = browser.contexts()[0];
+    const page = await defaultContext.newPage();
+    // Navigate to a website
+    console.log("Navigating to Hacker News...");
+    await page.goto("https://news.ycombinator.com/");
+    const pageTitle = await page.title();
+    console.log("Page 1:", pageTitle);
+    await page.evaluate(() => {
+      console.log("Page 1:", document.title);
+    });
+    await page.goto("https://example.com");
+    console.log("Page 2:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 2:", document.title);
+    });
+    await page.goto("https://apple.com");
+    console.log("Page 3:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 3:", document.title);
+    });
+    await page.goto("https://google.com");
+    console.log("Page 4:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 4:", document.title);
+    });
+  } catch (err) {
+    console.error(`Encountered error: ${err}`);
+  } finally {
+    await client.sessions.stop(session.id);
+  }
+};
+main();
+```
+### Puppeteer
 ```typescript
 import { connect } from "puppeteer-core";
 import { Hyperbrowser } from "@hyperbrowser/sdk";
-import dotenv from "dotenv";
+import { config } from "dotenv";
-dotenv.config();
+config();
 const client = new Hyperbrowser({
   apiKey: process.env.HYPERBROWSER_API_KEY,
 });
-(async () => {
+const main = async () => {
   const session = await client.sessions.create();
-  const browser = await connect({
-    browserWSEndpoint: session.wsEndpoint,
-    defaultViewport: null,
-  });
-  // Create a new page
-  const [page] = await browser.pages();
-  // Navigate to a website
-  console.log("Navigating to Hacker News...");
-  await page.goto("https://news.ycombinator.com/");
-  const pageTitle = await page.title();
-  console.log("Page title:", pageTitle);
-  await page.close();
-  await browser.close();
-  console.log("Session completed!");
-  await client.sessions.stop(session.id);
-})().catch((error) => console.error(error.message));
+  try {
+    const browser = await connect({
+      browserWSEndpoint: session.wsEndpoint,
+      defaultViewport: null,
+    });
+    const [page] = await browser.pages();
+    // Navigate to a website
+    console.log("Navigating to Hacker News...");
+    await page.goto("https://news.ycombinator.com/");
+    const pageTitle = await page.title();
+    console.log("Page 1:", pageTitle);
+    await page.evaluate(() => {
+      console.log("Page 1:", document.title);
+    });
+    await page.goto("https://example.com");
+    console.log("Page 2:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 2:", document.title);
+    });
+    await page.goto("https://apple.com");
+    console.log("Page 3:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 3:", document.title);
+    });
+    await page.goto("https://google.com");
+    console.log("Page 4:", await page.title());
+    await page.evaluate(() => {
+      console.log("Page 4:", document.title);
+    });
+  } catch (err) {
+    console.error(`Encountered error: ${err}`);
+  } finally {
+    await client.sessions.stop(session.id);
+  }
+};
+main();
 ```

package/dist/tools/anthropic.d.ts CHANGED Viewed

@@ -36,3 +36,5 @@ export declare const SCREENSHOT_TOOL_ANTHROPIC: Tool;
 export declare const CRAWL_TOOL_ANTHROPIC: Tool;
 export declare const EXTRACT_TOOL_ANTHROPIC: Tool;
 export declare const BROWSER_USE_TOOL_ANTHROPIC: Tool;
+export declare const CLAUDE_COMPUTER_USE_TOOL_ANTHROPIC: Tool;
+export declare const OPENAI_CUA_TOOL_ANTHROPIC: Tool;

package/dist/tools/anthropic.js CHANGED Viewed

@@ -1,6 +1,6 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.BROWSER_USE_TOOL_ANTHROPIC = exports.EXTRACT_TOOL_ANTHROPIC = exports.CRAWL_TOOL_ANTHROPIC = exports.SCREENSHOT_TOOL_ANTHROPIC = exports.SCRAPE_TOOL_ANTHROPIC = void 0;
+exports.OPENAI_CUA_TOOL_ANTHROPIC = exports.CLAUDE_COMPUTER_USE_TOOL_ANTHROPIC = exports.BROWSER_USE_TOOL_ANTHROPIC = exports.EXTRACT_TOOL_ANTHROPIC = exports.CRAWL_TOOL_ANTHROPIC = exports.SCREENSHOT_TOOL_ANTHROPIC = exports.SCRAPE_TOOL_ANTHROPIC = void 0;
 const schema_1 = require("./schema");
 exports.SCRAPE_TOOL_ANTHROPIC = {
     input_schema: schema_1.SCRAPE_SCHEMA,
@@ -27,3 +27,13 @@ exports.BROWSER_USE_TOOL_ANTHROPIC = {
     name: "browser_use",
     description: "Have an AI agent use a browser to perform a task on the web.",
 };
+exports.CLAUDE_COMPUTER_USE_TOOL_ANTHROPIC = {
+    input_schema: schema_1.CLAUDE_COMPUTER_USE_SCHEMA,
+    name: "claude_computer_use",
+    description: schema_1.CLAUDE_COMPUTER_USE_DESCRIPTION,
+};
+exports.OPENAI_CUA_TOOL_ANTHROPIC = {
+    input_schema: schema_1.OPENAI_CUA_SCHEMA,
+    name: "openai_cua",
+    description: schema_1.OPENAI_CUA_DESCRIPTION,
+};

package/dist/tools/index.d.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 import { HyperbrowserClient } from "../client";
-import { StartScrapeJobParams, StartCrawlJobParams, StartBrowserUseTaskParams } from "../types";
+import { StartScrapeJobParams, StartCrawlJobParams, StartBrowserUseTaskParams, StartCuaTaskParams, StartClaudeComputerUseTaskParams } from "../types";
 import { StartExtractJobParams } from "../types/extract";
 export declare class WebsiteScrapeTool {
     static openaiToolDefinition: import("./openai").ChatCompletionTool;
@@ -26,3 +26,13 @@ export declare class BrowserUseTool {
     static anthropicToolDefinition: import("./anthropic").Tool;
     static runnable(hb: HyperbrowserClient, params: StartBrowserUseTaskParams): Promise<string>;
 }
+export declare class ClaudeComputerUseTool {
+    static openaiToolDefinition: import("./openai").ChatCompletionTool;
+    static anthropicToolDefinition: import("./anthropic").Tool;
+    static runnable(hb: HyperbrowserClient, params: StartClaudeComputerUseTaskParams): Promise<string>;
+}
+export declare class OpenAICuaTool {
+    static openaiToolDefinition: import("./openai").ChatCompletionTool;
+    static anthropicToolDefinition: import("./anthropic").Tool;
+    static runnable(hb: HyperbrowserClient, params: StartCuaTaskParams): Promise<string>;
+}

package/dist/tools/index.js CHANGED Viewed

@@ -1,6 +1,6 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.BrowserUseTool = exports.WebsiteExtractTool = exports.WebsiteCrawlTool = exports.WebsiteScreenshotTool = exports.WebsiteScrapeTool = void 0;
+exports.OpenAICuaTool = exports.ClaudeComputerUseTool = exports.BrowserUseTool = exports.WebsiteExtractTool = exports.WebsiteCrawlTool = exports.WebsiteScreenshotTool = exports.WebsiteScrapeTool = void 0;
 const openai_1 = require("./openai");
 const anthropic_1 = require("./anthropic");
 class WebsiteScrapeTool {
@@ -53,9 +53,27 @@ WebsiteExtractTool.anthropicToolDefinition = anthropic_1.EXTRACT_TOOL_ANTHROPIC;
 class BrowserUseTool {
     static async runnable(hb, params) {
         const resp = await hb.agents.browserUse.startAndWait(params);
-        return resp.data?.finalResult || "";
+        return resp.data?.finalResult || resp.error || "";
     }
 }
 exports.BrowserUseTool = BrowserUseTool;
 BrowserUseTool.openaiToolDefinition = openai_1.BROWSER_USE_TOOL_OPENAI;
 BrowserUseTool.anthropicToolDefinition = anthropic_1.BROWSER_USE_TOOL_ANTHROPIC;
+class ClaudeComputerUseTool {
+    static async runnable(hb, params) {
+        const resp = await hb.agents.claudeComputerUse.startAndWait(params);
+        return resp.data?.finalResult || resp.error || "";
+    }
+}
+exports.ClaudeComputerUseTool = ClaudeComputerUseTool;
+ClaudeComputerUseTool.openaiToolDefinition = openai_1.CLAUDE_COMPUTER_USE_TOOL_OPENAI;
+ClaudeComputerUseTool.anthropicToolDefinition = anthropic_1.CLAUDE_COMPUTER_USE_TOOL_ANTHROPIC;
+class OpenAICuaTool {
+    static async runnable(hb, params) {
+        const resp = await hb.agents.cua.startAndWait(params);
+        return resp.data?.finalResult || resp.error || "";
+    }
+}
+exports.OpenAICuaTool = OpenAICuaTool;
+OpenAICuaTool.openaiToolDefinition = openai_1.OPENAI_CUA_TOOL_OPENAI;
+OpenAICuaTool.anthropicToolDefinition = anthropic_1.OPENAI_CUA_TOOL_ANTHROPIC;

package/dist/tools/openai.d.ts CHANGED Viewed

@@ -41,3 +41,5 @@ export declare const SCREENSHOT_TOOL_OPENAI: ChatCompletionTool;
 export declare const CRAWL_TOOL_OPENAI: ChatCompletionTool;
 export declare const EXTRACT_TOOL_OPENAI: ChatCompletionTool;
 export declare const BROWSER_USE_TOOL_OPENAI: ChatCompletionTool;
+export declare const CLAUDE_COMPUTER_USE_TOOL_OPENAI: ChatCompletionTool;
+export declare const OPENAI_CUA_TOOL_OPENAI: ChatCompletionTool;

package/dist/tools/openai.js CHANGED Viewed

@@ -1,6 +1,6 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.BROWSER_USE_TOOL_OPENAI = exports.EXTRACT_TOOL_OPENAI = exports.CRAWL_TOOL_OPENAI = exports.SCREENSHOT_TOOL_OPENAI = exports.SCRAPE_TOOL_OPENAI = void 0;
+exports.OPENAI_CUA_TOOL_OPENAI = exports.CLAUDE_COMPUTER_USE_TOOL_OPENAI = exports.BROWSER_USE_TOOL_OPENAI = exports.EXTRACT_TOOL_OPENAI = exports.CRAWL_TOOL_OPENAI = exports.SCREENSHOT_TOOL_OPENAI = exports.SCRAPE_TOOL_OPENAI = void 0;
 const schema_1 = require("./schema");
 exports.SCRAPE_TOOL_OPENAI = {
     type: "function",
@@ -47,3 +47,21 @@ exports.BROWSER_USE_TOOL_OPENAI = {
         strict: true,
     },
 };
+exports.CLAUDE_COMPUTER_USE_TOOL_OPENAI = {
+    type: "function",
+    function: {
+        name: "claude_computer_use",
+        description: schema_1.CLAUDE_COMPUTER_USE_DESCRIPTION,
+        parameters: schema_1.CLAUDE_COMPUTER_USE_SCHEMA,
+        strict: true,
+    },
+};
+exports.OPENAI_CUA_TOOL_OPENAI = {
+    type: "function",
+    function: {
+        name: "openai_cua",
+        description: schema_1.OPENAI_CUA_DESCRIPTION,
+        parameters: schema_1.OPENAI_CUA_SCHEMA,
+        strict: true,
+    },
+};

package/dist/tools/schema.d.ts CHANGED Viewed

@@ -1,3 +1,5 @@
+export declare const OPENAI_CUA_DESCRIPTION = "This tool utilizes OpenAI's model to autonomously execute general-purpose browser-based tasks with balanced performance and reliability using a cloud browser. It handles complex interactions effectively with practical reasoning and clear execution.\n\nOptimal for tasks requiring:\n- Reliable, general-purpose browser automation\n- Clear, structured interactions with moderate complexity\n- Efficient handling of common web tasks and workflows\n\nBest suited use cases include:\n- Standard multi-step registration or form submissions\n- Navigating typical web applications requiring multiple interactions\n- Conducting structured web research tasks\n- Extracting data through interactive web processes\n\nProvide a clear step-by-step description, necessary context, and expected outcomes. Returns the completed result or an error message if issues arise.";
+export declare const CLAUDE_COMPUTER_USE_DESCRIPTION = "\nThis tool leverages Anthropic's Claude model to autonomously execute complex browser tasks with sophisticated reasoning capabilities using a cloud browser. It specializes in handling intricate, nuanced, or highly context-sensitive web interactions.\n\nOptimal for tasks requiring:\n- Complex reasoning over multiple web pages\n- Nuanced interpretation and flexible decision-making\n- Human-like interaction with detailed context awareness\n\nBest suited use cases include:\n- Multi-step processes requiring reasoning (e.g., detailed registrations or onboarding)\n- Interacting intelligently with advanced web apps\n- Conducting in-depth research with complex conditions\n- Extracting information from dynamic or interactive websites\n\nProvide detailed task instructions, relevant context, and clearly specify the desired outcome for best results. Returns the completed result or an error message if issues arise.";
 export declare const SCRAPE_SCHEMA: {
     type: "object";
     properties: {
@@ -218,3 +220,49 @@ export declare const BROWSER_USE_SCHEMA: {
     required: string[];
     additionalProperties: boolean;
 };
+export declare const CLAUDE_COMPUTER_USE_SCHEMA: {
+    type: "object";
+    properties: {
+        task: {
+            type: string;
+            description: string;
+        };
+        sessionOptions: {
+            type: string;
+            description: string;
+            properties: {
+                useProxy: {
+                    type: string;
+                    description: string;
+                };
+            };
+            required: string[];
+            additionalProperties: boolean;
+        };
+    };
+    required: string[];
+    additionalProperties: boolean;
+};
+export declare const OPENAI_CUA_SCHEMA: {
+    type: "object";
+    properties: {
+        task: {
+            type: string;
+            description: string;
+        };
+        sessionOptions: {
+            type: string;
+            description: string;
+            properties: {
+                useProxy: {
+                    type: string;
+                    description: string;
+                };
+            };
+            required: string[];
+            additionalProperties: boolean;
+        };
+    };
+    required: string[];
+    additionalProperties: boolean;
+};

package/dist/tools/schema.js CHANGED Viewed

@@ -1,6 +1,35 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.BROWSER_USE_SCHEMA = exports.EXTRACT_SCHEMA = exports.CRAWL_SCHEMA = exports.SCREENSHOT_SCHEMA = exports.SCRAPE_SCHEMA = void 0;
+exports.OPENAI_CUA_SCHEMA = exports.CLAUDE_COMPUTER_USE_SCHEMA = exports.BROWSER_USE_SCHEMA = exports.EXTRACT_SCHEMA = exports.CRAWL_SCHEMA = exports.SCREENSHOT_SCHEMA = exports.SCRAPE_SCHEMA = exports.CLAUDE_COMPUTER_USE_DESCRIPTION = exports.OPENAI_CUA_DESCRIPTION = void 0;
+exports.OPENAI_CUA_DESCRIPTION = `This tool utilizes OpenAI's model to autonomously execute general-purpose browser-based tasks with balanced performance and reliability using a cloud browser. It handles complex interactions effectively with practical reasoning and clear execution.
+Optimal for tasks requiring:
+- Reliable, general-purpose browser automation
+- Clear, structured interactions with moderate complexity
+- Efficient handling of common web tasks and workflows
+Best suited use cases include:
+- Standard multi-step registration or form submissions
+- Navigating typical web applications requiring multiple interactions
+- Conducting structured web research tasks
+- Extracting data through interactive web processes
+Provide a clear step-by-step description, necessary context, and expected outcomes. Returns the completed result or an error message if issues arise.`;
+exports.CLAUDE_COMPUTER_USE_DESCRIPTION = `
+This tool leverages Anthropic's Claude model to autonomously execute complex browser tasks with sophisticated reasoning capabilities using a cloud browser. It specializes in handling intricate, nuanced, or highly context-sensitive web interactions.
+Optimal for tasks requiring:
+- Complex reasoning over multiple web pages
+- Nuanced interpretation and flexible decision-making
+- Human-like interaction with detailed context awareness
+Best suited use cases include:
+- Multi-step processes requiring reasoning (e.g., detailed registrations or onboarding)
+- Interacting intelligently with advanced web apps
+- Conducting in-depth research with complex conditions
+- Extracting information from dynamic or interactive websites
+Provide detailed task instructions, relevant context, and clearly specify the desired outcome for best results. Returns the completed result or an error message if issues arise.`;
 function getScrapeOptions(formats = ["markdown"]) {
     return {
         type: "object",
@@ -37,6 +66,18 @@ function getScrapeOptions(formats = ["markdown"]) {
         additionalProperties: false,
     };
 }
+const SESSION_OPTIONS = {
+    type: "object",
+    description: "The options for the browser session that will be used.",
+    properties: {
+        useProxy: {
+            type: "boolean",
+            description: "Recommended false. Avoid setting this if not explicitly mentioned. Whether to use residential proxies to access the internet. Enabling this helps avoid getting detected as a bot.",
+        },
+    },
+    required: ["useProxy"],
+    additionalProperties: false,
+};
 exports.SCRAPE_SCHEMA = {
     type: "object",
     properties: {
@@ -172,3 +213,27 @@ exports.BROWSER_USE_SCHEMA = {
     required: ["task", "llm", "plannerLlm", "pageExtractionLlm", "keepBrowserOpen"],
     additionalProperties: false,
 };
+exports.CLAUDE_COMPUTER_USE_SCHEMA = {
+    type: "object",
+    properties: {
+        task: {
+            type: "string",
+            description: "The text description of the task to be performed by the agent.",
+        },
+        sessionOptions: SESSION_OPTIONS,
+    },
+    required: ["task", "sessionOptions"],
+    additionalProperties: false,
+};
+exports.OPENAI_CUA_SCHEMA = {
+    type: "object",
+    properties: {
+        task: {
+            type: "string",
+            description: "The text description of the task to be performed by the agent.",
+        },
+        sessionOptions: SESSION_OPTIONS,
+    },
+    required: ["task", "sessionOptions"],
+    additionalProperties: false,
+};

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@hyperbrowser/sdk",
-  "version": "0.43.0",
+  "version": "0.44.0",
   "description": "Node SDK for Hyperbrowser API",
   "author": "",
   "main": "dist/index.js",