npm - @intuned/browser-dev - Versions diffs - 2.2.3-unify-sdks.21 → 2.2.3-unify-sdks.22 - Mend

@intuned/browser-dev 2.2.3-unify-sdks.21 → 2.2.3-unify-sdks.22

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

package/dist/ai/export.d.ts +68 -45
package/dist/ai/extractStructuredDataUsingAi.js +12 -8
package/dist/ai/index.d.ts +68 -45
package/dist/ai/isPageLoaded.js +5 -0
package/dist/helpers/downloadFile.js +2 -2
package/dist/helpers/export.d.ts +108 -112
package/dist/helpers/gotoUrl.js +3 -4
package/dist/helpers/index.d.ts +108 -112
package/dist/helpers/sanitizeHtml.js +5 -4
package/dist/helpers/scrollToLoadContent.js +1 -1
package/dist/helpers/tests/testExtractMarkdown.spec.js +4 -6
package/dist/playwright/export.d.js +5 -0
package/dist/playwright/export.d.ts +229 -0
package/dist/playwright/index.d.ts +229 -0
package/dist/playwright/index.js +18 -0
package/dist/playwright/staticExtractors/extractHelpers.js +170 -0
package/dist/playwright/staticExtractors/getArrayUsingArrayExtractor.js +84 -0
package/dist/playwright/staticExtractors/getObjectUsingObjectExtractor.js +45 -0
package/dist/playwright/staticExtractors/index.js +37 -0
package/dist/playwright/staticExtractors/types.js +26 -0
package/package.json +7 -2

package/dist/ai/export.d.ts CHANGED Viewed

@@ -278,62 +278,85 @@ export declare function extractStructuredData(options: {
   maxRetries?: number;
 }): Promise<any>;
-/**
- * This type defines the supported AI models for data extraction.
- * It includes models from OpenAI, Anthropic, and Google Gemini.
- * The models are used in the extraction strategies to process and analyze the content of web pages or elements.
- * @type SUPPORTED_MODELS
- */
-type SUPPORTED_MODELS =
+type SUPPORTED_CLAUDE_MODELS =
+  | "claude-3-5-haiku-20241022"
+  | "claude-3-5-haiku-latest"
+  | "claude-3-5-sonnet-20240620"
+  | "claude-3-5-sonnet-20241022"
+  | "claude-3-5-sonnet-latest"
+  | "claude-3-7-sonnet-20250219"
+  | "claude-3-7-sonnet-latest"
+  | "claude-3-haiku-20240307"
+  | "claude-4-opus-20250514"
+  | "claude-4-sonnet-20250514"
+  | "claude-opus-4-1"
   | "claude-opus-4-1-20250805"
   | "claude-opus-4-20250514"
-  | "claude-sonnet-4-20250514"
-  | "claude-3-7-sonnet-20250219"
-  | "claude-3-5-sonnet-20240620"
-  | "claude-3-5-haiku-latest"
-  | "gpt-5"
-  | "gpt-5-mini"
-  | "gpt-5-nano"
-  | "gpt-5-chat"
-  | "gpt-5-chat-latest"
-  | "gpt-5-2025-08-07"
-  | "gpt-5-mini-2025-08-07"
-  | "gpt-5-nano-2025-08-07"
-  | "gpt-4.1"
-  | "gpt-4.1-mini"
-  | "gpt-4.1-nano"
-  | "o4-mini"
-  | "o3-mini"
-  | "o3"
-  | "o1-mini"
-  | "o1-preview"
-  | "gpt-4o-mini"
-  | "gpt-4o-mini-2024-07-18"
-  | "gpt-4o"
-  | "gpt-4o-2024-08-06"
-  | "gpt-4o-2024-05-13"
-  | "gpt-4o-2024-05-13"
-  | "gpt-4-turbo"
-  | "gpt-4-turbo-preview"
-  | "gpt-4-0125-preview"
-  | "gpt-4-1106-preview"
-  | "gpt-3.5-turbo-1106"
+  | "claude-sonnet-4-20250514";
+type SUPPORTED_OPENAI_MODELS =
   | "gpt-3.5-turbo"
+  | "gpt-3.5-turbo-0125"
   | "gpt-3.5-turbo-0301"
   | "gpt-3.5-turbo-0613"
+  | "gpt-3.5-turbo-1106"
   | "gpt-3.5-turbo-16k"
   | "gpt-3.5-turbo-16k-0613"
+  | "gpt-3.5-turbo-instruct"
+  | "gpt-3.5-turbo-instruct-0914"
   | "gpt-4"
   | "gpt-4-0314"
   | "gpt-4-0613"
   | "gpt-4-32k"
   | "gpt-4-32k-0314"
   | "gpt-4-32k-0613"
-  | "gemini-pro"
-  | "gemini-1.5-pro-latest"
-  | "gemini-2.0-flash"
-  | "gemini-2.0-flash-exp"
-  | "gemini-2.0-flash-lite-preview-02-05";
+  | "gpt-4-turbo"
+  | "gpt-4-turbo-2024-04-09"
+  | "gpt-4.1"
+  | "gpt-4.1-2025-04-14"
+  | "gpt-4.1-mini"
+  | "gpt-4.1-mini-2025-04-14"
+  | "gpt-4.1-nano"
+  | "gpt-4.1-nano-2025-04-14"
+  | "gpt-4o"
+  | "gpt-4o-2024-05-13"
+  | "gpt-4o-2024-08-06"
+  | "gpt-4o-2024-11-20"
+  | "gpt-4o-mini"
+  | "gpt-4o-mini-2024-07-18"
+  | "gpt-5"
+  | "gpt-5-2025-08-07"
+  | "gpt-5-chat"
+  | "gpt-5-chat-latest"
+  | "gpt-5-mini"
+  | "gpt-5-mini-2025-08-07"
+  | "gpt-5-nano"
+  | "gpt-5-nano-2025-08-07"
+  | "o1"
+  | "o1-2024-12-17"
+  | "o1-mini"
+  | "o1-mini-2024-09-12"
+  | "o1-pro"
+  | "o1-pro-2025-03-19"
+  | "o3"
+  | "o3-2025-04-16"
+  | "o3-deep-research"
+  | "o3-deep-research-2025-06-26"
+  | "o3-mini"
+  | "o3-mini-2025-01-31"
+  | "o3-pro"
+  | "o3-pro-2025-06-10"
+  | "o4-mini"
+  | "o4-mini-2025-04-16"
+  | "o4-mini-deep-research"
+  | "o4-mini-deep-research-2025-06-26";
+/**
+ * This type defines the supported AI models for data extraction.
+ * It includes models from OpenAI, Anthropic, and Google Gemini.
+ * The models are used in the extraction strategies to process and analyze the content of web pages or elements.
+ * @type SUPPORTED_MODELS
+ */
+type SUPPORTED_MODELS = SUPPORTED_CLAUDE_MODELS | SUPPORTED_OPENAI_MODELS;
 /**
  * Represents a JSON Schema definition for validating data structures.
@@ -592,7 +615,7 @@ export interface HtmlStrategy {
  *
  * @param {Page} page - The Playwright page to check
  * @param {Object} [options] - Optional configuration object
- * @param {ModelType} [options.model="gpt-4o-2024-08-06"] - [ModelType](../type-aliases/modelType) to use for the AI Check. default gpt-4o-2024-08-06
+ * @param {SUPPORTED_MODELS} [options.model="gpt-4o-2024-08-06"] - [SUPPORTED_MODELS](../type-aliases/SUPPORTED_MODELS) to use for the AI Check. default gpt-4o-2024-08-06
  * @param {number} [options.timeoutInMs=10000] - Screenshot timeout in milliseconds
  * @param {string} [options.apiKey] - Optional API key for the AI service
  * @returns {Promise.<{status: LoadingStatus, reason: (string|null|undefined), cost: (number|undefined)}>}
@@ -636,7 +659,7 @@ export declare function isPageLoaded(
   page: Page,
   options?: {
     timeoutInMs?: number;
-    model?: ModelType;
+    model?: SUPPORTED_MODELS;
     apiKey?: string;
   }
 ): Promise<{

package/dist/ai/extractStructuredDataUsingAi.js CHANGED Viewed

@@ -19,7 +19,7 @@ var _ai = require("ai");
 var _loadRuntime = require("../common/loadRuntime");
 function _interopRequireWildcard(e, t) { if ("function" == typeof WeakMap) var r = new WeakMap(), n = new WeakMap(); return (_interopRequireWildcard = function (e, t) { if (!t && e && e.__esModule) return e; var o, i, f = { __proto__: null, default: e }; if (null === e || "object" != typeof e && "function" != typeof e) return f; if (o = t ? n : r) { if (o.has(e)) return o.get(e); o.set(e, f); } for (const t in e) "default" !== t && {}.hasOwnProperty.call(e, t) && ((i = (o = Object.defineProperty) && Object.getOwnPropertyDescriptor(e, t)) && (i.get || i.set) ? o(f, t, i) : f[t] = e[t]); return f; })(e, t); }
 async function extractStructuredDataUsingAi(page, input) {
-  var _getExecutionContext, _getExecutionContext2, _getExecutionContext3;
+  var _getExecutionContext, _getExecutionContext2, _getExecutionContext3, _result$usage6;
   const {
     apiKey,
     enableDomMatching,
@@ -30,7 +30,7 @@ async function extractStructuredDataUsingAi(page, input) {
     images,
     maxRetries = 3
   } = input;
-  let accumulatedCost = 0;
+  let accumulatedTokens = 0;
   const getExecutionContext = await (0, _loadRuntime.loadRuntime)();
   const toolName = `extract_data`;
   const headers = (0, _getAiTrackingHeaders.getAiTrackingHeaders)({
@@ -54,7 +54,7 @@ async function extractStructuredDataUsingAi(page, input) {
   let result;
   while (currentRetry < maxRetries) {
     try {
-      var _result$usage;
+      var _result$usage, _result$usage4;
       result = await (0, _ai.generateText)({
         model: gatewayModel,
         messages: messagesHistory,
@@ -63,8 +63,7 @@ async function extractStructuredDataUsingAi(page, input) {
         maxRetries,
         headers
       });
-      accumulatedCost += ((_result$usage = result.usage) === null || _result$usage === void 0 ? void 0 : _result$usage.totalTokens) ?? 0;
-      _Logger.logger.info(`AI extraction cost:  ${accumulatedCost}`);
+      accumulatedTokens += ((_result$usage = result.usage) === null || _result$usage === void 0 ? void 0 : _result$usage.totalTokens) ?? 0;
       const toolCall = result.toolCalls[0] ?? null;
       let extractedData = toolCall.input;
       const isArray = jsonSchema.type === "array";
@@ -95,9 +94,10 @@ async function extractStructuredDataUsingAi(page, input) {
         continue;
       }
       if (!enableDomMatching) {
+        var _result$usage2;
+        _Logger.logger.info(`Total LLM Tokens: ${(_result$usage2 = result.usage) === null || _result$usage2 === void 0 ? void 0 : _result$usage2.totalTokens}`);
         return (0, _neverthrow.ok)({
           result: extractedData,
-          usage: accumulatedCost,
           xpathMapping: {}
         });
       }
@@ -105,9 +105,10 @@ async function extractStructuredDataUsingAi(page, input) {
         dataStructure: extractedData
       });
       if (!stringsToMatch || stringsToMatch.length === 0) {
+        var _result$usage3;
+        _Logger.logger.info(`Total LLM Tokens: ${(_result$usage3 = result.usage) === null || _result$usage3 === void 0 ? void 0 : _result$usage3.totalTokens}`);
         return (0, _neverthrow.ok)({
           result: [],
-          usage: accumulatedCost,
           xpathMapping: {}
         });
       }
@@ -123,18 +124,21 @@ async function extractStructuredDataUsingAi(page, input) {
         stringReplacements[key] = (value === null || value === void 0 ? void 0 : value.matchText) || null;
       });
       const matchesData = await (0, _validateSchema.recursivelyReplaceStrings)(extractedData, stringReplacements);
+      _Logger.logger.info(`Total LLM Tokens: ${(_result$usage4 = result.usage) === null || _result$usage4 === void 0 ? void 0 : _result$usage4.totalTokens}`);
       return (0, _neverthrow.ok)({
         result: matchesData,
-        usage: accumulatedCost,
         xpathMapping
       });
     } catch (error) {
+      var _result$usage5;
       _Logger.logger.error("Error during AI extraction", {
         error,
         model
       });
+      _Logger.logger.info(`Total LLM Tokens: ${(_result$usage5 = result.usage) === null || _result$usage5 === void 0 ? void 0 : _result$usage5.totalTokens}`);
       return (0, _neverthrow.err)(Errors.invalidExtractionResult(error instanceof Error ? error.message : "Unknown error during extraction"));
     }
   }
+  _Logger.logger.info(`Total LLM Tokens: ${(_result$usage6 = result.usage) === null || _result$usage6 === void 0 ? void 0 : _result$usage6.totalTokens}`);
   return (0, _neverthrow.err)(Errors.maxRetriesExceeded(`Max retries of ${maxRetries} exceeded for extraction`));
 }

package/dist/ai/index.d.ts CHANGED Viewed

@@ -278,62 +278,85 @@ export declare function extractStructuredData(options: {
   maxRetries?: number;
 }): Promise<any>;
-/**
- * This type defines the supported AI models for data extraction.
- * It includes models from OpenAI, Anthropic, and Google Gemini.
- * The models are used in the extraction strategies to process and analyze the content of web pages or elements.
- * @type SUPPORTED_MODELS
- */
-type SUPPORTED_MODELS =
+type SUPPORTED_CLAUDE_MODELS =
+  | "claude-3-5-haiku-20241022"
+  | "claude-3-5-haiku-latest"
+  | "claude-3-5-sonnet-20240620"
+  | "claude-3-5-sonnet-20241022"
+  | "claude-3-5-sonnet-latest"
+  | "claude-3-7-sonnet-20250219"
+  | "claude-3-7-sonnet-latest"
+  | "claude-3-haiku-20240307"
+  | "claude-4-opus-20250514"
+  | "claude-4-sonnet-20250514"
+  | "claude-opus-4-1"
   | "claude-opus-4-1-20250805"
   | "claude-opus-4-20250514"
-  | "claude-sonnet-4-20250514"
-  | "claude-3-7-sonnet-20250219"
-  | "claude-3-5-sonnet-20240620"
-  | "claude-3-5-haiku-latest"
-  | "gpt-5"
-  | "gpt-5-mini"
-  | "gpt-5-nano"
-  | "gpt-5-chat"
-  | "gpt-5-chat-latest"
-  | "gpt-5-2025-08-07"
-  | "gpt-5-mini-2025-08-07"
-  | "gpt-5-nano-2025-08-07"
-  | "gpt-4.1"
-  | "gpt-4.1-mini"
-  | "gpt-4.1-nano"
-  | "o4-mini"
-  | "o3-mini"
-  | "o3"
-  | "o1-mini"
-  | "o1-preview"
-  | "gpt-4o-mini"
-  | "gpt-4o-mini-2024-07-18"
-  | "gpt-4o"
-  | "gpt-4o-2024-08-06"
-  | "gpt-4o-2024-05-13"
-  | "gpt-4o-2024-05-13"
-  | "gpt-4-turbo"
-  | "gpt-4-turbo-preview"
-  | "gpt-4-0125-preview"
-  | "gpt-4-1106-preview"
-  | "gpt-3.5-turbo-1106"
+  | "claude-sonnet-4-20250514";
+type SUPPORTED_OPENAI_MODELS =
   | "gpt-3.5-turbo"
+  | "gpt-3.5-turbo-0125"
   | "gpt-3.5-turbo-0301"
   | "gpt-3.5-turbo-0613"
+  | "gpt-3.5-turbo-1106"
   | "gpt-3.5-turbo-16k"
   | "gpt-3.5-turbo-16k-0613"
+  | "gpt-3.5-turbo-instruct"
+  | "gpt-3.5-turbo-instruct-0914"
   | "gpt-4"
   | "gpt-4-0314"
   | "gpt-4-0613"
   | "gpt-4-32k"
   | "gpt-4-32k-0314"
   | "gpt-4-32k-0613"
-  | "gemini-pro"
-  | "gemini-1.5-pro-latest"
-  | "gemini-2.0-flash"
-  | "gemini-2.0-flash-exp"
-  | "gemini-2.0-flash-lite-preview-02-05";
+  | "gpt-4-turbo"
+  | "gpt-4-turbo-2024-04-09"
+  | "gpt-4.1"
+  | "gpt-4.1-2025-04-14"
+  | "gpt-4.1-mini"
+  | "gpt-4.1-mini-2025-04-14"
+  | "gpt-4.1-nano"
+  | "gpt-4.1-nano-2025-04-14"
+  | "gpt-4o"
+  | "gpt-4o-2024-05-13"
+  | "gpt-4o-2024-08-06"
+  | "gpt-4o-2024-11-20"
+  | "gpt-4o-mini"
+  | "gpt-4o-mini-2024-07-18"
+  | "gpt-5"
+  | "gpt-5-2025-08-07"
+  | "gpt-5-chat"
+  | "gpt-5-chat-latest"
+  | "gpt-5-mini"
+  | "gpt-5-mini-2025-08-07"
+  | "gpt-5-nano"
+  | "gpt-5-nano-2025-08-07"
+  | "o1"
+  | "o1-2024-12-17"
+  | "o1-mini"
+  | "o1-mini-2024-09-12"
+  | "o1-pro"
+  | "o1-pro-2025-03-19"
+  | "o3"
+  | "o3-2025-04-16"
+  | "o3-deep-research"
+  | "o3-deep-research-2025-06-26"
+  | "o3-mini"
+  | "o3-mini-2025-01-31"
+  | "o3-pro"
+  | "o3-pro-2025-06-10"
+  | "o4-mini"
+  | "o4-mini-2025-04-16"
+  | "o4-mini-deep-research"
+  | "o4-mini-deep-research-2025-06-26";
+/**
+ * This type defines the supported AI models for data extraction.
+ * It includes models from OpenAI, Anthropic, and Google Gemini.
+ * The models are used in the extraction strategies to process and analyze the content of web pages or elements.
+ * @type SUPPORTED_MODELS
+ */
+type SUPPORTED_MODELS = SUPPORTED_CLAUDE_MODELS | SUPPORTED_OPENAI_MODELS;
 /**
  * Represents a JSON Schema definition for validating data structures.
@@ -592,7 +615,7 @@ export interface HtmlStrategy {
  *
  * @param {Page} page - The Playwright page to check
  * @param {Object} [options] - Optional configuration object
- * @param {ModelType} [options.model="gpt-4o-2024-08-06"] - [ModelType](../type-aliases/modelType) to use for the AI Check. default gpt-4o-2024-08-06
+ * @param {SUPPORTED_MODELS} [options.model="gpt-4o-2024-08-06"] - [SUPPORTED_MODELS](../type-aliases/SUPPORTED_MODELS) to use for the AI Check. default gpt-4o-2024-08-06
  * @param {number} [options.timeoutInMs=10000] - Screenshot timeout in milliseconds
  * @param {string} [options.apiKey] - Optional API key for the AI service
  * @returns {Promise.<{status: LoadingStatus, reason: (string|null|undefined), cost: (number|undefined)}>}
@@ -636,7 +659,7 @@ export declare function isPageLoaded(
   page: Page,
   options?: {
     timeoutInMs?: number;
-    model?: ModelType;
+    model?: SUPPORTED_MODELS;
     apiKey?: string;
   }
 ): Promise<{

package/dist/ai/isPageLoaded.js CHANGED Viewed

@@ -4,6 +4,7 @@ Object.defineProperty(exports, "__esModule", {
   value: true
 });
 exports.isPageLoaded = void 0;
+var _Logger = require("../common/Logger");
 var _utils = require("../helpers/utils");
 var _ai = require("ai");
 const isPageLoaded = async (page, options) => {
@@ -39,6 +40,7 @@ Some good cues for determining if a page is loading:
     }]
   });
   let llmResult = response.text.trim();
+  _Logger.logger.info(`Total LLM Tokens: ${response.usage.totalTokens}`);
   if (!llmResult) {
     throw new Error("LLM response is empty");
   }
@@ -50,10 +52,13 @@ Some good cues for determining if a page is loading:
   const reason = lines.length > 1 ? lines[1] : null;
   let result;
   if (isTrue) {
+    _Logger.logger.info(`Page is loaded.`);
     result = true;
   } else if (isFalse) {
+    _Logger.logger.info(`Page is not loaded.`);
     result = false;
   } else if (isDontKnow) {
+    _Logger.logger.info(`Page loading status is unknown.`);
     result = "Dont know";
   } else {
     throw new Error("LLM result is not valid");

package/dist/helpers/downloadFile.js CHANGED Viewed

@@ -32,12 +32,12 @@ async function getAbsoluteUrl(page, url) {
   });
   return absUrl;
 }
-const downloadFile = async options => {
+const downloadFile = async input => {
   const {
     page,
     trigger,
     timeoutInMs
-  } = options;
+  } = input;
   let pageToDownloadFrom = page;
   let shouldClosePage = false;
   let downloadPromise;