npm - chrometools-mcp - Versions diffs - 3.1.7 → 3.2.6 - Mend

chrometools-mcp 3.1.7 → 3.2.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +118 -0
package/README.md +183 -117
package/README.ru.md +352 -0
package/chrome-extension.zip +0 -0
package/docs/extension-developer-mode.png +0 -0
package/docs/extension-installed.png +0 -0
package/index.js +93 -90
package/package.json +1 -1
package/pom/apom-tree-converter.js +330 -46
package/publish_output.txt +0 -0
package/server/tool-definitions.js +24 -41
package/server/tool-groups.js +0 -1
package/server/tool-schemas.js +6 -11
package/test-interactivity.html +178 -0

package/README.ru.md ADDED Viewed

@@ -0,0 +1,352 @@
+# chrometools-mcp
+> 🌐 [English version](./README.md)
+**Автоматизация Chrome через естественный язык для ИИ.** Забудьте о борьбе с CSS селекторами, XPath выражениями и хрупкими тестовыми скриптами. Просто скажите своему ИИ-помощнику, что вы хотите сделать на веб-странице, и ChromeTools MCP сделает это.
+## Зачем нужен ChromeTools MCP?
+**Для ИИ-агентов и разработчиков:**
+- 🎯 **54 специализированных инструмента** для автоматизации браузера — от простых кликов до сравнения с Figma
+- 🧠 **APOM (Agent Page Object Model)** — представление страницы для ИИ (~8-10k токенов против 15-25k для скриншотов)
+- 🔄 **Постоянные сессии браузера** — страницы остаются открытыми между командами для итеративной работы
+- ⚡ **Поддержка фреймворков** — автоматически обрабатывает события и состояние React, Vue, Angular
+- 📸 **Визуальное тестирование** — попиксельное сравнение дизайна с макетами Figma
+- 🎬 **Запись сценариев** — записывайте действия в браузере, воспроизводите их или экспортируйте в Playwright/Selenium
+- 🌍 **Кросс-платформенность** — работает на Windows, WSL, Linux и macOS
+**Идеально для:**
+- 🤖 Создания ИИ-агентов, взаимодействующих с веб-приложениями
+- 🧪 Автоматизированного тестирования без написания кода — пусть ИИ генерирует тесты из сценариев
+- 🔍 Парсинга веб-страниц и извлечения данных с помощью естественного языка
+- 🎨 Валидации дизайна — сравнение реализованного UI с дизайном в Figma
+- 🚀 Быстрого прототипирования — тестирование пользовательских сценариев через их описание
+- 📊 Мониторинга и проверки работоспособности веб-приложений
+Перестаньте писать хрупкие скрипты автоматизации. Начните описывать желаемое на обычном языке.
+## Установка
+### Claude Code (CLI)
+Самый простой способ установки для пользователей Claude Code:
+```bash
+claude mcp add chrometools -- npx chrometools-mcp
+```
+Эта команда автоматически настроит MCP сервер в настройках Claude Code.
+### Claude Desktop
+Добавьте в конфигурационный файл Claude Desktop:
+**macOS/Linux:** `~/Library/Application Support/Claude/claude_desktop_config.json`
+**Windows:** `%APPDATA%\Claude\claude_desktop_config.json`
+```json
+{
+  "mcpServers": {
+    "chrometools": {
+      "command": "npx",
+      "args": ["chrometools-mcp"]
+    }
+  }
+}
+```
+### Cursor
+**Шаг 1:** Откройте настройки MCP в Cursor
+- Нажмите на **Settings** (⚙️ иконка или `Cmd + ,` / `Ctrl + ,`)
+- Перейдите в **Cursor Settings** → **MCP**
+**Шаг 2:** Отредактируйте конфигурацию MCP
+- Добавьте `chrometools` в объект `mcpServers`:
+```json
+{
+  "mcpServers": {
+    "chrometools": {
+      "command": "npx",
+      "args": ["chrometools-mcp"]
+    }
+  }
+}
+```
+**Шаг 3:** Сохраните и перезапустите
+- Сохраните конфигурационный файл
+- Перезапустите Cursor для применения изменений
+**Шаг 4:** Протестируйте установку
+- Откройте Cursor Chat
+- Выберите режим **Agent**
+- Попробуйте команду: "Open browser and navigate to google.com"
+### Ручная установка
+Вы также можете запустить напрямую без конфигурации:
+```bash
+npx chrometools-mcp
+```
+### Настройка расширения Chrome
+Расширение Chrome **необходимо** для записи сценариев и других расширенных функций. Следуйте этим шагам для установки:
+**Важно:** ChromeTools открывает Chrome с отдельным профилем пользователя, поэтому вы должны установить расширение **после** первого запуска Chrome через ChromeTools.
+**Шаг 1:** Сначала запустите MCP сервер ChromeTools
+- Убедитесь, что ChromeTools запущен через ваш MCP клиент (Claude Desktop, Cursor и т.д.)
+- Или запустите вручную: `npx chrometools-mcp`
+- Это запустит Chrome с изолированным профилем ChromeTools
+**Шаг 2:** Включите режим разработчика в Chrome
+- Откройте страницу расширений Chrome: `chrome://extensions`
+- Переключите **Режим разработчика** (переключатель в правом верхнем углу)
+![Скриншот режима разработчика](docs/extension-developer-mode.png)
+**Шаг 3:** Скачайте и распакуйте расширение
+**Вариант A - Скачать с GitHub (Рекомендуется):**
+1. Скачайте архив расширения: [chrome-extension.zip](https://github.com/docentovich/chrometools-mcp/raw/main/chrome-extension.zip)
+2. Распакуйте ZIP файл в папку на вашем компьютере
+3. Запомните путь распаковки (он понадобится на следующем шаге)
+**Вариант B - Использовать из node_modules (если знаете путь):**
+- **После npx установки:** `~/.npm/_npx/.../node_modules/chrometools-mcp/extension`
+- **После глобальной установки:** `<npm-global-path>/node_modules/chrometools-mcp/extension`
+- **Из исходников:** `<repo-path>/extension`
+**Шаг 4:** Загрузите расширение
+- Нажмите кнопку **"Загрузить распакованное"** (Load unpacked)
+- Перейдите к распакованной папке расширения (из Шага 3)
+- Выберите папку и нажмите **"Выбрать папку"**
+**Шаг 5:** Проверьте установку
+- Вы должны увидеть расширение "ChromeTools MCP" в списке расширений с:
+  - **Название:** ChromeTools MCP
+  - **Версия:** (текущая версия)
+  - **Описание:** MCP server integration for Chrome automation
+  - **Статус:** Переключатель должен быть ВКЛЮЧЕН (синий)
+- Найдите иконку ChromeTools (CT) в панели инструментов Chrome
+- Расширение готово к использованию для записи сценариев
+![Скриншот установленного расширения](docs/extension-installed.png)
+> **Примечание:** После установки карточка расширения появится на странице `chrome://extensions` вместе с другими установленными расширениями. Расширение должно отображаться как "Включено" с синим переключателем.
+**Шаг 6:** Закрепите расширение (опционально, но рекомендуется)
+- Нажмите на иконку пазла в панели инструментов Chrome
+- Найдите "ChromeTools MCP" в списке
+- Нажмите на иконку булавки, чтобы оставить его видимым в панели инструментов
+**Устранение неполадок:**
+- **Рекомендуется:** Используйте Вариант A (скачивание с GitHub), чтобы избежать поиска в node_modules
+- Если используете Вариант B и не можете найти папку расширения после установки `npx`, выполните `npm list -g chrometools-mcp` чтобы найти путь установки
+- Расширение работает только с экземплярами Chrome, запущенными через ChromeTools
+- Если Chrome закрывается и открывается снова, расширение должно остаться загруженным (режим разработчика сохраняется)
+- Когда ChromeTools впервые открывает Chrome, он автоматически показывает подсказку с путем к расширению в node_modules
+## Оглавление
+- [Установка](#установка)
+  - [Настройка расширения Chrome](#настройка-расширения-chrome)
+- [Возможности оптимизации AI](#возможности-оптимизации-ai)
+- [Записывающее устройство сценариев](#записывающее-устройство-сценариев)
+- [Доступные инструменты](#доступные-инструменты) - **46+ инструментов всего**
+  - [AI-инструменты](#ai-инструменты)
+  - [Основные инструменты](#основные-инструменты)
+  - [Инструменты взаимодействия](#инструменты-взаимодействия)
+  - [Инструменты инспекции](#инструменты-инспекции)
+  - [Продвинутые инструменты](#продвинутые-инструменты)
+  - [Инструменты управления вкладками](#инструменты-управления-вкладками)
+  - [Инструменты записи](#инструменты-записи)
+- [Типичный пример рабочего процесса](#типичный-пример-рабочего-процесса)
+- [Советы по использованию инструментов](#советы-по-использованию-инструментов)
+- [Конфигурация](#конфигурация)
+- [Поддержка нескольких экземпляров](#поддержка-нескольких-экземпляров)
+## Возможности оптимизации AI
+Значительно сокращайте циклы запросов AI-агента с помощью интеллектуального поиска элементов и анализа страниц.
+### Основные возможности:
+- **analyzePage**: Возвращает структурированную модель страницы с уникальными ID элементов
+- **smartFindElement**: Находит элементы по естественному языковому описанию
+- **getElementDetails**: Получает детальную информацию о конкретном элементе
+- **findElementsByText**: Находит элементы по видимому тексту
+## Записывающее устройство сценариев
+Визуальный UI-рекордер для создания переиспользуемых тестовых сценариев с автоматическим обнаружением секретов.
+### Основные возможности:
+- **Визуальный UI** - Используйте расширение Chrome для записи
+- **Умная оптимизация** - Автоматически находит родительские элементы с обработчиками событий
+- **Обнаружение секретов** - Автоматически определяет пароли, токены, ключи API
+- **Умные ожидания** - 2 секунды минимум + обнаружение анимации/сети/изменений DOM
+- **Генерация кода** - Экспортирует в Playwright/Selenium
+## Доступные инструменты
+### AI-инструменты
+- `analyzePage` - Анализирует структуру страницы и возвращает модель с уникальными ID
+- `smartFindElement` - Находит элементы по описанию на естественном языке
+- `getElementDetails` - Получает детальную информацию о элементе
+- `findElementsByText` - Находит элементы по видимому тексту
+- `getAllInteractiveElements` - Получает все интерактивные элементы с селекторами
+### Основные инструменты
+- `ping` - Тестовая команда для проверки связи
+- `openBrowser` - Открывает браузер и переходит по URL
+### Инструменты взаимодействия
+- `click` - Кликает по элементу
+- `type` - Вводит текст в поле ввода
+- `scrollTo` - Прокручивает к элементу
+- `selectOption` - Выбирает опцию из выпадающего списка
+- `selectFromGroup` - Выбирает из радио-кнопок или чекбоксов
+- `drag` - Перетаскивает элемент мышью
+- `scrollHorizontal` - Горизонтальная прокрутка элемента
+### Инструменты инспекции
+- `getComputedCss` - Получает вычисленные CSS стили
+- `getBoxModel` - Получает box model элемента (размеры, отступы)
+- `screenshot` - Делает скриншот элемента или страницы
+- `saveScreenshot` - Сохраняет скриншот в файл
+### Продвинутые инструменты
+- `executeScript` - Выполняет JavaScript код
+- `getConsoleLogs` - Получает логи консоли браузера
+- `listNetworkRequests` - Список сетевых запросов
+- `getNetworkRequest` - Детали конкретного запроса
+- `filterNetworkRequests` - Фильтрует запросы по URL
+- `hover` - Наводит курсор на элемент
+- `setStyles` - Применяет inline CSS стили
+- `setViewport` - Изменяет размер окна браузера
+- `getViewport` - Получает размер окна браузера
+- `navigateTo` - Переходит по новому URL
+### Инструменты управления вкладками
+- `listTabs` - Список всех открытых вкладок
+- `switchTab` - Переключается на другую вкладку
+### Инструменты записи
+- `enableRecorder` - Проверяет статус рекордера
+- `startRecording` - Начинает запись действий
+- `stopRecording` - Останавливает запись
+- `saveScenario` - Сохраняет записанный сценарий
+- `executeScenario` - Выполняет сохраненный сценарий
+- `listScenarios` - Список всех сценариев
+- `searchScenarios` - Поиск сценариев
+- `getScenarioInfo` - Детали сценария
+- `deleteScenario` - Удаляет сценарий
+- `exportScenarioAsCode` - Экспортирует сценарий в код теста
+- `appendScenarioToFile` - Добавляет сценарий в существующий файл
+- `generatePageObject` - Генерирует Page Object Model
+## Типичный пример рабочего процесса
+```javascript
+// 1. Открыть браузер
+openBrowser({ url: "https://example.com" })
+// 2. Проанализировать страницу
+analyzePage()
+// Возвращает структурированную модель с ID элементов
+// 3. Взаимодействовать с элементами по ID
+click({ id: "button_45" })
+type({ id: "input_20", text: "Hello World" })
+// 4. Обновить анализ после изменений
+analyzePage({ refresh: true })
+// 5. Получить детали конкретного элемента
+getElementDetails({ id: "form_15" })
+```
+## Советы по использованию инструментов
+1. **Используйте analyzePage часто** - Это самый эффективный способ понять состояние страницы
+2. **Используйте ID элементов** - После analyzePage используйте ID (например, `button_45`) вместо CSS селекторов
+3. **Обновляйте после изменений** - Используйте `analyzePage({ refresh: true })` после кликов/отправок форм
+4. **Предпочитайте click/type вместо executeScript** - Они правильно работают с фреймворками
+5. **Используйте saveScreenshot для Telegram** - Вместо screenshot для отправки изображений
+## Конфигурация
+### Переменные окружения
+- `DEBUG_MODE=true` - Включает детальное логирование
+- `CHROME_PATH=/path/to/chrome` - Путь к Chrome (опционально)
+### Файл конфигурации
+Создайте `.chrometools.json` в домашней директории:
+```json
+{
+  "debugMode": false,
+  "chromePath": null,
+  "userDataDir": null
+}
+```
+## Поддержка нескольких экземпляров
+Запускайте до 8 MCP серверов одновременно, подключайтесь/отключайтесь в любое время без координации.
+### Возможности:
+- **Динамическое выделение портов** (9223-9227)
+- **Автоматическое обнаружение** расширением Chrome
+- **Широковещательный паттерн** для параллельных AI клиентов
+- **Плавная обработка** неожиданных завершений
+### Использование:
+Просто запустите несколько экземпляров:
+```bash
+# Терминал 1
+npx chrometools-mcp
+# Терминал 2
+npx chrometools-mcp
+# Терминал 3
+npx chrometools-mcp
+```
+Каждый экземпляр автоматически найдет свободный порт и подключится к расширению Chrome.
+## Особенности
+- **Постоянные сессии браузера** - Вкладки остаются открытыми между запросами
+- **Визуальный браузер (GUI режим)** - Видите автоматизацию в реальном времени
+- **Кроссплатформенность** - Работает на Windows/WSL, Linux, macOS
+- **Простая установка** - Одна команда с npx
+- **Интеграция CDP** - Использует Chrome DevTools Protocol для точности
+- **Дружелюбен к AI** - Детальные описания оптимизированы для AI агентов
+## Лицензия
+MIT
+## Поддержка
+Для вопросов и сообщений об ошибках создайте issue на GitHub.

package/chrome-extension.zip ADDED Viewed

Binary file

package/docs/extension-developer-mode.png ADDED Viewed

Binary file

package/docs/extension-installed.png ADDED Viewed

Binary file

package/index.js CHANGED Viewed

@@ -380,7 +380,21 @@ async function executeToolInternal(name, args) {
           throw new Error(`Element not found: ${identifier}`);
         }
-        await element.click();
+        // Try multiple click methods for better reliability
+        try {
+          // Method 1: Puppeteer click (most reliable for most cases)
+          await element.click();
+        } catch (clickError) {
+          // Method 2: Scroll into view and try again
+          try {
+            await element.evaluate(el => el.scrollIntoView({ behavior: 'instant', block: 'center' }));
+            await new Promise(resolve => setTimeout(resolve, 100));
+            await element.click();
+          } catch (scrollClickError) {
+            // Method 3: JavaScript click (works for hidden/overlapping elements)
+            await element.evaluate(el => el.click());
+          }
+        }
         await new Promise(resolve => setTimeout(resolve, validatedArgs.waitAfter || 1500));
         // Generate AI hints after click
@@ -437,7 +451,7 @@ async function executeToolInternal(name, args) {
       // Use input model to handle the element appropriately
       const model = await getInputModel(element, page);
       const options = {
-        delay: validatedArgs.delay || 0,
+        delay: validatedArgs.delay !== undefined ? validatedArgs.delay : 30,
         clearFirst: validatedArgs.clearFirst !== undefined ? validatedArgs.clearFirst : true,
       };
@@ -451,32 +465,6 @@ async function executeToolInternal(name, args) {
       };
     }
-    if (name === "getElement") {
-      const validatedArgs = schemas.GetElementSchema.parse(args);
-      const page = await getLastOpenPage();
-      const client = await page.target().createCDPSession();
-      await client.send('DOM.enable');
-      const { root } = await client.send('DOM.getDocument');
-      const useSelector = (validatedArgs.selector && validatedArgs.selector.trim()) ? validatedArgs.selector : 'body';
-      const { nodeId } = await client.send('DOM.querySelector', {
-        selector: useSelector,
-        nodeId: root.nodeId
-      });
-      if (!nodeId) {
-        throw new Error(`Element not found: ${validatedArgs.selector}`);
-      }
-      const { outerHTML } = await client.send('DOM.getOuterHTML', { nodeId });
-      return {
-        content: [{ type: "text", text: outerHTML }],
-      };
-    }
     if (name === "getComputedCss") {
       const validatedArgs = schemas.GetComputedCssSchema.parse(args);
       const page = await getLastOpenPage();
@@ -2115,16 +2103,21 @@ Start coding now.`;
       };
     }
-    if (name === "getElementByApomId") {
-      const validatedArgs = schemas.GetElementByApomIdSchema.parse(args);
+    if (name === "getElementDetails") {
+      const validatedArgs = schemas.GetElementDetailsSchema.parse(args);
       const page = await getLastOpenPage();
-      const result = await page.evaluate((elementId, selectorResolverCode) => {
+      const result = await page.evaluate((elementId, selectorResolverCode, apomTreeConverterCode, analyzeChildren, includeAll) => {
         // Inject selector resolver if not loaded
         if (typeof resolveSelector === 'undefined') {
           eval(selectorResolverCode);
         }
+        // Inject APOM tree converter utilities
+        if (typeof buildAPOMTree === 'undefined') {
+          eval(apomTreeConverterCode);
+        }
         // Resolve APOM ID to selector
         const resolved = resolveSelector(elementId);
@@ -2146,25 +2139,25 @@ Start coding now.`;
           };
         }
-        // Get element details
+        // Get element details with full information
         const rect = element.getBoundingClientRect();
         const computedStyle = window.getComputedStyle(element);
-        return {
+        const details = {
           success: true,
           id: elementId,
           selector: resolved.selector,
           tag: element.tagName.toLowerCase(),
           type: resolved.metadata.type || 'unknown',
           bounds: {
-            x: rect.x,
-            y: rect.y,
-            width: rect.width,
-            height: rect.height,
-            top: rect.top,
-            right: rect.right,
-            bottom: rect.bottom,
-            left: rect.left
+            x: Math.round(rect.x),
+            y: Math.round(rect.y),
+            width: Math.round(rect.width),
+            height: Math.round(rect.height),
+            top: Math.round(rect.top),
+            right: Math.round(rect.right),
+            bottom: Math.round(rect.bottom),
+            left: Math.round(rect.left)
           },
           position: resolved.metadata.position || null,
           visible: element.offsetWidth > 0 && element.offsetHeight > 0,
@@ -2179,70 +2172,80 @@ Start coding now.`;
             required: element.hasAttribute('required'),
             readonly: element.hasAttribute('readonly'),
             href: element.getAttribute('href') || null,
-            src: element.getAttribute('src') || null
+            src: element.getAttribute('src') || null,
+            type: element.getAttribute('type') || null,
+            role: element.getAttribute('role') || null,
+            ariaLabel: element.getAttribute('aria-label') || null
           },
           computed: {
             display: computedStyle.display,
             visibility: computedStyle.visibility,
             opacity: computedStyle.opacity,
             zIndex: computedStyle.zIndex,
-            position: computedStyle.position
-          }
+            position: computedStyle.position,
+            cursor: computedStyle.cursor,
+            backgroundColor: computedStyle.backgroundColor,
+            color: computedStyle.color,
+            fontSize: computedStyle.fontSize,
+            fontWeight: computedStyle.fontWeight
+          },
+          metadata: resolved.metadata || {}
         };
-      }, validatedArgs.id, selectorResolver);
-      return {
-        content: [{
-          type: 'text',
-          text: JSON.stringify(result, null, 2)
-        }]
-      };
-    }
-    if (name === "getAllInteractiveElements") {
-      const validatedArgs = schemas.GetAllInteractiveElementsSchema.parse(args);
-      const page = await getLastOpenPage();
-      const elements = await page.evaluate((includeHidden, utilsCode) => {
-        eval(utilsCode);
-        const results = [];
-        const selector = 'button, a[href], input, select, textarea, [onclick], [role="button"], [tabindex]:not([tabindex="-1"])';
-        document.querySelectorAll(selector).forEach(el => {
-          const isVisible = el.offsetWidth > 0 && el.offsetHeight > 0;
-          if (!includeHidden && !isVisible) return;
-          const text = (el.textContent || el.value || el.getAttribute('aria-label') || el.placeholder || '').trim();
+        // If analyzeChildren is true, add children tree structure
+        if (analyzeChildren) {
+          try {
+            const pageId = `element_${elementId}_${Date.now()}`;
+            // Call buildAPOMTree with the element as root
+            const fullAnalysis = buildAPOMTree(!includeAll, false);
+            // Find the node in the tree that matches our element ID
+            function findNodeById(node, targetId) {
+              if (!node) return null;
+              if (node.id === targetId) return node;
+              if (node.children) {
+                for (const child of node.children) {
+                  const found = findNodeById(child, targetId);
+                  if (found) return found;
+                }
+              }
+              return null;
+            }
-          results.push({
-            selector: getUniqueSelectorInPage(el),
-            type: el.tagName.toLowerCase(),
-            text: text.substring(0, 100),
-            visible: isVisible,
-            attributes: {
-              id: el.id || null,
-              class: el.className || null,
-              role: el.getAttribute('role') || null,
-              type: el.type || null,
+            const targetNode = findNodeById(fullAnalysis.tree, elementId);
+            if (targetNode) {
+              details.childrenTree = {
+                pageId,
+                url: window.location.href,
+                title: document.title,
+                timestamp: Date.now(),
+                rootElementId: elementId,
+                tree: targetNode,
+                metadata: fullAnalysis.metadata
+              };
+            } else {
+              details.childrenTree = {
+                success: false,
+                error: `Could not find element "${elementId}" in analysis tree`
+              };
             }
-          });
-        });
+          } catch (err) {
+            details.childrenTree = {
+              success: false,
+              error: `Failed to analyze children: ${err.message}`
+            };
+          }
+        }
-        return results;
-      }, validatedArgs.includeHidden || false, elementFinderUtils);
+        return details;
+      }, validatedArgs.id, selectorResolver, apomTreeConverter, validatedArgs.analyzeChildren || false, validatedArgs.includeAll || false);
       return {
         content: [{
           type: 'text',
-          text: JSON.stringify({
-            count: elements.length,
-            elements,
-            hints: {
-              suggestion: 'Use these selectors directly with click, type, or other tools'
-            }
-          }, null, 2)
+          text: JSON.stringify(result, null, 2)
         }]
       };
     }

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "chrometools-mcp",
-  "version": "3.1.7",
+  "version": "3.2.6",
   "description": "MCP (Model Context Protocol) server for Chrome automation using Puppeteer. Persistent browser sessions, UI framework detection (MUI, Ant Design, etc.), Page Object support, visual testing, Figma comparison. Works seamlessly in WSL, Linux, macOS, and Windows.",
   "type": "module",
   "main": "index.js",