npm - brave-real-browser-mcp-server - Versions diffs - 2.15.4 → 2.15.6 - Mend

brave-real-browser-mcp-server 2.15.4 → 2.15.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

package/README.md +21 -40
package/dist/handlers/data-extraction-handlers.js +0 -76
package/dist/handlers/data-quality-handlers.js +0 -141
package/dist/handlers/dynamic-session-handlers.js +0 -75
package/dist/handlers/monitoring-reporting-handlers.js +0 -83
package/dist/handlers/multi-element-handlers.js +0 -67
package/dist/handlers/navigation-handlers.js +59 -0
package/dist/handlers/search-filter-handlers.js +0 -121
package/dist/handlers/visual-tools-handlers.js +0 -52
package/dist/index.js +10 -40
package/dist/tool-definitions.js +1 -150
package/package.json +2 -2
package/scripts/full-verification.ts +98 -0
package/scripts/live-verification.ts +61 -0
package/dist/handlers/data-processing-handlers.js +0 -91
package/dist/handlers/pagination-handlers.js +0 -115

package/scripts/full-verification.ts ADDED Viewed

@@ -0,0 +1,98 @@
+import { handleBrowserInit, handleBrowserClose } from '../src/handlers/browser-handlers.js';
+import { handleNavigate, handleWait } from '../src/handlers/navigation-handlers.js';
+import { handleGetContent, handleFindSelector } from '../src/handlers/content-handlers.js';
+import { handleBreadcrumbNavigator } from '../src/handlers/navigation-handlers.js';
+import {
+    handleBatchElementScraper,
+    handleAttributeHarvester,
+    handleLinkHarvester,
+    handleMediaExtractor
+} from '../src/handlers/multi-element-handlers.js';
+import {
+    handleKeywordSearch,
+    handleRegexPatternMatcher,
+    handleXPathSupport,
+    handleAdvancedCSSSelectors
+} from '../src/handlers/search-filter-handlers.js';
+import { handleRandomScroll } from '../src/handlers/interaction-handlers.js';
+import { handleScrapeMetaTags, handleExtractSchema } from '../src/handlers/data-extraction-handlers.js';
+async function runFullVerification() {
+    console.log('🚀 Starting Comprehensive Tool Verification...');
+    try {
+        await handleBrowserInit({ headless: true });
+        // Testing on one site primarily to save time, then brief check on second
+        const url = 'https://moviesdrive.forum/';
+        console.log(`\n--------------------------------------------------`);
+        console.log(`🔍 Targeting: ${url}`);
+        console.log(`--------------------------------------------------`);
+        // --- Navigation & Basic ---
+        console.log(`\n[1/12] 🟢 Testing Navigation & Wait...`);
+        await handleNavigate({ url });
+        await handleWait({ type: 'timeout', value: '2000' });
+        console.log('   ✅ Navigation complete.');
+        // --- Interaction ---
+        console.log(`\n[2/12] 🟢 Testing Random Scroll...`);
+        await handleRandomScroll({});
+        console.log('   ✅ Scroll complete.');
+        // --- Content Handlers ---
+        console.log(`\n[3/12] 🟢 Testing Find Selector (Text search)...`);
+        const findRes = await handleFindSelector({ text: 'Movie' }); // Assuming "Movie" exists
+        console.log(`   Result: Found ${findRes.content[0].text.length > 50 ? 'matches' : 'no matches'} (Length: ${findRes.content[0].text.length})`);
+        // --- Multi-Element Handlers (The file we kept) ---
+        console.log(`\n[4/12] 🟢 Testing Batch Element Scraper...`);
+        const batchRes = await handleBatchElementScraper({ selector: 'a', maxElements: 3 });
+        console.log(`   Result: ${batchRes.content[0].text.substring(0, 100)}...`);
+        console.log(`\n[5/12] 🟢 Testing Attribute Harvester...`);
+        const attrRes = await handleAttributeHarvester({ selector: 'img', attributes: ['src'], maxElements: 3 });
+        console.log(`   Result: ${attrRes.content[0].text.substring(0, 100)}...`);
+        console.log(`\n[6/12] 🟢 Testing Media Extractor...`); // Might be empty on home page but runs logic
+        const mediaRes = await handleMediaExtractor({ types: ['video', 'iframe'] });
+        console.log(`   Result: ${mediaRes.content[0].text.substring(0, 100)}...`);
+        // --- Search & Filter Handlers (The file we kept) ---
+        console.log(`\n[7/12] 🟢 Testing Keyword Search...`);
+        const keyRes = await handleKeywordSearch({ keywords: ['Bollywood', 'Hollywood'] });
+        console.log(`   Result: ${keyRes.content[0].text.substring(0, 100)}...`);
+        console.log(`\n[8/12] 🟢 Testing Regex Pattern Matcher...`);
+        const regexRes = await handleRegexPatternMatcher({ pattern: 'https?://[^\\s"\']+' });
+        console.log(`   Result: ${regexRes.content[0].text.substring(0, 100)}...`);
+        console.log(`\n[9/12] 🟢 Testing XPath Support...`);
+        const xpathRes = await handleXPathSupport({ xpath: '//body//div' });
+        console.log(`   Result: ${xpathRes.content[0].text.substring(0, 100)}...`);
+        console.log(`\n[10/12] 🟢 Testing Advanced CSS Selectors...`);
+        const cssRes = await handleAdvancedCSSSelectors({ selector: 'div > a', operation: 'query' });
+        console.log(`   Result: ${cssRes.content[0].text.substring(0, 100)}...`);
+        // --- Data Extraction ---
+        console.log(`\n[11/12] 🟢 Testing Schema Extraction...`);
+        const schemaRes = await handleExtractSchema({});
+        console.log(`   Result: ${schemaRes.content[0].text.substring(0, 100)}...`);
+        // --- Pagination (Refactored) ---
+        console.log(`\n[12/12] 🟢 Testing Breadcrumb Navigator...`);
+        const breadRes = await handleBreadcrumbNavigator({});
+        console.log(`   Result: ${breadRes.content[0].text.substring(0, 100)}...`);
+        console.log('\n✅ All primary handler categories verified successfully.');
+    } catch (error) {
+        console.error('\n❌ Verification Failed:', error);
+    } finally {
+        await handleBrowserClose({});
+    }
+}
+runFullVerification();

package/scripts/live-verification.ts ADDED Viewed

@@ -0,0 +1,61 @@
+import { handleBrowserInit, handleBrowserClose } from '../src/handlers/browser-handlers.js';
+import { handleNavigate } from '../src/handlers/navigation-handlers.js';
+import { handleGetContent } from '../src/handlers/content-handlers.js';
+import { handleBreadcrumbNavigator } from '../src/handlers/navigation-handlers.js';
+import { handleLinkHarvester } from '../src/handlers/multi-element-handlers.js';
+import { handleScrapeMetaTags } from '../src/handlers/data-extraction-handlers.js';
+async function runVerification() {
+    console.log('🚀 Starting Verification on Live Sites...');
+    try {
+        // 1. Initialize Browser
+        console.log('\n🔵 Initializing Browser...');
+        await handleBrowserInit({ headless: true });
+        const sites = [
+            'https://moviesdrive.forum/',
+            'https://multimovies.golf/'
+        ];
+        for (const url of sites) {
+            console.log(`\n--------------------------------------------------`);
+            console.log(`🔍 Testing Site: ${url}`);
+            console.log(`--------------------------------------------------`);
+            // 2. Navigate
+            console.log(`\n➡️ Navigating to ${url}...`);
+            await handleNavigate({ url });
+            // 3. Get Content (HTML preview)
+            console.log(`\n📄 Fetching Content (Preview)...`);
+            const contentRes = await handleGetContent({ type: 'text' });
+            console.log(`   Result: ${contentRes.content[0].text.substring(0, 100)}...`);
+            // 4. Test Breadcrumb Navigator (Newly moved)
+            console.log(`\nnav Testing Breadcrumb Navigator...`);
+            const breadcrumbRes = await handleBreadcrumbNavigator({});
+            console.log(`   Result: ${breadcrumbRes.content[0].text.substring(0, 200)}...`);
+            // 5. Test Link Harvester (Existing tool)
+            console.log(`\n🔗 Testing Link Harvester (First 5 links)...`);
+            const linksRes = await handleLinkHarvester({ maxElements: 5 });
+            console.log(`   Result: ${linksRes.content[0].text.substring(0, 200)}...`);
+            // 6. Test Meta Tags (Data extraction)
+            console.log(`\n🏷️ Testing Meta Tag Scraper...`);
+            const metaRes = await handleScrapeMetaTags({});
+            console.log(`   Result: ${metaRes.content[0].text.substring(0, 200)}...`);
+        }
+    } catch (error) {
+        console.error('\n❌ Verification Failed:', error);
+    } finally {
+        // 7. Cleanup
+        console.log('\n🔴 Closing Browser...');
+        await handleBrowserClose({});
+    }
+}
+runVerification();

package/dist/handlers/data-processing-handlers.js DELETED Viewed

@@ -1,91 +0,0 @@
-// Data Processing & Transformation Handlers
-// Text cleaning, validation, formatting utilities
-// @ts-nocheck
-import { withErrorHandling } from '../system-utils.js';
-/**
- * HTML tags intelligently remove करता है
- */
-export async function handleHTMLToText(args) {
-    return await withErrorHandling(async () => {
-        const html = args.html;
-        const preserveLinks = args.preserveLinks || false;
-        const preserveFormatting = args.preserveFormatting || false;
-        // Simple HTML to text conversion (can be enhanced with turndown)
-        let text = html;
-        // Preserve links if requested
-        if (preserveLinks) {
-            text = text.replace(/<a[^>]*href="([^"]*)"[^>]*>(.*?)<\/a>/gi, '$2 ($1)');
-        }
-        // Preserve basic formatting
-        if (preserveFormatting) {
-            text = text.replace(/<br\s*\/?>/gi, '\n');
-            text = text.replace(/<\/p>/gi, '\n\n');
-            text = text.replace(/<li>/gi, '• ');
-            text = text.replace(/<\/li>/gi, '\n');
-        }
-        // Remove all other HTML tags
-        text = text.replace(/<[^>]*>/g, '');
-        // Decode HTML entities
-        text = text
-            .replace(/&nbsp;/g, ' ')
-            .replace(/&amp;/g, '&')
-            .replace(/&lt;/g, '<')
-            .replace(/&gt;/g, '>')
-            .replace(/&quot;/g, '"')
-            .replace(/&#39;/g, "'");
-        // Clean up whitespace
-        text = text.replace(/\n\s*\n/g, '\n\n');
-        text = text.trim();
-        return {
-            content: [
-                {
-                    type: 'text',
-                    text: `✅ HTML converted to text\n\n${text}`,
-                },
-            ],
-        };
-    }, 'Failed to convert HTML to text');
-}
-/**
- * Repeated data filter करता है
- */
-export async function handleDuplicateRemover(args) {
-    return await withErrorHandling(async () => {
-        const data = args.data;
-        const uniqueKey = args.uniqueKey;
-        let unique;
-        if (uniqueKey) {
-            // Remove duplicates based on specific key
-            const seen = new Set();
-            unique = data.filter((item) => {
-                const value = item[uniqueKey];
-                if (seen.has(value)) {
-                    return false;
-                }
-                seen.add(value);
-                return true;
-            });
-        }
-        else {
-            // Remove duplicates based on entire object
-            const seen = new Set();
-            unique = data.filter((item) => {
-                const serialized = JSON.stringify(item);
-                if (seen.has(serialized)) {
-                    return false;
-                }
-                seen.add(serialized);
-                return true;
-            });
-        }
-        const removed = data.length - unique.length;
-        return {
-            content: [
-                {
-                    type: 'text',
-                    text: `✅ Duplicates removed\n\nOriginal: ${data.length} items\nUnique: ${unique.length} items\nRemoved: ${removed} duplicates\n\n${JSON.stringify(unique, null, 2)}`,
-                },
-            ],
-        };
-    }, 'Failed to remove duplicates');
-}

package/dist/handlers/pagination-handlers.js DELETED Viewed

@@ -1,115 +0,0 @@
-// Pagination & Navigation Tools
-// Auto pagination, infinite scroll, multi-page scraping, sitemap parser
-// @ts-nocheck
-import { getCurrentPage } from '../browser-manager.js';
-import { validateWorkflow } from '../workflow-validation.js';
-import { withErrorHandling, sleep } from '../system-utils.js';
-/**
- * Multiple pages से data collect और merge करता है
- */
-export async function handleMultiPageScraper(args) {
-    return await withErrorHandling(async () => {
-        validateWorkflow('multi_page_scraper', {
-            requireBrowser: true,
-            requirePage: true,
-        });
-        const page = getCurrentPage();
-        const urls = args.urls;
-        const dataSelector = args.dataSelector;
-        const waitBetweenPages = args.waitBetweenPages || 1000;
-        const allData = [];
-        for (let i = 0; i < urls.length; i++) {
-            const url = urls[i];
-            try {
-                await page.goto(url, { waitUntil: 'domcontentloaded' });
-                await sleep(waitBetweenPages);
-                const pageData = await page.evaluate((selector) => {
-                    const elements = document.querySelectorAll(selector);
-                    return Array.from(elements).map((el) => ({
-                        text: el.textContent?.trim() || '',
-                        html: el.innerHTML,
-                    }));
-                }, dataSelector);
-                allData.push({
-                    url,
-                    pageIndex: i,
-                    itemCount: pageData.length,
-                    data: pageData,
-                });
-            }
-            catch (error) {
-                allData.push({
-                    url,
-                    pageIndex: i,
-                    error: error instanceof Error ? error.message : String(error),
-                });
-            }
-        }
-        return {
-            content: [
-                {
-                    type: 'text',
-                    text: `✅ Scraped ${urls.length} pages\n\n${JSON.stringify(allData, null, 2)}`,
-                },
-            ],
-        };
-    }, 'Failed to scrape multiple pages');
-}
-/**
- * Site structure follow करके pages scrape करता है
- */
-export async function handleBreadcrumbNavigator(args) {
-    return await withErrorHandling(async () => {
-        validateWorkflow('breadcrumb_navigator', {
-            requireBrowser: true,
-            requirePage: true,
-        });
-        const page = getCurrentPage();
-        const breadcrumbSelector = args.breadcrumbSelector || '.breadcrumb, nav[aria-label="breadcrumb"], .breadcrumbs';
-        const followLinks = args.followLinks || false;
-        const breadcrumbData = await page.evaluate((selector) => {
-            const breadcrumbs = document.querySelectorAll(selector);
-            const results = [];
-            breadcrumbs.forEach((breadcrumb) => {
-                const links = breadcrumb.querySelectorAll('a');
-                const items = [];
-                links.forEach((link, index) => {
-                    items.push({
-                        text: link.textContent?.trim() || '',
-                        href: link.href,
-                        level: index,
-                    });
-                });
-                if (items.length > 0) {
-                    results.push({
-                        path: items.map((i) => i.text).join(' > '),
-                        links: items,
-                    });
-                }
-            });
-            return results;
-        }, breadcrumbSelector);
-        if (breadcrumbData.length === 0) {
-            return {
-                content: [
-                    {
-                        type: 'text',
-                        text: '❌ No breadcrumbs found on page',
-                    },
-                ],
-            };
-        }
-        let additionalData = '';
-        if (followLinks && breadcrumbData[0]?.links) {
-            additionalData = `\n\n📌 To scrape breadcrumb pages, use multi_page_scraper with URLs: ${JSON.stringify(breadcrumbData[0].links.map((l) => l.href))}`;
-        }
-        return {
-            content: [
-                {
-                    type: 'text',
-                    text: `✅ Found ${breadcrumbData.length} breadcrumb trail(s)\n\n${JSON.stringify(breadcrumbData, null, 2)}${additionalData}`,
-                },
-            ],
-        };
-    }, 'Failed to navigate breadcrumbs');
-}