PyPI - browsercontrol - Versions diffs - 0.1.0__py3-none-any.whl - Mend

browsercontrol 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

browsercontrol/__init__.py +8 -0
browsercontrol/__main__.py +19 -0
browsercontrol/browser.py +417 -0
browsercontrol/config.py +61 -0
browsercontrol/server.py +89 -0
browsercontrol/tools/__init__.py +17 -0
browsercontrol/tools/content.py +135 -0
browsercontrol/tools/devtools.py +355 -0
browsercontrol/tools/forms.py +96 -0
browsercontrol/tools/interaction.py +204 -0
browsercontrol/tools/navigation.py +163 -0
browsercontrol/tools/recording.py +221 -0
browsercontrol-0.1.0.dist-info/METADATA +569 -0
browsercontrol-0.1.0.dist-info/RECORD +17 -0
browsercontrol-0.1.0.dist-info/WHEEL +4 -0
browsercontrol-0.1.0.dist-info/entry_points.txt +2 -0
browsercontrol-0.1.0.dist-info/licenses/LICENSE +21 -0

browsercontrol/tools/content.py ADDED Viewed

@@ -0,0 +1,135 @@
+"""Content extraction tools for browser control."""
+import logging
+from fastmcp import FastMCP
+from fastmcp.utilities.types import Image
+from browsercontrol.browser import browser, get_element_map
+logger = logging.getLogger(__name__)
+async def _get_screenshot_with_summary() -> tuple[Image, str]:
+    """Helper to get annotated screenshot with element summary."""
+    screenshot_bytes, elem_map = await browser.screenshot_with_som()
+    image = Image(data=screenshot_bytes, format="png")
+    summary_lines = [f"Found {len(elem_map)} interactive elements:"]
+    for eid, elem in list(elem_map.items())[:30]:
+        desc = elem["text"][:40] if elem["text"] else elem["tag"]
+        summary_lines.append(f"  [{eid}] {elem['tag']} - {desc}")
+    if len(elem_map) > 30:
+        summary_lines.append(f"  ... and {len(elem_map) - 30} more")
+    return image, "\n".join(summary_lines)
+def register_content_tools(mcp: FastMCP) -> None:
+    """Register content extraction tools with the MCP server."""
+    @mcp.tool()
+    async def get_page_content() -> tuple[str, Image]:
+        """Get the page content as markdown text."""
+        try:
+            await browser.ensure_started()
+            from markdownify import markdownify
+            html = await browser.page.content()
+            markdown = markdownify(html, heading_style="ATX", strip=["script", "style"])
+            if len(markdown) > 30000:
+                markdown = markdown[:30000] + "\n\n... [content truncated]"
+            image, summary = await _get_screenshot_with_summary()
+            return f"{markdown}\n\n---\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get page content failed: {e}")
+            raise RuntimeError(f"Get page content failed: {e}")
+    @mcp.tool()
+    async def get_text(element_id: int) -> tuple[str, Image]:
+        """
+        Get the text content of an element by its ID.
+        Args:
+            element_id: The number label of the element
+        """
+        try:
+            await browser.ensure_started()
+            elem_map = get_element_map()
+            if element_id not in elem_map:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Error: Element {element_id} not found.\n\n{summary}", image
+            elem = elem_map[element_id]
+            text = elem.get("text", "")
+            image, summary = await _get_screenshot_with_summary()
+            return f"Element {element_id} text: {text}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get text failed: {e}")
+            raise RuntimeError(f"Get text failed: {e}")
+    @mcp.tool()
+    async def get_page_info() -> tuple[str, Image]:
+        """Get current page URL and title."""
+        try:
+            await browser.ensure_started()
+            url = browser.page.url
+            title = await browser.page.title()
+            image, summary = await _get_screenshot_with_summary()
+            return f"Title: {title}\nURL: {url}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get page info failed: {e}")
+            raise RuntimeError(f"Get page info failed: {e}")
+    @mcp.tool()
+    async def run_javascript(script: str) -> tuple[str, Image]:
+        """
+        Execute JavaScript and return the result.
+        Args:
+            script: JavaScript code to execute
+        """
+        try:
+            await browser.ensure_started()
+            logger.info(f"Executing JavaScript: {script[:50]}...")
+            result = await browser.page.evaluate(script)
+            image, summary = await _get_screenshot_with_summary()
+            return f"Result: {result}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Run JavaScript failed: {e}")
+            raise RuntimeError(f"Run JavaScript failed: {e}")
+    @mcp.tool()
+    async def screenshot(annotate: bool = True, full_page: bool = False) -> tuple[str, Image]:
+        """
+        Take a screenshot of the page.
+        Args:
+            annotate: If True, overlay numbered element markers (default). If False, clean screenshot.
+            full_page: If True, capture the full scrollable page.
+        """
+        try:
+            await browser.ensure_started()
+            if annotate and not full_page:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Screenshot captured (annotated)\n\n{summary}", image
+            else:
+                screenshot_bytes = await browser.page.screenshot(type="png", full_page=full_page)
+                image = Image(data=screenshot_bytes, format="png")
+                return "Screenshot captured (clean)", image
+        except Exception as e:
+            logger.error(f"Screenshot failed: {e}")
+            raise RuntimeError(f"Screenshot failed: {e}")
+    logger.debug("Registered content tools")

browsercontrol/tools/devtools.py ADDED Viewed

@@ -0,0 +1,355 @@
+"""Developer tools for browser control - console, network, errors."""
+import logging
+from fastmcp import FastMCP
+from fastmcp.utilities.types import Image
+from browsercontrol.browser import browser
+logger = logging.getLogger(__name__)
+async def _get_screenshot_with_summary() -> tuple[Image, str]:
+    """Helper to get annotated screenshot with element summary."""
+    screenshot_bytes, elem_map = await browser.screenshot_with_som()
+    image = Image(data=screenshot_bytes, format="png")
+    summary_lines = [f"Found {len(elem_map)} interactive elements:"]
+    for eid, elem in list(elem_map.items())[:30]:
+        desc = elem["text"][:40] if elem["text"] else elem["tag"]
+        summary_lines.append(f"  [{eid}] {elem['tag']} - {desc}")
+    if len(elem_map) > 30:
+        summary_lines.append(f"  ... and {len(elem_map) - 30} more")
+    return image, "\n".join(summary_lines)
+def register_devtools(mcp: FastMCP) -> None:
+    """Register developer tools with the MCP server."""
+    @mcp.tool()
+    async def get_console_logs(clear: bool = False) -> tuple[str, Image]:
+        """
+        Get browser console logs (errors, warnings, info, log messages).
+        Args:
+            clear: If True, clear the captured logs after returning them
+        Returns:
+            Console logs and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            # Get console messages from our captured logs
+            logs = browser.get_console_logs()
+            if not logs:
+                log_text = "No console logs captured."
+            else:
+                log_lines = []
+                for log in logs[-50:]:  # Last 50 logs
+                    level = log.get("level", "log").upper()
+                    text = log.get("text", "")
+                    location = log.get("location", "")
+                    if location:
+                        log_lines.append(f"[{level}] {text} ({location})")
+                    else:
+                        log_lines.append(f"[{level}] {text}")
+                log_text = "\n".join(log_lines)
+            if clear:
+                browser.clear_console_logs()
+            image, summary = await _get_screenshot_with_summary()
+            return f"Console Logs:\n{log_text}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get console logs failed: {e}")
+            raise RuntimeError(f"Get console logs failed: {e}")
+    @mcp.tool()
+    async def get_network_requests(clear: bool = False) -> tuple[str, Image]:
+        """
+        Get captured network requests (API calls, resources, etc.).
+        Args:
+            clear: If True, clear the captured requests after returning them
+        Returns:
+            Network requests and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            requests = browser.get_network_requests()
+            if not requests:
+                request_text = "No network requests captured."
+            else:
+                request_lines = []
+                for req in requests[-30:]:  # Last 30 requests
+                    method = req.get("method", "GET")
+                    url = req.get("url", "")
+                    status = req.get("status", "pending")
+                    duration = req.get("duration", "")
+                    # Truncate long URLs
+                    if len(url) > 80:
+                        url = url[:77] + "..."
+                    line = f"{method} {url} -> {status}"
+                    if duration:
+                        line += f" ({duration}ms)"
+                    request_lines.append(line)
+                request_text = "\n".join(request_lines)
+            if clear:
+                browser.clear_network_requests()
+            image, summary = await _get_screenshot_with_summary()
+            return f"Network Requests:\n{request_text}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get network requests failed: {e}")
+            raise RuntimeError(f"Get network requests failed: {e}")
+    @mcp.tool()
+    async def get_page_errors() -> tuple[str, Image]:
+        """
+        Get JavaScript errors that occurred on the page.
+        Returns:
+            Page errors and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            errors = browser.get_page_errors()
+            if not errors:
+                error_text = "No JavaScript errors detected."
+            else:
+                error_lines = []
+                for err in errors[-20:]:
+                    message = err.get("message", "Unknown error")
+                    stack = err.get("stack", "")
+                    if stack:
+                        # Just first line of stack
+                        stack_first = stack.split("\n")[0] if "\n" in stack else stack
+                        error_lines.append(f" {message}\n   {stack_first}")
+                    else:
+                        error_lines.append(f" {message}")
+                error_text = "\n".join(error_lines)
+            image, summary = await _get_screenshot_with_summary()
+            return f"Page Errors:\n{error_text}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get page errors failed: {e}")
+            raise RuntimeError(f"Get page errors failed: {e}")
+    @mcp.tool()
+    async def run_in_console(code: str) -> tuple[str, Image]:
+        """
+        Execute JavaScript code in the browser console and return the result.
+        Useful for debugging, inspecting variables, or manipulating the page.
+        Args:
+            code: JavaScript code to execute in the console
+        Returns:
+            Result of the code execution and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            logger.info(f"Executing in console: {code[:100]}...")
+            # Wrap in try-catch to capture errors nicely
+            wrapped_code = f"""
+            (() => {{
+                try {{
+                    const result = eval({repr(code)});
+                    if (result === undefined) return 'undefined';
+                    if (result === null) return 'null';
+                    if (typeof result === 'object') {{
+                        try {{
+                            return JSON.stringify(result, null, 2);
+                        }} catch (e) {{
+                            return String(result);
+                        }}
+                    }}
+                    return String(result);
+                }} catch (error) {{
+                    return 'Error: ' + error.message;
+                }}
+            }})()
+            """
+            result = await browser.page.evaluate(wrapped_code)
+            image, summary = await _get_screenshot_with_summary()
+            return f"Console Result:\n{result}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Run in console failed: {e}")
+            try:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Error executing code: {e}\n\n{summary}", image
+            except Exception:
+                raise RuntimeError(f"Run in console failed: {e}")
+    @mcp.tool()
+    async def inspect_element(element_id: int) -> tuple[str, Image]:
+        """
+        Inspect an element to get its computed styles, dimensions, and properties.
+        Args:
+            element_id: The number label of the element to inspect
+        Returns:
+            Element details and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            from browsercontrol.browser import get_element_map
+            elem_map = get_element_map()
+            if element_id not in elem_map:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Error: Element {element_id} not found.\n\n{summary}", image
+            elem = elem_map[element_id]
+            # Get detailed info about the element
+            inspect_code = f"""
+            (() => {{
+                const el = document.elementFromPoint({elem['centerX']}, {elem['centerY']});
+                if (!el) return {{ error: 'Element not found at coordinates' }};
+                const rect = el.getBoundingClientRect();
+                const styles = window.getComputedStyle(el);
+                return {{
+                    tag: el.tagName.toLowerCase(),
+                    id: el.id || null,
+                    classes: Array.from(el.classList),
+                    text: el.innerText?.substring(0, 200) || '',
+                    href: el.href || null,
+                    src: el.src || null,
+                    value: el.value || null,
+                    dimensions: {{
+                        width: Math.round(rect.width),
+                        height: Math.round(rect.height),
+                        top: Math.round(rect.top),
+                        left: Math.round(rect.left)
+                    }},
+                    styles: {{
+                        color: styles.color,
+                        backgroundColor: styles.backgroundColor,
+                        fontSize: styles.fontSize,
+                        fontFamily: styles.fontFamily,
+                        display: styles.display,
+                        position: styles.position,
+                        zIndex: styles.zIndex
+                    }},
+                    attributes: Array.from(el.attributes).map(a => ({{ name: a.name, value: a.value }})).slice(0, 10)
+                }};
+            }})()
+            """
+            info = await browser.page.evaluate(inspect_code)
+            # Format the info nicely
+            lines = [f"Element {element_id} Inspection:"]
+            lines.append(f"  Tag: <{info.get('tag', 'unknown')}>")
+            if info.get('id'):
+                lines.append(f"  ID: #{info['id']}")
+            if info.get('classes'):
+                lines.append(f"  Classes: .{', .'.join(info['classes'])}")
+            if info.get('text'):
+                lines.append(f"  Text: {info['text'][:100]}...")
+            if info.get('href'):
+                lines.append(f"  Href: {info['href']}")
+            dims = info.get('dimensions', {})
+            lines.append(f"  Size: {dims.get('width', '?')}x{dims.get('height', '?')}px")
+            lines.append(f"  Position: ({dims.get('left', '?')}, {dims.get('top', '?')})")
+            styles = info.get('styles', {})
+            lines.append(f"  Styles:")
+            lines.append(f"    color: {styles.get('color', '?')}")
+            lines.append(f"    background: {styles.get('backgroundColor', '?')}")
+            lines.append(f"    font: {styles.get('fontSize', '?')} {styles.get('fontFamily', '?')[:30]}")
+            image, summary = await _get_screenshot_with_summary()
+            return "\n".join(lines) + f"\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Inspect element failed: {e}")
+            raise RuntimeError(f"Inspect element failed: {e}")
+    @mcp.tool()
+    async def get_page_performance() -> tuple[str, Image]:
+        """
+        Get page performance metrics (load time, Core Web Vitals).
+        Returns:
+            Performance metrics and screenshot
+        """
+        try:
+            await browser.ensure_started()
+            perf_code = """
+            (() => {
+                const perf = performance.getEntriesByType('navigation')[0] || {};
+                const paint = performance.getEntriesByType('paint');
+                const fcp = paint.find(p => p.name === 'first-contentful-paint');
+                return {
+                    // Navigation timing
+                    domContentLoaded: Math.round(perf.domContentLoadedEventEnd - perf.startTime),
+                    loadComplete: Math.round(perf.loadEventEnd - perf.startTime),
+                    ttfb: Math.round(perf.responseStart - perf.startTime),
+                    // Paint timing
+                    firstPaint: paint.find(p => p.name === 'first-paint')?.startTime?.toFixed(0) || null,
+                    firstContentfulPaint: fcp?.startTime?.toFixed(0) || null,
+                    // Resource count
+                    resourceCount: performance.getEntriesByType('resource').length,
+                    // Memory (if available)
+                    memory: performance.memory ? {
+                        usedJSHeapSize: Math.round(performance.memory.usedJSHeapSize / 1024 / 1024),
+                        totalJSHeapSize: Math.round(performance.memory.totalJSHeapSize / 1024 / 1024)
+                    } : null
+                };
+            })()
+            """
+            metrics = await browser.page.evaluate(perf_code)
+            lines = ["Page Performance:"]
+            lines.append(f" Time to First Byte: {metrics.get('ttfb', '?')}ms")
+            if metrics.get('firstContentfulPaint'):
+                lines.append(f" First Contentful Paint: {metrics['firstContentfulPaint']}ms")
+            lines.append(f" DOM Content Loaded: {metrics.get('domContentLoaded', '?')}ms")
+            lines.append(f" Load Complete: {metrics.get('loadComplete', '?')}ms")
+            lines.append(f" Resources Loaded: {metrics.get('resourceCount', '?')}")
+            if metrics.get('memory'):
+                mem = metrics['memory']
+                lines.append(f" JS Heap: {mem['usedJSHeapSize']}MB / {mem['totalJSHeapSize']}MB")
+            image, summary = await _get_screenshot_with_summary()
+            return "\n".join(lines) + f"\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Get performance failed: {e}")
+            raise RuntimeError(f"Get performance failed: {e}")
+    logger.debug("Registered developer tools")

browsercontrol/tools/forms.py ADDED Viewed

@@ -0,0 +1,96 @@
+"""Form handling tools for browser control."""
+import logging
+from fastmcp import FastMCP
+from fastmcp.utilities.types import Image
+from browsercontrol.browser import browser, get_element_map
+logger = logging.getLogger(__name__)
+async def _get_screenshot_with_summary() -> tuple[Image, str]:
+    """Helper to get annotated screenshot with element summary."""
+    screenshot_bytes, elem_map = await browser.screenshot_with_som()
+    image = Image(data=screenshot_bytes, format="png")
+    summary_lines = [f"Found {len(elem_map)} interactive elements:"]
+    for eid, elem in list(elem_map.items())[:30]:
+        desc = elem["text"][:40] if elem["text"] else elem["tag"]
+        summary_lines.append(f"  [{eid}] {elem['tag']} - {desc}")
+    if len(elem_map) > 30:
+        summary_lines.append(f"  ... and {len(elem_map) - 30} more")
+    return image, "\n".join(summary_lines)
+def register_form_tools(mcp: FastMCP) -> None:
+    """Register form tools with the MCP server."""
+    @mcp.tool()
+    async def select_option(element_id: int, option: str) -> tuple[str, Image]:
+        """
+        Select an option from a dropdown by element ID.
+        Args:
+            element_id: The number label of the select element
+            option: The value or visible text of the option to select
+        """
+        try:
+            await browser.ensure_started()
+            elem_map = get_element_map()
+            if element_id not in elem_map:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Error: Element {element_id} not found.\n\n{summary}", image
+            elem = elem_map[element_id]
+            logger.info(f"Selecting option '{option}' from element {element_id}")
+            await browser.page.mouse.click(elem["centerX"], elem["centerY"])
+            await browser.page.wait_for_timeout(200)
+            try:
+                await browser.page.get_by_text(option).click(timeout=3000)
+            except Exception:
+                await browser.page.keyboard.type(option)
+                await browser.page.keyboard.press("Enter")
+            image, summary = await _get_screenshot_with_summary()
+            return f"Selected '{option}' from element {element_id}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Select option failed: {e}")
+            raise RuntimeError(f"Select option failed: {e}")
+    @mcp.tool()
+    async def check_checkbox(element_id: int, check: bool = True) -> tuple[str, Image]:
+        """
+        Check or uncheck a checkbox by element ID.
+        Args:
+            element_id: The number label of the checkbox
+            check: True to check, False to uncheck
+        """
+        try:
+            await browser.ensure_started()
+            elem_map = get_element_map()
+            if element_id not in elem_map:
+                image, summary = await _get_screenshot_with_summary()
+                return f"Error: Element {element_id} not found.\n\n{summary}", image
+            elem = elem_map[element_id]
+            logger.info(f"{'Checking' if check else 'Unchecking'} element {element_id}")
+            await browser.page.mouse.click(elem["centerX"], elem["centerY"])
+            image, summary = await _get_screenshot_with_summary()
+            action = "Checked" if check else "Toggled"
+            return f"{action} element {element_id}\n\n{summary}", image
+        except Exception as e:
+            logger.error(f"Check checkbox failed: {e}")
+            raise RuntimeError(f"Check checkbox failed: {e}")
+    logger.debug("Registered form tools")