PyPI - fleet-python - Versions diffs - 0.2.66b2__py3-none-any.whl → 0.2.105__py3-none-any.whl - Mend

fleet-python 0.2.66b2py3-none-any.whl → 0.2.105py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (70) hide show

examples/export_tasks.py +16 -5
examples/export_tasks_filtered.py +245 -0
examples/fetch_tasks.py +230 -0
examples/import_tasks.py +140 -8
examples/iterate_verifiers.py +725 -0
fleet/__init__.py +128 -5
fleet/_async/__init__.py +27 -3
fleet/_async/base.py +24 -9
fleet/_async/client.py +938 -41
fleet/_async/env/client.py +60 -3
fleet/_async/instance/client.py +52 -7
fleet/_async/models.py +15 -0
fleet/_async/resources/api.py +200 -0
fleet/_async/resources/sqlite.py +1801 -46
fleet/_async/tasks.py +122 -25
fleet/_async/verifiers/bundler.py +22 -21
fleet/_async/verifiers/verifier.py +25 -19
fleet/agent/__init__.py +32 -0
fleet/agent/gemini_cua/Dockerfile +45 -0
fleet/agent/gemini_cua/__init__.py +10 -0
fleet/agent/gemini_cua/agent.py +759 -0
fleet/agent/gemini_cua/mcp/main.py +108 -0
fleet/agent/gemini_cua/mcp_server/__init__.py +5 -0
fleet/agent/gemini_cua/mcp_server/main.py +105 -0
fleet/agent/gemini_cua/mcp_server/tools.py +178 -0
fleet/agent/gemini_cua/requirements.txt +5 -0
fleet/agent/gemini_cua/start.sh +30 -0
fleet/agent/orchestrator.py +854 -0
fleet/agent/types.py +49 -0
fleet/agent/utils.py +34 -0
fleet/base.py +34 -9
fleet/cli.py +1061 -0
fleet/client.py +1060 -48
fleet/config.py +1 -1
fleet/env/__init__.py +16 -0
fleet/env/client.py +60 -3
fleet/eval/__init__.py +15 -0
fleet/eval/uploader.py +231 -0
fleet/exceptions.py +8 -0
fleet/instance/client.py +53 -8
fleet/instance/models.py +1 -0
fleet/models.py +303 -0
fleet/proxy/__init__.py +25 -0
fleet/proxy/proxy.py +453 -0
fleet/proxy/whitelist.py +244 -0
fleet/resources/api.py +200 -0
fleet/resources/sqlite.py +1845 -46
fleet/tasks.py +113 -20
fleet/utils/__init__.py +7 -0
fleet/utils/http_logging.py +178 -0
fleet/utils/logging.py +13 -0
fleet/utils/playwright.py +440 -0
fleet/verifiers/bundler.py +22 -21
fleet/verifiers/db.py +985 -1
fleet/verifiers/decorator.py +1 -1
fleet/verifiers/verifier.py +25 -19
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/METADATA +28 -1
fleet_python-0.2.105.dist-info/RECORD +115 -0
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/WHEEL +1 -1
fleet_python-0.2.105.dist-info/entry_points.txt +2 -0
tests/test_app_method.py +85 -0
tests/test_expect_exactly.py +4148 -0
tests/test_expect_only.py +2593 -0
tests/test_instance_dispatch.py +607 -0
tests/test_sqlite_resource_dual_mode.py +263 -0
tests/test_sqlite_shared_memory_behavior.py +117 -0
fleet_python-0.2.66b2.dist-info/RECORD +0 -81
tests/test_verifier_security.py +0 -427
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/licenses/LICENSE +0 -0
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/top_level.txt +0 -0

fleet/agent/gemini_cua/mcp/main.py ADDED Viewed

@@ -0,0 +1,108 @@
+#!/usr/bin/env python3
+"""
+CUA Server - Computer Use Agent MCP Server
+MCP server with playwright browser control using FastMCP's streamable-http transport.
+Env vars:
+    FLEET_ENV_URL: URL to navigate to
+    PORT: Server port (default: 8765)
+    SCREEN_WIDTH/HEIGHT: Browser size
+    HEADLESS: "true" or "false" (default: true)
+"""
+import logging
+import os
+from contextlib import asynccontextmanager
+from typing import Optional
+from mcp.server.fastmcp import FastMCP
+from starlette.requests import Request
+from starlette.responses import JSONResponse
+from fleet.utils.playwright import PlaywrightComputer
+# Support both module and standalone execution
+try:
+    from .tools import register_tools
+except ImportError:
+    from tools import register_tools
+logging.basicConfig(level=logging.INFO, format='%(asctime)s %(levelname)s %(message)s')
+logger = logging.getLogger(__name__)
+# =============================================================================
+# Setup
+# =============================================================================
+computer: Optional[PlaywrightComputer] = None
+PORT = int(os.environ.get("PORT", "8765"))
+def get_computer() -> PlaywrightComputer:
+    """Get the current computer instance."""
+    if computer is None:
+        raise RuntimeError("Computer not initialized")
+    return computer
+@asynccontextmanager
+async def lifespan(app):
+    """Initialize browser on startup, cleanup on shutdown."""
+    global computer
+    url = os.environ.get("FLEET_ENV_URL", "about:blank")
+    width = int(os.environ.get("SCREEN_WIDTH", "1366"))
+    height = int(os.environ.get("SCREEN_HEIGHT", "768"))
+    headless = os.environ.get("HEADLESS", "true").lower() == "true"
+    highlight = os.environ.get("HIGHLIGHT_MOUSE", "false").lower() == "true"
+    logger.info(f"CUA Server: {width}x{height}, headless={headless}, url={url}")
+    computer = PlaywrightComputer(
+        screen_size=(width, height),
+        initial_url=url,
+        headless=headless,
+        highlight_mouse=highlight or not headless,
+    )
+    try:
+        logger.info("Starting Playwright browser...")
+        await computer.start()
+        logger.info(f"Browser started, navigated to: {computer.current_url}")
+        yield
+    except Exception as e:
+        logger.error(f"Browser startup FAILED: {type(e).__name__}: {e}")
+        raise
+    finally:
+        logger.info("Stopping Playwright browser...")
+        try:
+            await computer.stop()
+            logger.info("Browser stopped")
+        except Exception as e:
+            logger.error(f"Browser stop error: {type(e).__name__}: {e}")
+mcp = FastMCP("cua-server", lifespan=lifespan, host="0.0.0.0", port=PORT)
+# Register all tools
+register_tools(mcp, get_computer)
+# =============================================================================
+# Routes
+# =============================================================================
+@mcp.custom_route("/health", methods=["GET"])
+async def health_check(request: Request) -> JSONResponse:
+    return JSONResponse({"status": "ok", "url": computer.current_url if computer else ""})
+# =============================================================================
+# Main
+# =============================================================================
+if __name__ == "__main__":
+    logger.info(f"Starting CUA Server on port {PORT}")
+    mcp.run(transport="streamable-http")

fleet/agent/gemini_cua/mcp_server/__init__.py ADDED Viewed

@@ -0,0 +1,5 @@
+"""MCP server for Gemini CUA agent.
+This folder is named 'mcp_server' instead of 'mcp' to avoid shadowing the 'mcp' package.
+"""

fleet/agent/gemini_cua/mcp_server/main.py ADDED Viewed

@@ -0,0 +1,105 @@
+#!/usr/bin/env python3
+"""
+CUA Server - Computer Use Agent MCP Server
+MCP server with playwright browser control using FastMCP's streamable-http transport.
+Env vars:
+    FLEET_ENV_URL: URL to navigate to
+    PORT: Server port (default: 8765)
+    SCREEN_WIDTH/HEIGHT: Browser size
+    HEADLESS: "true" or "false" (default: true)
+"""
+import logging
+import os
+from contextlib import asynccontextmanager
+from typing import Optional
+from mcp.server.fastmcp import FastMCP
+from starlette.requests import Request
+from starlette.responses import JSONResponse
+from fleet.utils.playwright import PlaywrightComputer
+# Import tools (standalone execution in container)
+from tools import register_tools
+logging.basicConfig(level=logging.INFO, format='%(asctime)s %(levelname)s %(message)s')
+logger = logging.getLogger(__name__)
+# =============================================================================
+# Setup
+# =============================================================================
+computer: Optional[PlaywrightComputer] = None
+PORT = int(os.environ.get("PORT", "8765"))
+def get_computer() -> PlaywrightComputer:
+    """Get the current computer instance."""
+    if computer is None:
+        raise RuntimeError("Computer not initialized")
+    return computer
+@asynccontextmanager
+async def lifespan(app):
+    """Initialize browser on startup, cleanup on shutdown."""
+    global computer
+    url = os.environ.get("FLEET_ENV_URL", "about:blank")
+    width = int(os.environ.get("SCREEN_WIDTH", "1366"))
+    height = int(os.environ.get("SCREEN_HEIGHT", "768"))
+    headless = os.environ.get("HEADLESS", "true").lower() == "true"
+    highlight = os.environ.get("HIGHLIGHT_MOUSE", "false").lower() == "true"
+    logger.info(f"CUA Server: {width}x{height}, headless={headless}, url={url}")
+    computer = PlaywrightComputer(
+        screen_size=(width, height),
+        initial_url=url,
+        headless=headless,
+        highlight_mouse=highlight or not headless,
+    )
+    try:
+        logger.info("Starting Playwright browser...")
+        await computer.start()
+        logger.info(f"Browser started, navigated to: {computer.current_url}")
+        yield
+    except Exception as e:
+        logger.error(f"Browser startup FAILED: {type(e).__name__}: {e}")
+        raise
+    finally:
+        logger.info("Stopping Playwright browser...")
+        try:
+            await computer.stop()
+            logger.info("Browser stopped")
+        except Exception as e:
+            logger.error(f"Browser stop error: {type(e).__name__}: {e}")
+mcp = FastMCP("cua-server", lifespan=lifespan, host="0.0.0.0", port=PORT)
+# Register all tools
+register_tools(mcp, get_computer)
+# =============================================================================
+# Routes
+# =============================================================================
+@mcp.custom_route("/health", methods=["GET"])
+async def health_check(request: Request) -> JSONResponse:
+    return JSONResponse({"status": "ok", "url": computer.current_url if computer else ""})
+# =============================================================================
+# Main
+# =============================================================================
+if __name__ == "__main__":
+    logger.info(f"Starting CUA Server on port {PORT}")
+    mcp.run(transport="streamable-http")

fleet/agent/gemini_cua/mcp_server/tools.py ADDED Viewed

@@ -0,0 +1,178 @@
+"""MCP tool definitions for CUA server."""
+import base64
+import logging
+from typing import Callable
+from mcp.server.fastmcp import FastMCP
+from mcp.types import ImageContent, TextContent
+from fleet.utils.playwright import PlaywrightComputer, KEY_SPEC
+logger = logging.getLogger(__name__)
+def register_tools(mcp: FastMCP, get_computer: Callable[[], PlaywrightComputer]) -> None:
+    """Register all CUA tools with the MCP server.
+    Args:
+        mcp: FastMCP server instance
+        get_computer: Callable that returns the current PlaywrightComputer instance
+    """
+    def _dx(x: int) -> int:
+        """Denormalize x: [0,1000] -> pixels."""
+        return int(x / 1000 * get_computer().width)
+    def _dy(y: int) -> int:
+        """Denormalize y: [0,1000] -> pixels."""
+        return int(y / 1000 * get_computer().height)
+    def _screenshot_response(img: bytes) -> list:
+        """Return screenshot as proper MCP content types."""
+        computer = get_computer()
+        return [
+            ImageContent(type="image", data=base64.b64encode(img).decode(), mimeType="image/png"),
+            TextContent(type="text", text=f"URL: {computer.current_url}"),
+        ]
+    @mcp.tool()
+    async def computer_screenshot() -> list:
+        """Takes a screenshot of the computer screen. Use this to see what's on screen."""
+        logger.info("computer_screenshot()")
+        try:
+            result = await get_computer().screenshot()
+            logger.info(f"computer_screenshot() -> {len(result)} bytes")
+            return _screenshot_response(result)
+        except Exception as e:
+            logger.error(f"computer_screenshot() FAILED: {type(e).__name__}: {e}")
+            raise
+    @mcp.tool()
+    async def mouse_click(x: int, y: int, button: str, repeats: int = 1) -> None:
+        """Performs a mouse click.
+        Args:
+            x: The normalized x coordinate within the [0, 1000] range of the image.
+            y: The normalized y coordinate within the [0, 1000] range of the image.
+            button: The button to click. Either 'left', 'middle' or 'right'.
+            repeats: The number of times to click. Default is 1.
+        """
+        logger.info(f"mouse_click({x}, {y}, {button}, {repeats})")
+        try:
+            await get_computer().mouse_click(_dx(x), _dy(y), button, repeats)
+        except Exception as e:
+            logger.error(f"mouse_click FAILED: {type(e).__name__}: {e}")
+            raise
+    @mcp.tool()
+    async def mouse_move(x: int, y: int) -> None:
+        """Moves the mouse to a new position.
+        Args:
+            x: The normalized x coordinate within the [0, 1000] range of the image.
+            y: The normalized y coordinate within the [0, 1000] range of the image.
+        """
+        logger.info(f"mouse_move({x}, {y})")
+        await get_computer().mouse_move(_dx(x), _dy(y))
+    @mcp.tool()
+    async def mouse_down(button: str) -> None:
+        """Keeps a mouse button down.
+        Args:
+            button: The button to press down. Either 'left', 'middle' or 'right'.
+        """
+        logger.info(f"mouse_down({button})")
+        await get_computer().mouse_down(button)
+    @mcp.tool()
+    async def mouse_up(button: str) -> None:
+        """Releases a mouse button after executing a mouse down action.
+        Args:
+            button: The button to release. Either 'left', 'middle' or 'right'.
+        """
+        logger.info(f"mouse_up({button})")
+        await get_computer().mouse_up(button)
+    @mcp.tool()
+    async def mouse_scroll(dx: int, dy: int) -> None:
+        """Uses the mouse to perform a two dimensional scroll.
+        Args:
+            dx: The number of pixels to scroll horizontally.
+            dy: The number of pixels to scroll vertically.
+        """
+        logger.info(f"mouse_scroll({dx}, {dy})")
+        await get_computer().mouse_scroll(dx, dy)
+    @mcp.tool()
+    async def mouse_drag(x_start: int, y_start: int, x_end: int, y_end: int, button: str = "left") -> None:
+        """Drag mouse from a point A to a point B.
+        Args:
+            x_start: The x coordinate of the starting point normalized within [0, 1000].
+            y_start: The y coordinate of the starting point normalized within [0, 1000].
+            x_end: The x coordinate of the destination point normalized within [0, 1000].
+            y_end: The y coordinate of the destination point normalized within [0, 1000].
+            button: The mouse button: left, right, middle. Default is 'left'.
+        """
+        logger.info(f"mouse_drag({x_start}, {y_start} -> {x_end}, {y_end})")
+        await get_computer().mouse_drag(_dx(x_start), _dy(y_start), _dx(x_end), _dy(y_end), button)
+    @mcp.tool()
+    async def wait(seconds: int) -> None:
+        """Waits for a given number of seconds. Use if the screen is blank or page is loading.
+        Args:
+            seconds: The number of seconds to wait.
+        """
+        logger.info(f"wait({seconds})")
+        await get_computer().wait(seconds)
+    @mcp.tool()
+    async def type_text(input_text: str, press_enter: bool) -> None:
+        """Type text on a keyboard.
+        Args:
+            input_text: The input text to type.
+            press_enter: Whether to press enter after typing.
+        """
+        logger.info(f"type_text({input_text[:50]}{'...' if len(input_text) > 50 else ''}, enter={press_enter})")
+        try:
+            await get_computer().type_text(input_text, press_enter)
+        except Exception as e:
+            logger.error(f"type_text FAILED: {type(e).__name__}: {e}")
+            raise
+    @mcp.tool()
+    async def key_combination(keys_to_press: list[str]) -> None:
+        f"""Performs a key combination. {KEY_SPEC}
+        Args:
+            keys_to_press: The list of keys to press.
+        """
+        logger.info(f"key_combination({keys_to_press})")
+        await get_computer().key_combination(keys_to_press)
+    @mcp.tool()
+    async def key_down(key: str) -> None:
+        f"""Keeps a keyboard key down. {KEY_SPEC}
+        Args:
+            key: The key to press down.
+        """
+        logger.info(f"key_down({key})")
+        await get_computer().key_down(key)
+    @mcp.tool()
+    async def key_up(key: str) -> None:
+        f"""Releases a keyboard key after executing a key down action. {KEY_SPEC}
+        Args:
+            key: The key to press up.
+        """
+        logger.info(f"key_up({key})")
+        await get_computer().key_up(key)

fleet/agent/gemini_cua/requirements.txt ADDED Viewed

@@ -0,0 +1,5 @@
+fleet-python
+playwright>=1.40.0
+mcp[cli]>=1.2.0
+uvicorn>=0.30.0
+starlette>=0.38.0

fleet/agent/gemini_cua/start.sh ADDED Viewed

@@ -0,0 +1,30 @@
+#!/bin/bash
+set -e
+# Start virtual display if not headless
+if [ "$HEADLESS" != "true" ]; then
+    echo "Starting Xvfb virtual display..."
+    Xvfb :99 -screen 0 ${SCREEN_WIDTH}x${SCREEN_HEIGHT}x24 &
+    sleep 1
+    echo "Starting fluxbox window manager..."
+    fluxbox &
+    sleep 1
+    echo "Starting VNC server on port $VNC_PORT..."
+    x11vnc -display :99 -forever -shared -rfbport $VNC_PORT -nopw &
+    sleep 1
+    echo "Starting noVNC on port $NOVNC_PORT..."
+    websockify --web=/usr/share/novnc/ $NOVNC_PORT localhost:$VNC_PORT &
+    sleep 1
+    echo ""
+    echo "=========================================="
+    echo "  Browser visible at: http://localhost:$NOVNC_PORT/vnc.html"
+    echo "=========================================="
+    echo ""
+fi
+# Start the MCP server (standalone script, imports from installed fleet-python)
+exec python mcp_server/main.py

fleet-python 0.2.66b2__py3-none-any.whl → 0.2.105__py3-none-any.whl

fleet-python 0.2.66b2py3-none-any.whl → 0.2.105py3-none-any.whl