PyPI - fleet-python - Versions diffs - 0.2.66b2__py3-none-any.whl → 0.2.105__py3-none-any.whl - Mend

fleet-python 0.2.66b2py3-none-any.whl → 0.2.105py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (70) hide show

examples/export_tasks.py +16 -5
examples/export_tasks_filtered.py +245 -0
examples/fetch_tasks.py +230 -0
examples/import_tasks.py +140 -8
examples/iterate_verifiers.py +725 -0
fleet/__init__.py +128 -5
fleet/_async/__init__.py +27 -3
fleet/_async/base.py +24 -9
fleet/_async/client.py +938 -41
fleet/_async/env/client.py +60 -3
fleet/_async/instance/client.py +52 -7
fleet/_async/models.py +15 -0
fleet/_async/resources/api.py +200 -0
fleet/_async/resources/sqlite.py +1801 -46
fleet/_async/tasks.py +122 -25
fleet/_async/verifiers/bundler.py +22 -21
fleet/_async/verifiers/verifier.py +25 -19
fleet/agent/__init__.py +32 -0
fleet/agent/gemini_cua/Dockerfile +45 -0
fleet/agent/gemini_cua/__init__.py +10 -0
fleet/agent/gemini_cua/agent.py +759 -0
fleet/agent/gemini_cua/mcp/main.py +108 -0
fleet/agent/gemini_cua/mcp_server/__init__.py +5 -0
fleet/agent/gemini_cua/mcp_server/main.py +105 -0
fleet/agent/gemini_cua/mcp_server/tools.py +178 -0
fleet/agent/gemini_cua/requirements.txt +5 -0
fleet/agent/gemini_cua/start.sh +30 -0
fleet/agent/orchestrator.py +854 -0
fleet/agent/types.py +49 -0
fleet/agent/utils.py +34 -0
fleet/base.py +34 -9
fleet/cli.py +1061 -0
fleet/client.py +1060 -48
fleet/config.py +1 -1
fleet/env/__init__.py +16 -0
fleet/env/client.py +60 -3
fleet/eval/__init__.py +15 -0
fleet/eval/uploader.py +231 -0
fleet/exceptions.py +8 -0
fleet/instance/client.py +53 -8
fleet/instance/models.py +1 -0
fleet/models.py +303 -0
fleet/proxy/__init__.py +25 -0
fleet/proxy/proxy.py +453 -0
fleet/proxy/whitelist.py +244 -0
fleet/resources/api.py +200 -0
fleet/resources/sqlite.py +1845 -46
fleet/tasks.py +113 -20
fleet/utils/__init__.py +7 -0
fleet/utils/http_logging.py +178 -0
fleet/utils/logging.py +13 -0
fleet/utils/playwright.py +440 -0
fleet/verifiers/bundler.py +22 -21
fleet/verifiers/db.py +985 -1
fleet/verifiers/decorator.py +1 -1
fleet/verifiers/verifier.py +25 -19
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/METADATA +28 -1
fleet_python-0.2.105.dist-info/RECORD +115 -0
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/WHEEL +1 -1
fleet_python-0.2.105.dist-info/entry_points.txt +2 -0
tests/test_app_method.py +85 -0
tests/test_expect_exactly.py +4148 -0
tests/test_expect_only.py +2593 -0
tests/test_instance_dispatch.py +607 -0
tests/test_sqlite_resource_dual_mode.py +263 -0
tests/test_sqlite_shared_memory_behavior.py +117 -0
fleet_python-0.2.66b2.dist-info/RECORD +0 -81
tests/test_verifier_security.py +0 -427
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/licenses/LICENSE +0 -0
{fleet_python-0.2.66b2.dist-info → fleet_python-0.2.105.dist-info}/top_level.txt +0 -0

fleet/models.py CHANGED Viewed

@@ -51,6 +51,7 @@ class Instance(BaseModel):
     team_id: str = Field(..., title="Team Id")
     region: str = Field(..., title="Region")
     env_variables: Optional[Dict[str, Any]] = Field(None, title="Env Variables")
+    run_id: Optional[str] = Field(None, title="Run Id")
 class InstanceRequest(BaseModel):
@@ -70,6 +71,7 @@ class InstanceRequest(BaseModel):
     image_type: Optional[str] = Field(None, title="Image Type")
     created_from: Optional[str] = Field(None, title="Created From")
     ttl_seconds: Optional[int] = Field(None, title="TTL Seconds")
+    heartbeat_interval: Optional[int] = Field(None, title="Heartbeat Interval")
 class InstanceStatus(Enum):
@@ -158,6 +160,10 @@ class TaskRequest(BaseModel):
     verifier_id: Optional[str] = Field(None, title="Verifier Id")
     version: Optional[str] = Field(None, title="Version")
     env_variables: Optional[Dict[str, Any]] = Field(None, title="Env Variables")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+    writer_metadata: Optional[Dict[str, Any]] = Field(
+        None, title="Writer Metadata", description="Metadata filled by task writer"
+    )
     output_json_schema: Optional[Dict[str, Any]] = Field(
         None, title="Output Json Schema"
     )
@@ -166,6 +172,13 @@ class TaskRequest(BaseModel):
 class TaskUpdateRequest(BaseModel):
     prompt: Optional[str] = Field(None, title="Prompt")
     verifier_code: Optional[str] = Field(None, title="Verifier Code")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+    writer_metadata: Optional[Dict[str, Any]] = Field(
+        None, title="Writer Metadata", description="Metadata filled by task writer"
+    )
+    qa_metadata: Optional[Dict[str, Any]] = Field(
+        None, title="QA Metadata", description="Metadata filled by QA reviewer"
+    )
 class VerifierData(BaseModel):
@@ -191,6 +204,9 @@ class TaskResponse(BaseModel):
     data_version: Optional[str] = Field(None, title="Data Version")
     env_variables: Optional[Dict[str, Any]] = Field(None, title="Env Variables")
     verifier: Optional[VerifierData] = Field(None, title="Verifier")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+    writer_metadata: Optional[Dict[str, Any]] = Field(None, title="Writer Metadata")
+    qa_metadata: Optional[Dict[str, Any]] = Field(None, title="QA Metadata")
     output_json_schema: Optional[Dict[str, Any]] = Field(
         None, title="Output Json Schema"
     )
@@ -360,6 +376,37 @@ class InstanceResponse(BaseModel):
     data_version: Optional[str] = Field(None, title="Data Version")
     urls: Optional[InstanceURLs] = Field(None, title="Urls")
     health: Optional[bool] = Field(None, title="Health")
+    run_id: Optional[str] = Field(None, title="Run Id")
+    profile_id: Optional[str] = Field(None, title="Profile Id")
+    heartbeat_interval: Optional[int] = Field(None, title="Heartbeat Interval")
+    heartbeat_region: Optional[str] = Field(None, title="Heartbeat Region")
+class Run(BaseModel):
+    run_id: str = Field(..., title="Run Id")
+    running_count: int = Field(..., title="Running Count")
+    total_count: int = Field(..., title="Total Count")
+    first_created_at: str = Field(..., title="First Created At")
+    last_created_at: str = Field(..., title="Last Created At")
+    profile_id: Optional[str] = Field(None, title="Profile Id")
+class HeartbeatResponse(BaseModel):
+    """Response from bumping an instance heartbeat."""
+    success: bool = Field(..., description="Whether the heartbeat was successfully updated")
+    instance_id: str = Field(..., description="The instance ID")
+    last_heartbeat: Optional[str] = Field(
+        None,
+        description="ISO 8601 UTC timestamp of the heartbeat (None if not enabled)",
+    )
+    deadline_timestamp: Optional[float] = Field(
+        None,
+        description="Unix timestamp when next heartbeat is due (None if not enabled)",
+    )
+    interval_seconds: Optional[int] = Field(
+        None, description="Heartbeat interval in seconds (None if not enabled)"
+    )
 class AccountResponse(BaseModel):
@@ -367,3 +414,259 @@ class AccountResponse(BaseModel):
     team_name: str = Field(..., title="Team Name")
     instance_limit: int = Field(..., title="Instance Limit")
     instance_count: int = Field(..., title="Instance Count")
+    profile_id: Optional[str] = Field(None, title="Profile Id")
+    profile_name: Optional[str] = Field(None, title="Profile Name")
+# Jobs and Sessions models
+class JobCreateRequest(BaseModel):
+    """Request payload for creating a new job.
+    The name field supports placeholders:
+    - {id}: Replaced with a full UUID
+    - {sid}: Replaced with the first 8 characters of a UUID (short ID)
+    - {i}: Replaced with auto-incrementing number (must be a suffix, e.g., "job-{i}")
+    """
+    name: Optional[str] = Field(None, title="Name", max_length=255)
+    models: List[str] = Field(..., title="Models", min_length=1)
+    pass_k: int = Field(1, title="Pass K", ge=1)
+    env_key: Optional[str] = Field(None, title="Env Key")
+    project_key: Optional[str] = Field(None, title="Project Key")
+    task_keys: Optional[List[str]] = Field(None, title="Task Keys", min_length=1)
+    excluded_task_keys: Optional[List[str]] = Field(None, title="Excluded Task Keys")
+    max_steps: Optional[int] = Field(None, title="Max Steps", ge=1)
+    max_duration_minutes: int = Field(60, title="Max Duration Minutes", ge=1)
+    max_concurrent_per_model: int = Field(30, title="Max Concurrent Per Model", ge=1)
+    mode: Optional[str] = Field(None, title="Mode")
+    system_prompt: Optional[str] = Field(None, title="System Prompt")
+    model_prompts: Optional[Dict[str, str]] = Field(None, title="Model Prompts")
+    byok_keys: Optional[Dict[str, str]] = Field(None, title="BYOK Keys")
+    byok_ttl_minutes: Optional[int] = Field(None, title="BYOK TTL Minutes", ge=1)
+    harness: Optional[str] = Field(None, title="Harness")
+class JobResponse(BaseModel):
+    """Response for a single job."""
+    id: str = Field(..., title="Id")
+    name: Optional[str] = Field(None, title="Name")
+    created_at: Optional[str] = Field(None, title="Created At")
+    status: Optional[str] = Field(None, title="Status")
+class JobListResponse(BaseModel):
+    """Response for listing jobs."""
+    jobs: List[JobResponse] = Field(..., title="Jobs")
+    total: int = Field(..., title="Total")
+class JobCreateResponse(BaseModel):
+    """Response from creating a job."""
+    job_id: str = Field(..., title="Job Id")
+    workflow_job_id: Optional[str] = Field(None, title="Workflow Job Id")
+    status: str = Field(..., title="Status")
+    name: Optional[str] = Field(None, title="Name")
+class VerifierExecutionResult(BaseModel):
+    """Verifier execution result for a session."""
+    success: bool = Field(..., title="Success")
+    score: Optional[float] = Field(None, title="Score")
+    stdout: Optional[str] = Field(None, title="Stdout")
+    execution_time_ms: int = Field(..., title="Execution Time Ms")
+    result: Optional[Any] = Field(None, title="Result")
+class SessionInfo(BaseModel):
+    """Session information within a job."""
+    session_id: str = Field(..., title="Session Id")
+    instance: Optional[Instance] = Field(None, title="Instance")
+    model: str = Field(..., title="Model")
+    status: str = Field(..., title="Status")
+    created_at: str = Field(..., title="Created At")
+    started_at: Optional[str] = Field(None, title="Started At")
+    ended_at: Optional[str] = Field(None, title="Ended At")
+    step_count: int = Field(..., title="Step Count")
+    verifier_execution: Optional[VerifierExecutionResult] = Field(
+        None, title="Verifier Execution"
+    )
+class TaskInfo(BaseModel):
+    """Task information for session transcript."""
+    key: str = Field(..., title="Key")
+    prompt: str = Field(..., title="Prompt")
+    env_id: str = Field(..., title="Env Id")
+    env_variables: Optional[Dict[str, Any]] = Field(None, title="Env Variables")
+    created_at: Optional[str] = Field(None, title="Created At")
+    version: Optional[str] = Field(None, title="Version")
+    verifier_func: Optional[str] = Field(None, title="Verifier Func")
+    verifier_id: Optional[str] = Field(None, title="Verifier Id")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+    writer_metadata: Optional[Dict[str, Any]] = Field(None, title="Writer Metadata")
+    qa_metadata: Optional[Dict[str, Any]] = Field(None, title="QA Metadata")
+class TaskSessionGroup(BaseModel):
+    """Sessions grouped by task."""
+    task_id: Optional[str] = Field(None, title="Task Id")
+    task: Optional[TaskInfo] = Field(None, title="Task")
+    total_sessions: int = Field(..., title="Total Sessions")
+    passed_sessions: int = Field(..., title="Passed Sessions")
+    pass_rate: float = Field(..., title="Pass Rate")
+    average_score: Optional[float] = Field(None, title="Average Score")
+    sessions: List[SessionInfo] = Field(..., title="Sessions")
+class JobSessionsResponse(BaseModel):
+    """Response for listing sessions for a job."""
+    job_id: str = Field(..., title="Job Id")
+    total_sessions: int = Field(..., title="Total Sessions")
+    tasks: List[TaskSessionGroup] = Field(..., title="Tasks")
+class TranscriptMessage(BaseModel):
+    """A message in the session transcript."""
+    role: str = Field(..., title="Role")
+    content: Any = Field(..., title="Content")
+    tool_calls: Optional[List[Any]] = Field(None, title="Tool Calls")
+    tool_call_id: Optional[str] = Field(None, title="Tool Call Id")
+class SessionTranscriptResponse(BaseModel):
+    """Response for a session transcript."""
+    task: Optional[TaskInfo] = Field(None, title="Task")
+    instance: Optional[Instance] = Field(None, title="Instance")
+    verifier_execution: Optional[VerifierExecutionResult] = Field(
+        None, title="Verifier Execution"
+    )
+    transcript: List[TranscriptMessage] = Field(..., title="Transcript")
+# Eval Job models (for local CLI runs with remote logging)
+class EvalJobCreateRequest(BaseModel):
+    """Request to create an eval job for local CLI runs."""
+    project_key: Optional[str] = Field(None, title="Project Key")
+    task_keys: Optional[List[str]] = Field(None, title="Task Keys")
+    model: str = Field(..., title="Model")
+    agent: str = Field(..., title="Agent")
+    source: str = Field("local_cli", title="Source")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+class EvalJobCreateResponse(BaseModel):
+    """Response from creating an eval job."""
+    job_id: str = Field(..., title="Job Id")
+    status: str = Field(..., title="Status")
+class EvalEvent(BaseModel):
+    """A single eval event."""
+    type: str = Field(..., title="Event Type")
+    timestamp: str = Field(..., title="Timestamp")
+    task_key: Optional[str] = Field(None, title="Task Key")
+    session_id: Optional[str] = Field(None, title="Session Id")
+    data: Dict[str, Any] = Field(default_factory=dict, title="Data")
+    duration_ms: Optional[int] = Field(None, title="Duration Ms")
+class EvalEventsRequest(BaseModel):
+    """Request to upload eval events."""
+    job_id: str = Field(..., title="Job Id")
+    events: List[EvalEvent] = Field(..., title="Events")
+class EvalEventsResponse(BaseModel):
+    """Response from uploading eval events."""
+    received: int = Field(..., title="Received Count")
+    status: str = Field(..., title="Status")
+# Session Ingest models
+class SessionStatus(str, Enum):
+    """Status of a session."""
+    pending = "pending"
+    running = "running"
+    completed = "completed"
+    failed = "failed"
+    cancelled = "cancelled"
+class SessionIngestMessage(BaseModel):
+    """A message to ingest into a session."""
+    role: str = Field(..., title="Role", description="Message role (user, assistant, tool, etc.)")
+    content: Optional[Any] = Field(None, title="Content", description="Message content (string or structured)")
+    thinking: Optional[str] = Field(None, title="Thinking", description="Model reasoning/thinking trace")
+    tool_calls: Optional[List[Dict[str, Any]]] = Field(None, title="Tool Calls")
+    tool_call_id: Optional[str] = Field(None, title="Tool Call Id")
+    timestamp: Optional[str] = Field(None, title="Timestamp")
+    tokens: Optional[int] = Field(None, title="Tokens")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+class SessionIngestRequest(BaseModel):
+    """Request to ingest session data.
+    Can be used to:
+    - Create a new session (omit session_id)
+    - Append to an existing session (provide session_id)
+    """
+    messages: List[SessionIngestMessage] = Field(..., title="Messages", min_length=1)
+    session_id: Optional[str] = Field(None, title="Session Id", description="Existing session ID to append to")
+    team_id: Optional[str] = Field(None, title="Team Id")
+    model: Optional[str] = Field(None, title="Model", description="Model identifier (e.g., anthropic/claude-sonnet-4)")
+    task_key: Optional[str] = Field(None, title="Task Key")
+    job_id: Optional[str] = Field(None, title="Job Id")
+    instance_id: Optional[str] = Field(None, title="Instance Id")
+    status: Optional[SessionStatus] = Field(None, title="Status")
+    metadata: Optional[Dict[str, Any]] = Field(None, title="Metadata")
+    started_at: Optional[str] = Field(None, title="Started At")
+    ended_at: Optional[str] = Field(None, title="Ended At")
+    verifier_execution_id: Optional[str] = Field(None, title="Verifier Execution Id", description="ID of the verifier execution record")
+class SessionIngestResponse(BaseModel):
+    """Response from ingesting session data."""
+    success: bool = Field(..., title="Success")
+    session_id: str = Field(..., title="Session Id")
+    message_count: int = Field(..., title="Message Count", description="Total messages in session")
+    created_new_session: bool = Field(..., title="Created New Session", description="True if a new session was created")
+class TraceJobRequest(BaseModel):
+    """Request to create a new trace job."""
+    name: Optional[str] = Field(None, title="Name", description="Name of the job (generated server-side if not provided)")
+class TraceJobResponse(BaseModel):
+    """Response from creating a trace job."""
+    job_id: str = Field(..., title="Job Id")
+    name: str = Field(..., title="Name")
+    status: str = Field(..., title="Status")

fleet/proxy/__init__.py ADDED Viewed

@@ -0,0 +1,25 @@
+# Fleet HTTP Proxy for capturing API traffic
+from .proxy import ProxyManager, run_proxy_server
+from .whitelist import (
+    register_endpoint,
+    install_hooks,
+    is_whitelisted,
+    get_full_whitelist,
+    get_runtime_whitelist,
+    clear_runtime_whitelist,
+    STATIC_WHITELIST,
+)
+__all__ = [
+    "ProxyManager",
+    "run_proxy_server",
+    # Whitelist management
+    "register_endpoint",
+    "install_hooks",
+    "is_whitelisted",
+    "get_full_whitelist",
+    "get_runtime_whitelist",
+    "clear_runtime_whitelist",
+    "STATIC_WHITELIST",
+]

fleet-python 0.2.66b2__py3-none-any.whl → 0.2.105__py3-none-any.whl

fleet-python 0.2.66b2py3-none-any.whl → 0.2.105py3-none-any.whl