PyPI - openadapt-ml - Versions diffs - 0.2.0__py3-none-any.whl → 0.2.1__py3-none-any.whl - Mend

openadapt-ml 0.2.0py3-none-any.whl → 0.2.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (95) hide show

openadapt_ml/baselines/__init__.py +121 -0
openadapt_ml/baselines/adapter.py +185 -0
openadapt_ml/baselines/cli.py +314 -0
openadapt_ml/baselines/config.py +448 -0
openadapt_ml/baselines/parser.py +922 -0
openadapt_ml/baselines/prompts.py +787 -0
openadapt_ml/benchmarks/__init__.py +13 -115
openadapt_ml/benchmarks/agent.py +265 -421
openadapt_ml/benchmarks/azure.py +28 -19
openadapt_ml/benchmarks/azure_ops_tracker.py +521 -0
openadapt_ml/benchmarks/cli.py +1722 -4847
openadapt_ml/benchmarks/trace_export.py +631 -0
openadapt_ml/benchmarks/viewer.py +22 -5
openadapt_ml/benchmarks/vm_monitor.py +530 -29
openadapt_ml/benchmarks/waa_deploy/Dockerfile +47 -53
openadapt_ml/benchmarks/waa_deploy/api_agent.py +21 -20
openadapt_ml/cloud/azure_inference.py +3 -5
openadapt_ml/cloud/lambda_labs.py +722 -307
openadapt_ml/cloud/local.py +2038 -487
openadapt_ml/cloud/ssh_tunnel.py +68 -26
openadapt_ml/datasets/next_action.py +40 -30
openadapt_ml/evals/grounding.py +8 -3
openadapt_ml/evals/plot_eval_metrics.py +15 -13
openadapt_ml/evals/trajectory_matching.py +41 -26
openadapt_ml/experiments/demo_prompt/format_demo.py +16 -6
openadapt_ml/experiments/demo_prompt/run_experiment.py +26 -16
openadapt_ml/experiments/representation_shootout/__init__.py +70 -0
openadapt_ml/experiments/representation_shootout/conditions.py +708 -0
openadapt_ml/experiments/representation_shootout/config.py +390 -0
openadapt_ml/experiments/representation_shootout/evaluator.py +659 -0
openadapt_ml/experiments/representation_shootout/runner.py +687 -0
openadapt_ml/experiments/waa_demo/runner.py +29 -14
openadapt_ml/export/parquet.py +36 -24
openadapt_ml/grounding/detector.py +18 -14
openadapt_ml/ingest/__init__.py +8 -6
openadapt_ml/ingest/capture.py +25 -22
openadapt_ml/ingest/loader.py +7 -4
openadapt_ml/ingest/synthetic.py +189 -100
openadapt_ml/models/api_adapter.py +14 -4
openadapt_ml/models/base_adapter.py +10 -2
openadapt_ml/models/providers/__init__.py +288 -0
openadapt_ml/models/providers/anthropic.py +266 -0
openadapt_ml/models/providers/base.py +299 -0
openadapt_ml/models/providers/google.py +376 -0
openadapt_ml/models/providers/openai.py +342 -0
openadapt_ml/models/qwen_vl.py +46 -19
openadapt_ml/perception/__init__.py +35 -0
openadapt_ml/perception/integration.py +399 -0
openadapt_ml/retrieval/demo_retriever.py +50 -24
openadapt_ml/retrieval/embeddings.py +9 -8
openadapt_ml/retrieval/retriever.py +3 -1
openadapt_ml/runtime/__init__.py +50 -0
openadapt_ml/runtime/policy.py +18 -5
openadapt_ml/runtime/safety_gate.py +471 -0
openadapt_ml/schema/__init__.py +9 -0
openadapt_ml/schema/converters.py +74 -27
openadapt_ml/schema/episode.py +31 -18
openadapt_ml/scripts/capture_screenshots.py +530 -0
openadapt_ml/scripts/compare.py +85 -54
openadapt_ml/scripts/demo_policy.py +4 -1
openadapt_ml/scripts/eval_policy.py +15 -9
openadapt_ml/scripts/make_gif.py +1 -1
openadapt_ml/scripts/prepare_synthetic.py +3 -1
openadapt_ml/scripts/train.py +21 -9
openadapt_ml/segmentation/README.md +920 -0
openadapt_ml/segmentation/__init__.py +97 -0
openadapt_ml/segmentation/adapters/__init__.py +5 -0
openadapt_ml/segmentation/adapters/capture_adapter.py +420 -0
openadapt_ml/segmentation/annotator.py +610 -0
openadapt_ml/segmentation/cache.py +290 -0
openadapt_ml/segmentation/cli.py +674 -0
openadapt_ml/segmentation/deduplicator.py +656 -0
openadapt_ml/segmentation/frame_describer.py +788 -0
openadapt_ml/segmentation/pipeline.py +340 -0
openadapt_ml/segmentation/schemas.py +622 -0
openadapt_ml/segmentation/segment_extractor.py +634 -0
openadapt_ml/training/azure_ops_viewer.py +1097 -0
openadapt_ml/training/benchmark_viewer.py +52 -41
openadapt_ml/training/shared_ui.py +7 -7
openadapt_ml/training/stub_provider.py +57 -35
openadapt_ml/training/trainer.py +143 -86
openadapt_ml/training/trl_trainer.py +70 -21
openadapt_ml/training/viewer.py +323 -108
openadapt_ml/training/viewer_components.py +180 -0
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.1.dist-info}/METADATA +215 -14
openadapt_ml-0.2.1.dist-info/RECORD +116 -0
openadapt_ml/benchmarks/base.py +0 -366
openadapt_ml/benchmarks/data_collection.py +0 -432
openadapt_ml/benchmarks/live_tracker.py +0 -180
openadapt_ml/benchmarks/runner.py +0 -418
openadapt_ml/benchmarks/waa.py +0 -761
openadapt_ml/benchmarks/waa_live.py +0 -619
openadapt_ml-0.2.0.dist-info/RECORD +0 -86
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.1.dist-info}/WHEEL +0 -0
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.1.dist-info}/licenses/LICENSE +0 -0

openadapt_ml/schema/converters.py CHANGED Viewed

@@ -30,6 +30,7 @@ from openadapt_ml.schema.episode import (
 # WAA (Windows Agent Arena) Converter
 # ============================================================================
 def _parse_waa_action(action_str: str) -> tuple[ActionType, dict[str, Any]]:
     """Parse WAA action string into ActionType and parameters.
@@ -104,19 +105,25 @@ def _parse_waa_action(action_str: str) -> tuple[ActionType, dict[str, Any]]:
         if func_name == "click":
             params = {}
             if len(cleaned_args) >= 2:
-                params["coordinates"] = Coordinates(x=int(cleaned_args[0]), y=int(cleaned_args[1]))
+                params["coordinates"] = Coordinates(
+                    x=int(cleaned_args[0]), y=int(cleaned_args[1])
+                )
             return ActionType.CLICK, params
         elif func_name == "doubleclick":
             params = {}
             if len(cleaned_args) >= 2:
-                params["coordinates"] = Coordinates(x=int(cleaned_args[0]), y=int(cleaned_args[1]))
+                params["coordinates"] = Coordinates(
+                    x=int(cleaned_args[0]), y=int(cleaned_args[1])
+                )
             return ActionType.DOUBLE_CLICK, params
         elif func_name == "rightclick":
             params = {}
             if len(cleaned_args) >= 2:
-                params["coordinates"] = Coordinates(x=int(cleaned_args[0]), y=int(cleaned_args[1]))
+                params["coordinates"] = Coordinates(
+                    x=int(cleaned_args[0]), y=int(cleaned_args[1])
+                )
             return ActionType.RIGHT_CLICK, params
         elif func_name in ("write", "typewrite"):
@@ -144,7 +151,9 @@ def _parse_waa_action(action_str: str) -> tuple[ActionType, dict[str, Any]]:
         elif func_name == "moveto":
             params = {}
             if len(cleaned_args) >= 2:
-                params["coordinates"] = Coordinates(x=int(cleaned_args[0]), y=int(cleaned_args[1]))
+                params["coordinates"] = Coordinates(
+                    x=int(cleaned_args[0]), y=int(cleaned_args[1])
+                )
             return ActionType.HOVER, params
         elif func_name == "drag" or func_name == "dragto":
@@ -229,7 +238,20 @@ def from_waa_trajectory(
         metadata={
             "domain": task_info.get("domain"),
             "difficulty": task_info.get("difficulty"),
-            **{k: v for k, v in task_info.items() if k not in ["id", "task_id", "instruction", "goal", "success", "domain", "difficulty"]},
+            **{
+                k: v
+                for k, v in task_info.items()
+                if k
+                not in [
+                    "id",
+                    "task_id",
+                    "instruction",
+                    "goal",
+                    "success",
+                    "domain",
+                    "difficulty",
+                ]
+            },
         },
     )
@@ -296,12 +318,16 @@ def _action_to_pyautogui(action: Action) -> str:
     if action.type == ActionType.DOUBLE_CLICK:
         if action.coordinates:
-            return f"pyautogui.doubleClick({action.coordinates.x}, {action.coordinates.y})"
+            return (
+                f"pyautogui.doubleClick({action.coordinates.x}, {action.coordinates.y})"
+            )
         return "pyautogui.doubleClick()"
     if action.type == ActionType.RIGHT_CLICK:
         if action.coordinates:
-            return f"pyautogui.rightClick({action.coordinates.x}, {action.coordinates.y})"
+            return (
+                f"pyautogui.rightClick({action.coordinates.x}, {action.coordinates.y})"
+            )
         return "pyautogui.rightClick()"
     if action.type == ActionType.TYPE:
@@ -342,6 +368,7 @@ def _action_to_pyautogui(action: Action) -> str:
 # Internal Format Converter (openadapt_ml.schemas.sessions)
 # ============================================================================
 def from_internal_episode(
     internal_episode: Any,
     episode_id: Optional[str] = None,
@@ -395,7 +422,9 @@ def from_internal_episode(
             key=step.action.key,
             modifiers=step.action.modifiers,
             scroll_direction=step.action.scroll_direction,
-            scroll_amount=int(step.action.scroll_amount) if step.action.scroll_amount else None,
+            scroll_amount=int(step.action.scroll_amount)
+            if step.action.scroll_amount
+            else None,
             normalized_end=(step.action.end_x, step.action.end_y)
             if step.action.end_x is not None and step.action.end_y is not None
             else None,
@@ -403,17 +432,21 @@ def from_internal_episode(
                 element_id=step.action.target_node_id,
                 role=step.action.target_role,
                 name=step.action.target_name,
-            ) if step.action.target_node_id else None,
+            )
+            if step.action.target_node_id
+            else None,
             raw=step.action.raw,
         )
-        steps.append(Step(
-            step_index=i,
-            observation=obs,
-            action=action,
-            reasoning=step.thought,
-            timestamp=step.t,
-        ))
+        steps.append(
+            Step(
+                step_index=i,
+                observation=obs,
+                action=action,
+                reasoning=step.thought,
+                timestamp=step.t,
+            )
+        )
     return Episode(
         episode_id=episode_id or internal_episode.id,
@@ -423,7 +456,9 @@ def from_internal_episode(
         metadata={
             "workflow_id": internal_episode.workflow_id,
             "summary": internal_episode.summary,
-        } if internal_episode.workflow_id or internal_episode.summary else None,
+        }
+        if internal_episode.workflow_id or internal_episode.summary
+        else None,
     )
@@ -468,11 +503,21 @@ def to_internal_episode(episode: Episode) -> dict:
                 "modifiers": step.action.modifiers,
                 "scroll_direction": step.action.scroll_direction,
                 "scroll_amount": step.action.scroll_amount,
-                "end_x": step.action.normalized_end[0] if step.action.normalized_end else None,
-                "end_y": step.action.normalized_end[1] if step.action.normalized_end else None,
-                "target_node_id": step.action.element.element_id if step.action.element else None,
-                "target_role": step.action.element.role if step.action.element else None,
-                "target_name": step.action.element.name if step.action.element else None,
+                "end_x": step.action.normalized_end[0]
+                if step.action.normalized_end
+                else None,
+                "end_y": step.action.normalized_end[1]
+                if step.action.normalized_end
+                else None,
+                "target_node_id": step.action.element.element_id
+                if step.action.element
+                else None,
+                "target_role": step.action.element.role
+                if step.action.element
+                else None,
+                "target_name": step.action.element.name
+                if step.action.element
+                else None,
                 "raw": step.action.raw,
             },
             "thought": step.reasoning,
@@ -484,7 +529,9 @@ def to_internal_episode(episode: Episode) -> dict:
         "goal": episode.instruction,
         "steps": steps,
         "success": episode.success,
-        "workflow_id": episode.metadata.get("workflow_id") if episode.metadata else None,
+        "workflow_id": episode.metadata.get("workflow_id")
+        if episode.metadata
+        else None,
         "summary": episode.metadata.get("summary") if episode.metadata else None,
     }
@@ -519,7 +566,9 @@ def load_waa_result(result_dir: Union[str, Path]) -> Episode:
                 trajectory = data
             elif isinstance(data, dict):
                 trajectory = data.get("steps", data.get("trajectory", []))
-                task_info = {k: v for k, v in data.items() if k not in ["steps", "trajectory"]}
+                task_info = {
+                    k: v for k, v in data.items() if k not in ["steps", "trajectory"]
+                }
     # Try to read result
     result_file = result_dir / "result.txt"
@@ -536,6 +585,4 @@ def load_waa_result(result_dir: Union[str, Path]) -> Episode:
     if task_id and "task_id" not in task_info:
         task_info["task_id"] = task_id
-    return from_waa_trajectory(
-        trajectory, task_info, episode_id=f"waa_{task_id}"
-    )
+    return from_waa_trajectory(trajectory, task_info, episode_id=f"waa_{task_id}")

openadapt_ml/schema/episode.py CHANGED Viewed

@@ -154,7 +154,9 @@ class BoundingBox(BaseModel):
 class UIElement(BaseModel):
     """UI element information from accessibility tree or DOM."""
-    role: Optional[str] = Field(None, description="Element role (button, textbox, etc.)")
+    role: Optional[str] = Field(
+        None, description="Element role (button, textbox, etc.)"
+    )
     name: Optional[str] = Field(None, description="Element accessible name")
     value: Optional[str] = Field(None, description="Element value (for inputs)")
     bounds: Optional[BoundingBox] = Field(None, description="Element bounding box")
@@ -199,9 +201,15 @@ class Action(BaseModel):
     # Additional parameters
     url: Optional[str] = Field(None, description="URL for goto action")
     app_name: Optional[str] = Field(None, description="Application name for open/close")
-    duration: Optional[float] = Field(None, description="Duration in seconds (for wait)")
-    monitor_id: Optional[int] = Field(None, description="Monitor ID for select_monitor action")
-    window_title: Optional[str] = Field(None, description="Window title for window_focus action")
+    duration: Optional[float] = Field(
+        None, description="Duration in seconds (for wait)"
+    )
+    monitor_id: Optional[int] = Field(
+        None, description="Monitor ID for select_monitor action"
+    )
+    window_title: Optional[str] = Field(
+        None, description="Window title for window_focus action"
+    )
     # Normalized coordinates (0.0-1.0) - alternative to pixel coordinates
     # Useful for resolution-independent recordings
@@ -223,7 +231,11 @@ class Action(BaseModel):
     @model_validator(mode="after")
     def validate_action_params(self) -> "Action":
         """Validate that required parameters are present for action type."""
-        if self.type in {ActionType.CLICK, ActionType.DOUBLE_CLICK, ActionType.RIGHT_CLICK}:
+        if self.type in {
+            ActionType.CLICK,
+            ActionType.DOUBLE_CLICK,
+            ActionType.RIGHT_CLICK,
+        }:
             if self.coordinates is None and self.element is None:
                 # Allow missing coordinates - can be inferred from context
                 pass
@@ -259,7 +271,9 @@ class Observation(BaseModel):
     # Window/screen info
     window_title: Optional[str] = Field(None, description="Active window title")
-    app_name: Optional[str] = Field(None, description="Application name (e.g., 'Chrome', 'System Settings')")
+    app_name: Optional[str] = Field(
+        None, description="Application name (e.g., 'Chrome', 'System Settings')"
+    )
     url: Optional[str] = Field(None, description="Current URL (for web apps)")
     screen_size: Optional[tuple[int, int]] = Field(
         None, description="Screen dimensions (width, height)"
@@ -293,7 +307,9 @@ class Step(BaseModel):
     # Outcome
     reward: Optional[float] = Field(None, description="Reward signal (if available)")
-    done: Optional[bool] = Field(None, description="Whether episode ended after this step")
+    done: Optional[bool] = Field(
+        None, description="Whether episode ended after this step"
+    )
     # Timing
     timestamp: Optional[float] = Field(None, description="Unix timestamp of action")
@@ -311,8 +327,7 @@ class Episode(BaseModel):
     # Schema metadata
     schema_version: str = Field(
-        default=SCHEMA_VERSION,
-        description="Schema version for compatibility checking"
+        default=SCHEMA_VERSION, description="Schema version for compatibility checking"
     )
     # Episode identification
@@ -329,21 +344,20 @@ class Episode(BaseModel):
     steps: list[Step] = Field(..., description="Sequence of steps in the episode")
     # Outcome
-    success: Optional[bool] = Field(None, description="Whether task was completed successfully")
+    success: Optional[bool] = Field(
+        None, description="Whether task was completed successfully"
+    )
     final_reward: Optional[float] = Field(None, description="Final reward/score")
     # Provenance
     source: Optional[BenchmarkSource] = Field(
         None, description="Source benchmark/dataset"
     )
-    source_file: Optional[str] = Field(
-        None, description="Original source file path"
-    )
+    source_file: Optional[str] = Field(None, description="Original source file path")
     # Metadata
     created_at: Optional[datetime] = Field(
-        default_factory=datetime.utcnow,
-        description="When episode was created/recorded"
+        default_factory=datetime.utcnow, description="When episode was created/recorded"
     )
     agent_model: Optional[str] = Field(
         None, description="Model that generated this episode (e.g., 'gpt-4o')"
@@ -351,9 +365,7 @@ class Episode(BaseModel):
     environment: Optional[str] = Field(
         None, description="Environment info (OS, browser, etc.)"
     )
-    tags: Optional[list[str]] = Field(
-        None, description="Tags for categorization"
-    )
+    tags: Optional[list[str]] = Field(None, description="Tags for categorization")
     # Extension point for benchmark-specific data
     metadata: Optional[dict[str, Any]] = Field(
@@ -389,6 +401,7 @@ class Episode(BaseModel):
 # Utility Functions
 # ============================================================================
 def validate_episode(data: dict[str, Any]) -> tuple[bool, Optional[str]]:
     """Validate episode data against schema.

openadapt-ml 0.2.0__py3-none-any.whl → 0.2.1__py3-none-any.whl

openadapt-ml 0.2.0py3-none-any.whl → 0.2.1py3-none-any.whl