PyPI - openadapt-ml - Versions diffs - 0.2.0__py3-none-any.whl → 0.2.2__py3-none-any.whl - Mend

openadapt-ml 0.2.0py3-none-any.whl → 0.2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (95) hide show

openadapt_ml/baselines/__init__.py +121 -0
openadapt_ml/baselines/adapter.py +185 -0
openadapt_ml/baselines/cli.py +314 -0
openadapt_ml/baselines/config.py +448 -0
openadapt_ml/baselines/parser.py +922 -0
openadapt_ml/baselines/prompts.py +787 -0
openadapt_ml/benchmarks/__init__.py +13 -115
openadapt_ml/benchmarks/agent.py +265 -421
openadapt_ml/benchmarks/azure.py +28 -19
openadapt_ml/benchmarks/azure_ops_tracker.py +521 -0
openadapt_ml/benchmarks/cli.py +1722 -4847
openadapt_ml/benchmarks/trace_export.py +631 -0
openadapt_ml/benchmarks/viewer.py +22 -5
openadapt_ml/benchmarks/vm_monitor.py +530 -29
openadapt_ml/benchmarks/waa_deploy/Dockerfile +47 -53
openadapt_ml/benchmarks/waa_deploy/api_agent.py +21 -20
openadapt_ml/cloud/azure_inference.py +3 -5
openadapt_ml/cloud/lambda_labs.py +722 -307
openadapt_ml/cloud/local.py +2038 -487
openadapt_ml/cloud/ssh_tunnel.py +68 -26
openadapt_ml/datasets/next_action.py +40 -30
openadapt_ml/evals/grounding.py +8 -3
openadapt_ml/evals/plot_eval_metrics.py +15 -13
openadapt_ml/evals/trajectory_matching.py +41 -26
openadapt_ml/experiments/demo_prompt/format_demo.py +16 -6
openadapt_ml/experiments/demo_prompt/run_experiment.py +26 -16
openadapt_ml/experiments/representation_shootout/__init__.py +70 -0
openadapt_ml/experiments/representation_shootout/conditions.py +708 -0
openadapt_ml/experiments/representation_shootout/config.py +390 -0
openadapt_ml/experiments/representation_shootout/evaluator.py +659 -0
openadapt_ml/experiments/representation_shootout/runner.py +687 -0
openadapt_ml/experiments/waa_demo/runner.py +29 -14
openadapt_ml/export/parquet.py +36 -24
openadapt_ml/grounding/detector.py +18 -14
openadapt_ml/ingest/__init__.py +8 -6
openadapt_ml/ingest/capture.py +25 -22
openadapt_ml/ingest/loader.py +7 -4
openadapt_ml/ingest/synthetic.py +189 -100
openadapt_ml/models/api_adapter.py +14 -4
openadapt_ml/models/base_adapter.py +10 -2
openadapt_ml/models/providers/__init__.py +288 -0
openadapt_ml/models/providers/anthropic.py +266 -0
openadapt_ml/models/providers/base.py +299 -0
openadapt_ml/models/providers/google.py +376 -0
openadapt_ml/models/providers/openai.py +342 -0
openadapt_ml/models/qwen_vl.py +46 -19
openadapt_ml/perception/__init__.py +35 -0
openadapt_ml/perception/integration.py +399 -0
openadapt_ml/retrieval/demo_retriever.py +50 -24
openadapt_ml/retrieval/embeddings.py +9 -8
openadapt_ml/retrieval/retriever.py +3 -1
openadapt_ml/runtime/__init__.py +50 -0
openadapt_ml/runtime/policy.py +18 -5
openadapt_ml/runtime/safety_gate.py +471 -0
openadapt_ml/schema/__init__.py +9 -0
openadapt_ml/schema/converters.py +74 -27
openadapt_ml/schema/episode.py +31 -18
openadapt_ml/scripts/capture_screenshots.py +530 -0
openadapt_ml/scripts/compare.py +85 -54
openadapt_ml/scripts/demo_policy.py +4 -1
openadapt_ml/scripts/eval_policy.py +15 -9
openadapt_ml/scripts/make_gif.py +1 -1
openadapt_ml/scripts/prepare_synthetic.py +3 -1
openadapt_ml/scripts/train.py +21 -9
openadapt_ml/segmentation/README.md +920 -0
openadapt_ml/segmentation/__init__.py +97 -0
openadapt_ml/segmentation/adapters/__init__.py +5 -0
openadapt_ml/segmentation/adapters/capture_adapter.py +420 -0
openadapt_ml/segmentation/annotator.py +610 -0
openadapt_ml/segmentation/cache.py +290 -0
openadapt_ml/segmentation/cli.py +674 -0
openadapt_ml/segmentation/deduplicator.py +656 -0
openadapt_ml/segmentation/frame_describer.py +788 -0
openadapt_ml/segmentation/pipeline.py +340 -0
openadapt_ml/segmentation/schemas.py +622 -0
openadapt_ml/segmentation/segment_extractor.py +634 -0
openadapt_ml/training/azure_ops_viewer.py +1097 -0
openadapt_ml/training/benchmark_viewer.py +52 -41
openadapt_ml/training/shared_ui.py +7 -7
openadapt_ml/training/stub_provider.py +57 -35
openadapt_ml/training/trainer.py +143 -86
openadapt_ml/training/trl_trainer.py +70 -21
openadapt_ml/training/viewer.py +323 -108
openadapt_ml/training/viewer_components.py +180 -0
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.2.dist-info}/METADATA +215 -14
openadapt_ml-0.2.2.dist-info/RECORD +116 -0
openadapt_ml/benchmarks/base.py +0 -366
openadapt_ml/benchmarks/data_collection.py +0 -432
openadapt_ml/benchmarks/live_tracker.py +0 -180
openadapt_ml/benchmarks/runner.py +0 -418
openadapt_ml/benchmarks/waa.py +0 -761
openadapt_ml/benchmarks/waa_live.py +0 -619
openadapt_ml-0.2.0.dist-info/RECORD +0 -86
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.2.dist-info}/WHEEL +0 -0
{openadapt_ml-0.2.0.dist-info → openadapt_ml-0.2.2.dist-info}/licenses/LICENSE +0 -0

openadapt_ml/experiments/demo_prompt/format_demo.py CHANGED Viewed

@@ -6,7 +6,7 @@ from pathlib import Path
 from typing import TYPE_CHECKING
 if TYPE_CHECKING:
-    from openadapt_ml.schema import Action, ActionType, Episode, Step
+    from openadapt_ml.schema import Action, Episode, Step
 def format_action(action: "Action") -> str:
@@ -19,7 +19,7 @@ def format_action(action: "Action") -> str:
         String representation like "CLICK(0.5, 0.3)" or "TYPE('hello')".
     """
     # Get action type value (handle both enum and string)
-    action_type = action.type.value if hasattr(action.type, 'value') else action.type
+    action_type = action.type.value if hasattr(action.type, "value") else action.type
     if action_type == "click":
         if action.normalized_coordinates is not None:
@@ -53,7 +53,10 @@ def format_action(action: "Action") -> str:
         return f"SCROLL({direction})"
     elif action_type == "drag":
-        if action.normalized_coordinates is not None and action.normalized_end is not None:
+        if (
+            action.normalized_coordinates is not None
+            and action.normalized_end is not None
+        ):
             x, y = action.normalized_coordinates
             end_x, end_y = action.normalized_end
             return f"DRAG({x:.3f}, {y:.3f}, {end_x:.3f}, {end_y:.3f})"
@@ -112,7 +115,11 @@ def format_episode_as_demo(
         lines.append(format_step(step, i))
         # Optionally include screenshot reference
-        if include_screenshots and step.observation and step.observation.screenshot_path:
+        if (
+            include_screenshots
+            and step.observation
+            and step.observation.screenshot_path
+        ):
             lines.append(f"  [Screenshot: {step.observation.screenshot_path}]")
         lines.append("")
@@ -167,9 +174,12 @@ def format_episode_verbose(
             if next_step.observation and next_step.observation.window_title:
                 if (
                     not step.observation
-                    or next_step.observation.window_title != step.observation.window_title
+                    or next_step.observation.window_title
+                    != step.observation.window_title
                 ):
-                    lines.append(f"  [Result: Window changed to {next_step.observation.window_title}]")
+                    lines.append(
+                        f"  [Result: Window changed to {next_step.observation.window_title}]"
+                    )
         lines.append("")

openadapt_ml/experiments/demo_prompt/run_experiment.py CHANGED Viewed

@@ -8,14 +8,12 @@ from __future__ import annotations
 import argparse
 import base64
 import json
-import sys
 from dataclasses import dataclass, field
 from datetime import datetime
 from pathlib import Path
 from typing import Any
 from openadapt_ml.experiments.demo_prompt.format_demo import (
-    format_episode_as_demo,
     format_episode_verbose,
     generate_length_matched_control,
     get_demo_screenshot_paths,
@@ -138,14 +136,16 @@ class DemoPromptExperiment:
                     if Path(path).exists():
                         with open(path, "rb") as f:
                             image_b64 = base64.b64encode(f.read()).decode("utf-8")
-                        content.append({
-                            "type": "image",
-                            "source": {
-                                "type": "base64",
-                                "media_type": "image/png",
-                                "data": image_b64,
-                            },
-                        })
+                        content.append(
+                            {
+                                "type": "image",
+                                "source": {
+                                    "type": "base64",
+                                    "media_type": "image/png",
+                                    "data": image_b64,
+                                },
+                            }
+                        )
             # Add text
             content.append({"type": "text", "text": user_content})
@@ -158,7 +158,11 @@ class DemoPromptExperiment:
             )
             parts = getattr(response, "content", [])
-            texts = [getattr(p, "text", "") for p in parts if getattr(p, "type", "") == "text"]
+            texts = [
+                getattr(p, "text", "")
+                for p in parts
+                if getattr(p, "type", "") == "text"
+            ]
             return "\n".join([t for t in texts if t]).strip()
         elif self.provider == "openai":
@@ -170,10 +174,14 @@ class DemoPromptExperiment:
                     if Path(path).exists():
                         with open(path, "rb") as f:
                             image_b64 = base64.b64encode(f.read()).decode("utf-8")
-                        user_content_parts.append({
-                            "type": "image_url",
-                            "image_url": {"url": f"data:image/png;base64,{image_b64}"},
-                        })
+                        user_content_parts.append(
+                            {
+                                "type": "image_url",
+                                "image_url": {
+                                    "url": f"data:image/png;base64,{image_b64}"
+                                },
+                            }
+                        )
             # Add text
             user_content_parts.append({"type": "text", "text": user_content})
@@ -446,7 +454,9 @@ def run_experiment(
         output_path = Path(output_dir)
         output_path.mkdir(parents=True, exist_ok=True)
-        results_file = output_path / f"results_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
+        results_file = (
+            output_path / f"results_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
+        )
         with open(results_file, "w") as f:
             json.dump(
                 {

openadapt_ml/experiments/representation_shootout/__init__.py ADDED Viewed

@@ -0,0 +1,70 @@
+"""Representation Shootout Experiment.
+Compares three approaches for GUI action prediction under distribution drift:
+- Condition A: Raw Coordinates - Direct coordinate regression
+- Condition B: Coordinates + Visual Cues - Enhanced with markers and zoom
+- Condition C: Marks (Element IDs) - Element classification using SoM
+Usage:
+    # Run full experiment
+    python -m openadapt_ml.experiments.representation_shootout.runner run
+    # Run specific condition
+    python -m openadapt_ml.experiments.representation_shootout.runner run --condition marks
+    # Evaluate under specific drift
+    python -m openadapt_ml.experiments.representation_shootout.runner eval --drift resolution
+See docs/experiments/representation_shootout_design.md for full documentation.
+"""
+from openadapt_ml.experiments.representation_shootout.config import (
+    ConditionConfig,
+    ConditionName,
+    DriftConfig,
+    DriftType,
+    ExperimentConfig,
+    MetricName,
+)
+from openadapt_ml.experiments.representation_shootout.conditions import (
+    ConditionBase,
+    CoordsCuesCondition,
+    MarksCondition,
+    RawCoordsCondition,
+    create_condition,
+)
+from openadapt_ml.experiments.representation_shootout.evaluator import (
+    DriftEvaluator,
+    EvaluationResult,
+    compute_metrics,
+    make_recommendation,
+)
+from openadapt_ml.experiments.representation_shootout.runner import (
+    ExperimentRunner,
+    run_experiment,
+)
+__all__ = [
+    # Config
+    "ExperimentConfig",
+    "ConditionConfig",
+    "ConditionName",
+    "DriftConfig",
+    "DriftType",
+    "MetricName",
+    # Conditions
+    "ConditionBase",
+    "RawCoordsCondition",
+    "CoordsCuesCondition",
+    "MarksCondition",
+    "create_condition",
+    # Evaluator
+    "DriftEvaluator",
+    "EvaluationResult",
+    "compute_metrics",
+    "make_recommendation",
+    # Runner
+    "ExperimentRunner",
+    "run_experiment",
+]

openadapt-ml 0.2.0__py3-none-any.whl → 0.2.2__py3-none-any.whl

openadapt-ml 0.2.0py3-none-any.whl → 0.2.2py3-none-any.whl