npm - zeno-mobile-runner - Versions diffs - 0.1.2 - Mend

zeno-mobile-runner 0.1.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (213) hide show

package/CHANGELOG.md +497 -0
package/CONTRIBUTING.md +42 -0
package/FEATURES.md +111 -0
package/LICENSE +21 -0
package/README.md +176 -0
package/SECURITY.md +34 -0
package/build.zig +38 -0
package/build.zig.zon +7 -0
package/clients/README.md +149 -0
package/clients/go/README.md +24 -0
package/clients/go/examples/fake-session/main.go +93 -0
package/clients/go/go.mod +3 -0
package/clients/go/zmr/client.go +432 -0
package/clients/kotlin/README.md +35 -0
package/clients/kotlin/build.gradle.kts +35 -0
package/clients/kotlin/settings.gradle.kts +15 -0
package/clients/kotlin/src/main/kotlin/dev/zmr/FakeSession.kt +86 -0
package/clients/kotlin/src/main/kotlin/dev/zmr/ZmrClient.kt +67 -0
package/clients/python/README.md +29 -0
package/clients/python/examples/fake_session.py +48 -0
package/clients/python/pyproject.toml +13 -0
package/clients/python/zmr_client.py +202 -0
package/clients/rust/Cargo.lock +107 -0
package/clients/rust/Cargo.toml +10 -0
package/clients/rust/README.md +19 -0
package/clients/rust/examples/fake_session.rs +70 -0
package/clients/rust/src/lib.rs +461 -0
package/clients/swift/Package.swift +16 -0
package/clients/swift/README.md +36 -0
package/clients/swift/Sources/ZMRClient/ZMRClient.swift +114 -0
package/clients/swift/Sources/ZMRFakeSession/main.swift +86 -0
package/clients/typescript/README.md +34 -0
package/clients/typescript/examples/fake-session.mjs +36 -0
package/clients/typescript/index.d.ts +144 -0
package/clients/typescript/index.mjs +192 -0
package/clients/typescript/package.json +8 -0
package/docs/adr/0001-agent-native-runner-boundary.md +31 -0
package/docs/adr/0002-app-local-zmr-contract.md +39 -0
package/docs/adr/0003-ios-simulator-xctest-shim.md +41 -0
package/docs/adr/0004-benchmark-claims-and-baseline-collection.md +37 -0
package/docs/adr/README.md +12 -0
package/docs/ai-agents.md +154 -0
package/docs/app-integration.md +330 -0
package/docs/benchmarking.md +273 -0
package/docs/client-installation.md +133 -0
package/docs/clients.md +98 -0
package/docs/config.md +175 -0
package/docs/demo.md +259 -0
package/docs/frameworks.md +72 -0
package/docs/install.md +95 -0
package/docs/npm.md +356 -0
package/docs/protocol-fixtures/README.md +8 -0
package/docs/protocol-fixtures/core-session.requests.jsonl +8 -0
package/docs/protocol-fixtures/core-session.responses.jsonl +8 -0
package/docs/protocol-versioning.md +65 -0
package/docs/protocol.md +560 -0
package/docs/scenario-authoring.md +88 -0
package/docs/trace-privacy.md +88 -0
package/docs/troubleshooting.md +256 -0
package/examples/android-app-auth-probe.json +89 -0
package/examples/android-app-error-state.json +13 -0
package/examples/android-app-login-smoke.json +192 -0
package/examples/android-app-onboarding.json +12 -0
package/examples/android-app-referral-deep-link.json +12 -0
package/examples/android-shim-smoke.json +19 -0
package/examples/demo-failure.json +12 -0
package/examples/demo-fake.json +14 -0
package/examples/ios-dev-client-open-link.json +26 -0
package/examples/ios-dev-client-route-snapshot.json +24 -0
package/examples/ios-shim-smoke.json +23 -0
package/examples/ios-smoke.json +9 -0
package/go.work +3 -0
package/npm/agents.mjs +183 -0
package/npm/app-config.mjs +95 -0
package/npm/build-zmr.mjs +21 -0
package/npm/commands.mjs +104 -0
package/npm/generated-files.mjs +50 -0
package/npm/index.mjs +75 -0
package/npm/init-app.mjs +80 -0
package/npm/package-scripts.mjs +72 -0
package/npm/postinstall.mjs +21 -0
package/npm/scaffold.mjs +179 -0
package/npm/scenarios.mjs +93 -0
package/npm/setup.mjs +69 -0
package/npm/wizard.mjs +117 -0
package/npm/zmr.mjs +23 -0
package/package.json +118 -0
package/schemas/README.md +26 -0
package/schemas/action-result.schema.json +27 -0
package/schemas/capabilities-output.schema.json +98 -0
package/schemas/devices-output.schema.json +25 -0
package/schemas/doctor-output.schema.json +51 -0
package/schemas/explain-output.schema.json +51 -0
package/schemas/import-output.schema.json +23 -0
package/schemas/init-output.schema.json +71 -0
package/schemas/json-rpc.schema.json +55 -0
package/schemas/release-manifest.schema.json +43 -0
package/schemas/release-readiness-output.schema.json +127 -0
package/schemas/run-output.schema.json +43 -0
package/schemas/scenario.schema.json +128 -0
package/schemas/schemas-output.schema.json +26 -0
package/schemas/semantic-snapshot.schema.json +116 -0
package/schemas/snapshot.schema.json +60 -0
package/schemas/trace-event.schema.json +14 -0
package/schemas/trace-manifest.schema.json +59 -0
package/schemas/validate-output.schema.json +42 -0
package/schemas/version-output.schema.json +23 -0
package/schemas/zmr-config.schema.json +75 -0
package/scripts/android-emulator.sh +126 -0
package/scripts/assert-ios-physical-ready.sh +213 -0
package/scripts/benchmark-command.sh +307 -0
package/scripts/benchmark.sh +359 -0
package/scripts/benchmark_gate.py +117 -0
package/scripts/benchmark_result_row.py +88 -0
package/scripts/compare-benchmarks.py +288 -0
package/scripts/create-android-demo-app.sh +342 -0
package/scripts/create-ios-demo-app.sh +261 -0
package/scripts/demo-android-real.sh +232 -0
package/scripts/demo-ios-real.sh +270 -0
package/scripts/demo.sh +464 -0
package/scripts/device-matrix.sh +338 -0
package/scripts/ensure-ios-shim-target.rb +237 -0
package/scripts/install-android-shim.sh +281 -0
package/scripts/install-ios-shim.sh +589 -0
package/scripts/pilot-gate.sh +560 -0
package/scripts/release-readiness.py +838 -0
package/scripts/release-readiness.sh +91 -0
package/scripts/run-android-pilot.sh +561 -0
package/scripts/run-ios-pilot.sh +509 -0
package/shims/android/README.md +21 -0
package/shims/android/ZMRShimInstrumentedTest.java +152 -0
package/shims/android/protocol.md +18 -0
package/shims/ios/README.md +50 -0
package/shims/ios/ZMRShim.swift +110 -0
package/shims/ios/ZMRShimUITestCase.swift +518 -0
package/shims/ios/protocol.md +74 -0
package/skills/zmr-mobile-testing/SKILL.md +127 -0
package/src/android.zig +344 -0
package/src/android_device_info.zig +99 -0
package/src/android_emulator.zig +154 -0
package/src/android_screen_recording.zig +112 -0
package/src/android_shell.zig +112 -0
package/src/bundle.zig +124 -0
package/src/bundle_redaction.zig +272 -0
package/src/bundle_tar.zig +123 -0
package/src/cli_devices.zig +97 -0
package/src/cli_doctor.zig +114 -0
package/src/cli_import.zig +70 -0
package/src/cli_info.zig +39 -0
package/src/cli_init.zig +72 -0
package/src/cli_output.zig +467 -0
package/src/cli_run.zig +259 -0
package/src/cli_serve.zig +287 -0
package/src/cli_trace.zig +111 -0
package/src/cli_validate.zig +41 -0
package/src/command.zig +211 -0
package/src/config.zig +305 -0
package/src/config_diagnostics.zig +212 -0
package/src/config_paths.zig +49 -0
package/src/device_registry.zig +37 -0
package/src/doctor.zig +412 -0
package/src/doctor_hints.zig +52 -0
package/src/errors.zig +55 -0
package/src/fake_device.zig +163 -0
package/src/health.zig +28 -0
package/src/importer.zig +343 -0
package/src/importer_json.zig +100 -0
package/src/importer_model.zig +103 -0
package/src/ios.zig +399 -0
package/src/ios_devices.zig +219 -0
package/src/ios_lifecycle.zig +72 -0
package/src/ios_shim.zig +242 -0
package/src/ios_snapshot.zig +20 -0
package/src/json_fields.zig +80 -0
package/src/json_rpc.zig +150 -0
package/src/json_rpc_methods.zig +318 -0
package/src/json_rpc_observation.zig +31 -0
package/src/json_rpc_params.zig +52 -0
package/src/json_rpc_protocol.zig +110 -0
package/src/json_rpc_trace.zig +73 -0
package/src/main.zig +131 -0
package/src/mcp.zig +234 -0
package/src/mcp_protocol.zig +64 -0
package/src/mcp_trace.zig +83 -0
package/src/report.zig +346 -0
package/src/report_html.zig +63 -0
package/src/report_values.zig +27 -0
package/src/run_options.zig +152 -0
package/src/runner.zig +280 -0
package/src/runner_actions.zig +109 -0
package/src/runner_config.zig +6 -0
package/src/runner_diagnostics.zig +268 -0
package/src/runner_events.zig +170 -0
package/src/runner_native.zig +88 -0
package/src/runner_waits.zig +300 -0
package/src/scaffold.zig +472 -0
package/src/scenario.zig +346 -0
package/src/scenario_fields.zig +50 -0
package/src/schema_registry.zig +53 -0
package/src/selector.zig +84 -0
package/src/semantic.zig +171 -0
package/src/trace.zig +315 -0
package/src/trace_json.zig +340 -0
package/src/trace_summary.zig +218 -0
package/src/trace_summary_diagnostic.zig +202 -0
package/src/types.zig +120 -0
package/src/uiautomator.zig +164 -0
package/src/validation.zig +187 -0
package/src/version.zig +22 -0
package/viewer/app.js +373 -0
package/viewer/index.html +126 -0
package/viewer/parser.js +233 -0
package/viewer/styles.css +585 -0

package/scripts/benchmark-command.sh ADDED Viewed

@@ -0,0 +1,307 @@
+#!/usr/bin/env bash
+set -euo pipefail
+SOURCE="${BASH_SOURCE[0]}"
+while [[ -h "$SOURCE" ]]; do
+  SOURCE_DIR="$(cd -P "$(dirname "$SOURCE")" && pwd)"
+  SOURCE="$(readlink "$SOURCE")"
+  if [[ "$SOURCE" != /* ]]; then
+    SOURCE="$SOURCE_DIR/$SOURCE"
+  fi
+done
+ROOT="$(cd -P "$(dirname "$SOURCE")/.." && pwd)"
+CALLER_CWD="$(pwd -P)"
+# Some sandboxed environments do not allow writing to the default temp directory
+# (/var/folders, /tmp). Use a repo-local TMPDIR so adb/xcrun/mktemp/heredocs work.
+if [[ -z "${TMPDIR:-}" || ! -w "${TMPDIR:-/nonexistent}" ]]; then
+  TMPDIR="$ROOT/traces/tmp"
+  mkdir -p "$TMPDIR"
+  export TMPDIR
+fi
+TOOL="${TOOL:-baseline}"
+RUNS="${RUNS:-5}"
+TRACE_ROOT="${TRACE_ROOT:-$CALLER_CWD/traces/bench-command-$(date +%Y%m%d-%H%M%S)}"
+RESULTS=""
+CWD=""
+REPLACE=0
+PLATFORM="${PLATFORM:-}"
+DEVICE="${DEVICE:-}"
+APP_ID="${APP_ID:-}"
+SCENARIO="${SCENARIO:-}"
+APP_BUILD="${APP_BUILD:-}"
+MIN_PASS_RATE="${MIN_PASS_RATE:-}"
+MAX_FAILURES="${MAX_FAILURES:-}"
+MAX_MEAN_MS="${MAX_MEAN_MS:-}"
+MAX_P95_MS="${MAX_P95_MS:-}"
+usage() {
+  cat <<'USAGE'
+Usage:
+  scripts/benchmark-command.sh --tool <label> [options] -- <command> [args...]
+Runs any local command repeatedly and appends normalized benchmark rows that can
+be compared with ZMR rows through zmr-compare-benchmarks.
+Options:
+  --tool <label>        Baseline tool label, for example runner-a or runner-b.
+  --runs <n>            Number of command runs. Default: 5.
+  --trace-root <dir>    Directory for stdout/stderr logs. Default: traces/bench-command-<timestamp> in the caller directory.
+  --results <path>      Results JSONL path. Defaults to <trace-root>/results.jsonl.
+                        Explicit results paths are appended by default.
+  --replace             Truncate --results before writing.
+  --cwd <dir>           Run the command from this working directory.
+  --platform <name>     Platform context, for example android or ios.
+  --device <id>         Device context shared with candidate rows.
+  --app-id <id>         App id/bundle id context shared with candidate rows.
+  --scenario <path>     Scenario or flow identifier used by this command.
+  --app-build <id>      App build fingerprint, artifact path, or CI build id.
+  --min-pass-rate <pct> Optional gate minimum.
+  --max-failures <n>    Optional gate maximum.
+  --max-mean-ms <ms>    Optional mean duration maximum.
+  --max-p95-ms <ms>     Optional p95 duration maximum.
+  -h, --help            Show this help.
+Example:
+  zmr-benchmark-command \
+    --tool runner-a \
+    --runs 20 \
+    --trace-root traces/runner-a-login \
+    --results traces/comparison/results.jsonl \
+    -- runner-a test .runner-a/login.yaml
+USAGE
+}
+die() {
+  echo "error: $*" >&2
+  exit 2
+}
+require_value() {
+  local flag="$1"
+  local value="${2-}"
+  if [[ -z "$value" || "$value" == --* ]]; then
+    die "$flag requires a value"
+  fi
+  printf '%s\n' "$value"
+}
+quote_cmd() {
+  local quoted=()
+  local arg
+  for arg in "$@"; do
+    quoted+=("$(printf '%q' "$arg")")
+  done
+  printf '%s\n' "${quoted[*]}"
+}
+RESULTS_EXPLICIT=0
+while [[ $# -gt 0 ]]; do
+  case "$1" in
+    --tool)
+      TOOL="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --runs)
+      RUNS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --trace-root)
+      TRACE_ROOT="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --results)
+      RESULTS="$(require_value "$1" "${2-}")"
+      RESULTS_EXPLICIT=1
+      shift 2
+      ;;
+    --replace)
+      REPLACE=1
+      shift
+      ;;
+    --cwd)
+      CWD="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --platform)
+      PLATFORM="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --device)
+      DEVICE="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --app-id)
+      APP_ID="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --scenario)
+      SCENARIO="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --app-build)
+      APP_BUILD="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --min-pass-rate)
+      MIN_PASS_RATE="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-failures)
+      MAX_FAILURES="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-mean-ms)
+      MAX_MEAN_MS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-p95-ms)
+      MAX_P95_MS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --)
+      shift
+      break
+      ;;
+    -h|--help)
+      usage
+      exit 0
+      ;;
+    *)
+      die "unknown argument before --: $1"
+      ;;
+  esac
+done
+[[ -n "$TOOL" ]] || die "--tool cannot be empty"
+[[ "$RUNS" =~ ^[0-9]+$ && "$RUNS" -ge 1 ]] || die "--runs must be a positive integer"
+[[ $# -gt 0 ]] || die "command is required after --"
+if [[ -n "$CWD" && ! -d "$CWD" ]]; then
+  die "--cwd directory not found: $CWD"
+fi
+validate_optional_number() {
+  local name="$1"
+  local value="$2"
+  if [[ -n "$value" && ! "$value" =~ ^[0-9]+([.][0-9]+)?$ ]]; then
+    die "$name must be a non-negative number"
+  fi
+}
+validate_optional_integer() {
+  local name="$1"
+  local value="$2"
+  if [[ -n "$value" && ! "$value" =~ ^[0-9]+$ ]]; then
+    die "$name must be a non-negative integer"
+  fi
+}
+validate_optional_number "--min-pass-rate" "$MIN_PASS_RATE"
+validate_optional_integer "--max-failures" "$MAX_FAILURES"
+validate_optional_integer "--max-mean-ms" "$MAX_MEAN_MS"
+validate_optional_integer "--max-p95-ms" "$MAX_P95_MS"
+mkdir -p "$TRACE_ROOT"
+if [[ -z "$RESULTS" ]]; then
+  RESULTS="$TRACE_ROOT/results.jsonl"
+fi
+mkdir -p "$(dirname "$RESULTS")"
+if [[ "$REPLACE" -eq 1 || "$RESULTS_EXPLICIT" -eq 0 ]]; then
+  : > "$RESULTS"
+else
+  touch "$RESULTS"
+fi
+COMMAND=("$@")
+metadata_args=()
+if [[ -n "$PLATFORM" ]]; then
+  metadata_args+=(--platform "$PLATFORM")
+fi
+if [[ -n "$DEVICE" ]]; then
+  metadata_args+=(--device "$DEVICE")
+fi
+if [[ -n "$APP_ID" ]]; then
+  metadata_args+=(--app-id "$APP_ID")
+fi
+if [[ -n "$SCENARIO" ]]; then
+  metadata_args+=(--scenario "$SCENARIO")
+fi
+if [[ -n "$APP_BUILD" ]]; then
+  metadata_args+=(--app-build "$APP_BUILD")
+fi
+echo "Benchmark command output: $TRACE_ROOT"
+echo "Results: $RESULTS"
+echo "Tool: $TOOL"
+echo "+ $(quote_cmd "${COMMAND[@]}")"
+for run in $(seq 1 "$RUNS"); do
+  run_dir="$TRACE_ROOT/$TOOL-$run"
+  mkdir -p "$run_dir"
+  printf '%s\n' "$(quote_cmd "${COMMAND[@]}")" > "$run_dir/command.txt"
+  command_status=0
+  start_ms="$(python3 -c 'import time; print(int(time.time() * 1000))')"
+  if [[ -n "$CWD" ]]; then
+    (cd "$CWD" && "${COMMAND[@]}") > "$run_dir/stdout.log" 2> "$run_dir/stderr.log" || command_status=$?
+  else
+    "${COMMAND[@]}" > "$run_dir/stdout.log" 2> "$run_dir/stderr.log" || command_status=$?
+  fi
+  end_ms="$(python3 -c 'import time; print(int(time.time() * 1000))')"
+  duration_ms=$((end_ms - start_ms))
+  if [[ "${#metadata_args[@]}" -gt 0 ]]; then
+    "$ROOT/scripts/benchmark_result_row.py" \
+      --tool "$TOOL" \
+      --run "$run" \
+      --command-status "$command_status" \
+      --duration-ms "$duration_ms" \
+      --trace-dir "$run_dir" \
+      "${metadata_args[@]}" >> "$RESULTS"
+  else
+    "$ROOT/scripts/benchmark_result_row.py" \
+      --tool "$TOOL" \
+      --run "$run" \
+      --command-status "$command_status" \
+      --duration-ms "$duration_ms" \
+      --trace-dir "$run_dir" >> "$RESULTS"
+  fi
+done
+python3 - "$RESULTS" "$TOOL" <<'PY'
+import json
+import math
+import statistics
+import sys
+path, tool = sys.argv[1], sys.argv[2]
+rows = [
+    json.loads(line)
+    for line in open(path, encoding="utf-8")
+    if line.strip() and json.loads(line).get("tool") == tool
+]
+durations = [int(row.get("durationMs", 0)) for row in rows]
+failures = sum(1 for row in rows if row.get("status") != "ok")
+mean = round(statistics.mean(durations)) if durations else 0
+p95 = sorted(durations)[max(0, math.ceil(len(durations) * 0.95) - 1)] if durations else 0
+print(f"{tool}: runs={len(rows)} failures={failures} meanMs={mean} p95Ms={p95}")
+PY
+gate_args=()
+if [[ -n "$MIN_PASS_RATE" ]]; then
+  gate_args+=(--min-pass-rate "$MIN_PASS_RATE")
+fi
+if [[ -n "$MAX_FAILURES" ]]; then
+  gate_args+=(--max-failures "$MAX_FAILURES")
+fi
+if [[ -n "$MAX_MEAN_MS" ]]; then
+  gate_args+=(--max-mean-ms "$MAX_MEAN_MS")
+fi
+if [[ -n "$MAX_P95_MS" ]]; then
+  gate_args+=(--max-p95-ms "$MAX_P95_MS")
+fi
+if [[ "${#gate_args[@]}" -gt 0 ]]; then
+  "$ROOT/scripts/benchmark_gate.py" --results "$RESULTS" "${gate_args[@]}"
+fi

package/scripts/benchmark.sh ADDED Viewed

@@ -0,0 +1,359 @@
+#!/usr/bin/env bash
+set -euo pipefail
+SOURCE="${BASH_SOURCE[0]}"
+while [[ -h "$SOURCE" ]]; do
+  SOURCE_DIR="$(cd -P "$(dirname "$SOURCE")" && pwd)"
+  SOURCE="$(readlink "$SOURCE")"
+  if [[ "$SOURCE" != /* ]]; then
+    SOURCE="$SOURCE_DIR/$SOURCE"
+  fi
+done
+ROOT="$(cd -P "$(dirname "$SOURCE")/.." && pwd)"
+CALLER_CWD="$(pwd -P)"
+# Some sandboxed environments do not allow writing to the default temp directory
+# (/var/folders, /tmp). Use a repo-local TMPDIR so adb/xcrun/mktemp/heredocs work.
+if [[ -z "${TMPDIR:-}" || ! -w "${TMPDIR:-/nonexistent}" ]]; then
+  TMPDIR="$ROOT/traces/tmp"
+  mkdir -p "$TMPDIR"
+  export TMPDIR
+fi
+ZMR_BIN="${ZMR_BIN:-$(command -v zmr 2>/dev/null || printf '%s' "$ROOT/zig-out/bin/zmr")}"
+RUNS="${RUNS:-5}"
+DEVICE="${DEVICE:-}"
+TRACE_ROOT="${TRACE_ROOT:-$CALLER_CWD/traces/bench-$(date +%Y%m%d-%H%M%S)}"
+RESULTS=""
+RESULTS_EXPLICIT=0
+REPLACE=0
+ZMR_SCENARIO=""
+PLATFORM="${PLATFORM:-}"
+APP_ID="${APP_ID:-}"
+ADB="${ADB:-}"
+ANDROID_SHIM="${ANDROID_SHIM:-}"
+XCRUN="${XCRUN:-}"
+IOS_SHIM="${IOS_SHIM:-}"
+IOS_DEVICE_TYPE="${IOS_DEVICE_TYPE:-}"
+APP_BUILD="${APP_BUILD:-}"
+MIN_PASS_RATE="${MIN_PASS_RATE:-}"
+MAX_FAILURES="${MAX_FAILURES:-}"
+MAX_MEAN_MS="${MAX_MEAN_MS:-}"
+MAX_P95_MS="${MAX_P95_MS:-}"
+usage() {
+  cat <<'USAGE'
+Usage:
+  scripts/benchmark.sh --zmr <scenario.json> --device <serial> [--runs 10] [--trace-root <dir>] [--results <path>] [gate options]
+Gate options:
+  --min-pass-rate <pct>  Minimum pass rate percentage, for example 100.
+  --max-failures <n>     Maximum allowed failed runs.
+  --max-mean-ms <ms>     Maximum allowed mean run duration.
+  --max-p95-ms <ms>      Maximum allowed p95 run duration.
+Output options:
+  --results <path>       Results JSONL path. Defaults to <trace-root>/results.jsonl.
+                         Explicit results paths are appended by default.
+  --replace              Truncate --results before writing.
+Forwarded ZMR options:
+  --platform <android|ios>
+  --app-id <id>
+  --adb <path>
+  --android-shim <path>
+  --xcrun <path>
+  --ios-shim <path>
+  --ios-device-type <simulator|physical>
+  --app-build <id>       App build fingerprint, artifact path, or CI build id for comparison context.
+Environment:
+  ZMR_BIN       Path to zmr binary. Defaults to ./zig-out/bin/zmr.
+  RUNS          Default run count when --runs is omitted.
+  DEVICE        Default Android serial when --device is omitted.
+  TRACE_ROOT    Default benchmark output root. Otherwise traces/bench-<timestamp> in the caller directory.
+  PLATFORM, APP_ID, ADB, ANDROID_SHIM, XCRUN, IOS_SHIM, IOS_DEVICE_TYPE, APP_BUILD
+                Default forwarded ZMR options when matching flags are omitted.
+  MIN_PASS_RATE, MAX_FAILURES, MAX_MEAN_MS, MAX_P95_MS
+                Default gate thresholds when matching flags are omitted.
+USAGE
+}
+die() {
+  echo "error: $*" >&2
+  exit 2
+}
+require_value() {
+  local flag="$1"
+  local value="${2-}"
+  if [[ -z "$value" || "$value" == --* ]]; then
+    die "$flag requires a value"
+  fi
+  printf '%s\n' "$value"
+}
+while [[ $# -gt 0 ]]; do
+  case "$1" in
+    --zmr)
+      ZMR_SCENARIO="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --device)
+      DEVICE="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --runs)
+      RUNS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --trace-root)
+      TRACE_ROOT="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --results)
+      RESULTS="$(require_value "$1" "${2-}")"
+      RESULTS_EXPLICIT=1
+      shift 2
+      ;;
+    --replace)
+      REPLACE=1
+      shift
+      ;;
+    --platform)
+      PLATFORM="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --app-id)
+      APP_ID="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --adb)
+      ADB="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --android-shim)
+      ANDROID_SHIM="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --xcrun)
+      XCRUN="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --ios-shim)
+      IOS_SHIM="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --ios-device-type)
+      IOS_DEVICE_TYPE="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --app-build)
+      APP_BUILD="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --min-pass-rate)
+      MIN_PASS_RATE="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-failures)
+      MAX_FAILURES="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-mean-ms)
+      MAX_MEAN_MS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    --max-p95-ms)
+      MAX_P95_MS="$(require_value "$1" "${2-}")"
+      shift 2
+      ;;
+    -h|--help)
+      usage
+      exit 0
+      ;;
+    *)
+      die "unknown argument: $1"
+      ;;
+  esac
+done
+if [[ -z "$ZMR_SCENARIO" ]]; then
+  echo "error: --zmr is required" >&2
+  usage >&2
+  exit 2
+fi
+if [[ -z "$DEVICE" ]]; then
+  echo "error: --device or DEVICE is required" >&2
+  usage >&2
+  exit 2
+fi
+if [[ ! "$RUNS" =~ ^[0-9]+$ || "$RUNS" -lt 1 ]]; then
+  die "--runs must be a positive integer"
+fi
+if [[ ! -x "$ZMR_BIN" ]]; then
+  die "zmr binary is not executable: $ZMR_BIN"
+fi
+validate_optional_number() {
+  local name="$1"
+  local value="$2"
+  if [[ -n "$value" && ! "$value" =~ ^[0-9]+([.][0-9]+)?$ ]]; then
+    echo "$name must be a non-negative number" >&2
+    exit 2
+  fi
+}
+validate_optional_integer() {
+  local name="$1"
+  local value="$2"
+  if [[ -n "$value" && ! "$value" =~ ^[0-9]+$ ]]; then
+    echo "$name must be a non-negative integer" >&2
+    exit 2
+  fi
+}
+validate_optional_number "--min-pass-rate" "$MIN_PASS_RATE"
+validate_optional_integer "--max-failures" "$MAX_FAILURES"
+validate_optional_integer "--max-mean-ms" "$MAX_MEAN_MS"
+validate_optional_integer "--max-p95-ms" "$MAX_P95_MS"
+if [[ -n "$IOS_DEVICE_TYPE" && "$IOS_DEVICE_TYPE" != "simulator" && "$IOS_DEVICE_TYPE" != "physical" ]]; then
+  echo "--ios-device-type must be simulator or physical" >&2
+  exit 2
+fi
+mkdir -p "$TRACE_ROOT"
+if [[ -z "$RESULTS" ]]; then
+  RESULTS="$TRACE_ROOT/results.jsonl"
+fi
+mkdir -p "$(dirname "$RESULTS")"
+if [[ "$REPLACE" -eq 1 || "$RESULTS_EXPLICIT" -eq 0 ]]; then
+  : > "$RESULTS"
+else
+  touch "$RESULTS"
+fi
+run_one() {
+  local tool="$1"
+  local run="$2"
+  local command_status=0
+  local start_ms end_ms duration_ms trace_dir
+  local -a zmr_args=()
+  local -a metadata_args=()
+  trace_dir="$TRACE_ROOT/$tool-$run"
+  mkdir -p "$trace_dir"
+  if [[ -n "$PLATFORM" ]]; then
+    zmr_args+=(--platform "$PLATFORM")
+  fi
+  if [[ -n "$APP_ID" ]]; then
+    zmr_args+=(--app-id "$APP_ID")
+  fi
+  if [[ -n "$ADB" ]]; then
+    zmr_args+=(--adb "$ADB")
+  fi
+  if [[ -n "$ANDROID_SHIM" ]]; then
+    zmr_args+=(--android-shim "$ANDROID_SHIM")
+  fi
+  if [[ -n "$XCRUN" ]]; then
+    zmr_args+=(--xcrun "$XCRUN")
+  fi
+  if [[ -n "$IOS_SHIM" ]]; then
+    zmr_args+=(--ios-shim "$IOS_SHIM")
+  fi
+  if [[ -n "$IOS_DEVICE_TYPE" ]]; then
+    zmr_args+=(--ios-device-type "$IOS_DEVICE_TYPE")
+  fi
+  if [[ -n "$PLATFORM" ]]; then
+    metadata_args+=(--platform "$PLATFORM")
+  fi
+  if [[ -n "$DEVICE" ]]; then
+    metadata_args+=(--device "$DEVICE")
+  fi
+  if [[ -n "$APP_ID" ]]; then
+    metadata_args+=(--app-id "$APP_ID")
+  fi
+  if [[ -n "$ZMR_SCENARIO" ]]; then
+    metadata_args+=(--scenario "$ZMR_SCENARIO")
+  fi
+  if [[ -n "$APP_BUILD" ]]; then
+    metadata_args+=(--app-build "$APP_BUILD")
+  fi
+  start_ms="$(python3 -c 'import time; print(int(time.time() * 1000))')"
+  if [[ "${#zmr_args[@]}" -gt 0 ]]; then
+    "$ZMR_BIN" run "$ZMR_SCENARIO" --device "$DEVICE" "${zmr_args[@]}" --trace-dir "$trace_dir" || command_status=$?
+  else
+    "$ZMR_BIN" run "$ZMR_SCENARIO" --device "$DEVICE" --trace-dir "$trace_dir" || command_status=$?
+  fi
+  end_ms="$(python3 -c 'import time; print(int(time.time() * 1000))')"
+  duration_ms=$((end_ms - start_ms))
+  if [[ "${#metadata_args[@]}" -gt 0 ]]; then
+    "$ROOT/scripts/benchmark_result_row.py" \
+      --tool "$tool" \
+      --run "$run" \
+      --command-status "$command_status" \
+      --duration-ms "$duration_ms" \
+      --trace-dir "$trace_dir" \
+      "${metadata_args[@]}" >> "$RESULTS"
+  else
+    "$ROOT/scripts/benchmark_result_row.py" \
+      --tool "$tool" \
+      --run "$run" \
+      --command-status "$command_status" \
+      --duration-ms "$duration_ms" \
+      --trace-dir "$trace_dir" >> "$RESULTS"
+  fi
+  return "$command_status"
+}
+for run in $(seq 1 "$RUNS"); do
+  run_one zmr "$run" || true
+done
+python3 - "$RESULTS" <<'PY'
+import json
+import math
+import statistics
+import sys
+from collections import defaultdict
+path = sys.argv[1]
+rows = [json.loads(line) for line in open(path, encoding="utf-8") if line.strip()]
+by_tool = defaultdict(list)
+for row in rows:
+    by_tool[row["tool"]].append(row)
+for tool, items in sorted(by_tool.items()):
+    durations = [item["durationMs"] for item in items]
+    failures = sum(1 for item in items if item["status"] != "ok")
+    mean = round(statistics.mean(durations)) if durations else 0
+    p95 = sorted(durations)[max(0, math.ceil(len(durations) * 0.95) - 1)] if durations else 0
+    print(f"{tool}: runs={len(items)} failures={failures} meanMs={mean} p95Ms={p95}")
+print(f"results={path}")
+PY
+gate_args=()
+if [[ -n "$MIN_PASS_RATE" ]]; then
+  gate_args+=(--min-pass-rate "$MIN_PASS_RATE")
+fi
+if [[ -n "$MAX_FAILURES" ]]; then
+  gate_args+=(--max-failures "$MAX_FAILURES")
+fi
+if [[ -n "$MAX_MEAN_MS" ]]; then
+  gate_args+=(--max-mean-ms "$MAX_MEAN_MS")
+fi
+if [[ -n "$MAX_P95_MS" ]]; then
+  gate_args+=(--max-p95-ms "$MAX_P95_MS")
+fi
+if [[ "${#gate_args[@]}" -gt 0 ]]; then
+  "$ROOT/scripts/benchmark_gate.py" --results "$RESULTS" "${gate_args[@]}"
+fi