PyPI - synth-ai - Versions diffs - 0.2.14__py3-none-any.whl → 0.2.16__py3-none-any.whl - Mend

synth-ai 0.2.14py3-none-any.whl → 0.2.16py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of synth-ai might be problematic. Click here for more details.

Files changed (236) hide show

examples/README.md +1 -0
examples/multi_step/SFT_README.md +147 -0
examples/multi_step/configs/crafter_rl_stepwise_hosted_judge.toml +9 -9
examples/multi_step/configs/crafter_sft_qwen30b_lora.toml +62 -0
examples/multi_step/convert_traces_to_sft.py +84 -0
examples/multi_step/run_sft_qwen30b.sh +45 -0
examples/qwen_coder/configs/coder_lora_30b.toml +2 -1
examples/qwen_coder/configs/coder_lora_4b.toml +2 -1
examples/qwen_coder/configs/coder_lora_small.toml +2 -1
examples/qwen_vl/BUGS_AND_FIXES.md +232 -0
examples/qwen_vl/IMAGE_VALIDATION_COMPLETE.md +271 -0
examples/qwen_vl/IMAGE_VALIDATION_SUMMARY.md +260 -0
examples/qwen_vl/INFERENCE_SFT_TESTS.md +412 -0
examples/qwen_vl/NEXT_STEPS_2B.md +325 -0
examples/qwen_vl/QUICKSTART.md +327 -0
examples/qwen_vl/QUICKSTART_RL_VISION.md +110 -0
examples/qwen_vl/README.md +154 -0
examples/qwen_vl/RL_VISION_COMPLETE.md +475 -0
examples/qwen_vl/RL_VISION_TESTING.md +333 -0
examples/qwen_vl/SDK_VISION_INTEGRATION.md +328 -0
examples/qwen_vl/SETUP_COMPLETE.md +275 -0
examples/qwen_vl/VISION_TESTS_COMPLETE.md +490 -0
examples/qwen_vl/VLM_PIPELINE_COMPLETE.md +242 -0
examples/qwen_vl/__init__.py +2 -0
examples/qwen_vl/collect_data_via_cli.md +423 -0
examples/qwen_vl/collect_vision_traces.py +368 -0
examples/qwen_vl/configs/crafter_rl_vision_qwen3vl4b.toml +127 -0
examples/qwen_vl/configs/crafter_vlm_sft_example.toml +60 -0
examples/qwen_vl/configs/eval_gpt4o_mini_vision.toml +43 -0
examples/qwen_vl/configs/eval_gpt4o_vision_proper.toml +29 -0
examples/qwen_vl/configs/eval_gpt5nano_vision.toml +45 -0
examples/qwen_vl/configs/eval_qwen2vl_vision.toml +44 -0
examples/qwen_vl/configs/filter_qwen2vl_sft.toml +50 -0
examples/qwen_vl/configs/filter_vision_sft.toml +53 -0
examples/qwen_vl/configs/filter_vision_test.toml +8 -0
examples/qwen_vl/configs/sft_qwen3_vl_2b_test.toml +54 -0
examples/qwen_vl/crafter_gpt5nano_agent.py +308 -0
examples/qwen_vl/crafter_qwen_vl_agent.py +300 -0
examples/qwen_vl/run_vision_comparison.sh +62 -0
examples/qwen_vl/run_vision_sft_pipeline.sh +175 -0
examples/qwen_vl/test_image_validation.py +201 -0
examples/qwen_vl/test_sft_vision_data.py +110 -0
examples/rl/README.md +1 -1
examples/rl/configs/eval_base_qwen.toml +17 -0
examples/rl/configs/eval_rl_qwen.toml +13 -0
examples/rl/configs/rl_from_base_qwen.toml +37 -0
examples/rl/configs/rl_from_base_qwen17.toml +76 -0
examples/rl/configs/rl_from_ft_qwen.toml +37 -0
examples/rl/run_eval.py +436 -0
examples/rl/run_rl_and_save.py +111 -0
examples/rl/task_app/README.md +22 -0
examples/rl/task_app/math_single_step.py +990 -0
examples/rl/task_app/math_task_app.py +111 -0
examples/sft/README.md +5 -5
examples/sft/configs/crafter_fft_qwen0p6b.toml +4 -2
examples/sft/configs/crafter_lora_qwen0p6b.toml +4 -3
examples/sft/evaluate.py +2 -4
examples/sft/export_dataset.py +7 -4
examples/swe/task_app/README.md +1 -1
examples/swe/task_app/grpo_swe_mini.py +0 -1
examples/swe/task_app/grpo_swe_mini_task_app.py +0 -12
examples/swe/task_app/hosted/envs/mini_swe/environment.py +13 -13
examples/swe/task_app/hosted/policy_routes.py +0 -2
examples/swe/task_app/hosted/rollout.py +0 -8
examples/task_apps/crafter/task_app/grpo_crafter.py +4 -7
examples/task_apps/crafter/task_app/synth_envs_hosted/envs/crafter/policy.py +59 -1
examples/task_apps/crafter/task_app/synth_envs_hosted/inference/openai_client.py +30 -0
examples/task_apps/crafter/task_app/synth_envs_hosted/policy_routes.py +62 -31
examples/task_apps/crafter/task_app/synth_envs_hosted/rollout.py +16 -14
examples/task_apps/enron/__init__.py +1 -0
examples/vlm/README.md +3 -3
examples/vlm/configs/crafter_vlm_gpt4o.toml +2 -0
examples/vlm/crafter_openai_vlm_agent.py +3 -5
examples/vlm/filter_image_rows.py +1 -1
examples/vlm/run_crafter_vlm_benchmark.py +2 -2
examples/warming_up_to_rl/_utils.py +92 -0
examples/warming_up_to_rl/analyze_trace_db.py +1 -1
examples/warming_up_to_rl/configs/crafter_fft.toml +2 -0
examples/warming_up_to_rl/configs/crafter_fft_4b.toml +2 -0
examples/warming_up_to_rl/configs/eval_fft_qwen4b.toml +2 -0
examples/warming_up_to_rl/configs/eval_groq_qwen32b.toml +2 -0
examples/warming_up_to_rl/configs/eval_modal_qwen4b.toml +2 -1
examples/warming_up_to_rl/configs/rl_from_base_qwen4b.toml +2 -1
examples/warming_up_to_rl/configs/rl_from_ft.toml +2 -0
examples/warming_up_to_rl/export_trace_sft.py +174 -60
examples/warming_up_to_rl/readme.md +63 -132
examples/warming_up_to_rl/run_fft_and_save.py +1 -1
examples/warming_up_to_rl/run_rl_and_save.py +1 -1
examples/warming_up_to_rl/task_app/README.md +42 -0
examples/warming_up_to_rl/task_app/grpo_crafter.py +696 -0
examples/warming_up_to_rl/task_app/grpo_crafter_task_app.py +135 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/README.md +173 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/__init__.py +5 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/branching.py +143 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/environment_routes.py +1226 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/__init__.py +1 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/__init__.py +6 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/app.py +1 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/environment.py +522 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/policy.py +478 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/react_agent.py +108 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/shared.py +305 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/envs/crafter/tools.py +47 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/hosted_app.py +204 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/inference/__init__.py +5 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/inference/openai_client.py +618 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/main.py +100 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/policy_routes.py +1081 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/registry.py +195 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/rollout.py +1861 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/storage/__init__.py +5 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/storage/volume.py +211 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/test_agents.py +161 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/test_service.py +137 -0
examples/warming_up_to_rl/task_app/synth_envs_hosted/utils.py +62 -0
synth_ai/__init__.py +44 -30
synth_ai/_utils/__init__.py +47 -0
synth_ai/_utils/base_url.py +10 -0
synth_ai/_utils/http.py +10 -0
synth_ai/_utils/prompts.py +10 -0
synth_ai/_utils/task_app_state.py +12 -0
synth_ai/_utils/user_config.py +10 -0
synth_ai/api/models/supported.py +144 -7
synth_ai/api/train/__init__.py +13 -1
synth_ai/api/train/cli.py +30 -7
synth_ai/api/train/config_finder.py +18 -11
synth_ai/api/train/env_resolver.py +13 -10
synth_ai/cli/__init__.py +62 -78
synth_ai/cli/_modal_wrapper.py +7 -5
synth_ai/cli/_typer_patch.py +0 -2
synth_ai/cli/_validate_task_app.py +22 -4
synth_ai/cli/legacy_root_backup.py +3 -1
synth_ai/cli/lib/__init__.py +10 -0
synth_ai/cli/lib/task_app_discovery.py +7 -0
synth_ai/cli/lib/task_app_env.py +518 -0
synth_ai/cli/recent.py +2 -1
synth_ai/cli/setup.py +266 -0
synth_ai/cli/status.py +1 -1
synth_ai/cli/task_app_deploy.py +16 -0
synth_ai/cli/task_app_list.py +25 -0
synth_ai/cli/task_app_modal_serve.py +16 -0
synth_ai/cli/task_app_serve.py +18 -0
synth_ai/cli/task_apps.py +71 -31
synth_ai/cli/traces.py +1 -1
synth_ai/cli/train.py +18 -0
synth_ai/cli/tui.py +7 -2
synth_ai/cli/turso.py +1 -1
synth_ai/cli/watch.py +1 -1
synth_ai/demos/__init__.py +10 -0
synth_ai/demos/core/__init__.py +28 -1
synth_ai/demos/crafter/__init__.py +1 -0
synth_ai/demos/crafter/crafter_fft_4b.toml +55 -0
synth_ai/demos/crafter/grpo_crafter_task_app.py +185 -0
synth_ai/demos/crafter/rl_from_base_qwen4b.toml +74 -0
synth_ai/demos/demo_registry.py +176 -0
synth_ai/demos/math/__init__.py +1 -0
synth_ai/demos/math/_common.py +16 -0
synth_ai/demos/math/app.py +38 -0
synth_ai/demos/math/config.toml +76 -0
synth_ai/demos/math/deploy_modal.py +54 -0
synth_ai/demos/math/modal_task_app.py +702 -0
synth_ai/demos/math/task_app_entry.py +51 -0
synth_ai/environments/environment/core.py +7 -1
synth_ai/environments/examples/bandit/engine.py +0 -1
synth_ai/environments/examples/bandit/environment.py +0 -1
synth_ai/environments/examples/wordle/environment.py +0 -1
synth_ai/evals/base.py +16 -5
synth_ai/evals/client.py +1 -1
synth_ai/inference/client.py +1 -1
synth_ai/judge_schemas.py +8 -8
synth_ai/learning/client.py +1 -1
synth_ai/learning/health.py +1 -1
synth_ai/learning/jobs.py +1 -1
synth_ai/learning/rl/client.py +1 -1
synth_ai/learning/rl/env_keys.py +1 -1
synth_ai/learning/rl/secrets.py +1 -1
synth_ai/learning/sft/client.py +1 -1
synth_ai/learning/sft/data.py +407 -4
synth_ai/learning/validators.py +4 -1
synth_ai/task/apps/__init__.py +4 -2
synth_ai/task/config.py +6 -4
synth_ai/task/rubrics/__init__.py +1 -2
synth_ai/task/rubrics/loaders.py +14 -10
synth_ai/task/rubrics.py +219 -0
synth_ai/task/trace_correlation_helpers.py +24 -11
synth_ai/task/tracing_utils.py +14 -3
synth_ai/task/validators.py +2 -3
synth_ai/tracing_v3/abstractions.py +3 -3
synth_ai/tracing_v3/config.py +15 -13
synth_ai/tracing_v3/constants.py +21 -0
synth_ai/tracing_v3/db_config.py +3 -1
synth_ai/tracing_v3/decorators.py +10 -7
synth_ai/tracing_v3/llm_call_record_helpers.py +5 -5
synth_ai/tracing_v3/session_tracer.py +7 -7
synth_ai/tracing_v3/storage/base.py +29 -29
synth_ai/tracing_v3/storage/config.py +3 -3
synth_ai/tracing_v3/turso/daemon.py +8 -9
synth_ai/tracing_v3/turso/native_manager.py +80 -72
synth_ai/tracing_v3/utils.py +2 -2
synth_ai/tui/cli/query_experiments.py +4 -4
synth_ai/tui/cli/query_experiments_v3.py +4 -4
synth_ai/tui/dashboard.py +14 -9
synth_ai/utils/__init__.py +101 -0
synth_ai/utils/base_url.py +94 -0
synth_ai/utils/cli.py +131 -0
synth_ai/utils/env.py +287 -0
synth_ai/utils/http.py +169 -0
synth_ai/utils/modal.py +308 -0
synth_ai/utils/process.py +212 -0
synth_ai/utils/prompts.py +39 -0
synth_ai/utils/sqld.py +122 -0
synth_ai/utils/task_app_discovery.py +882 -0
synth_ai/utils/task_app_env.py +186 -0
synth_ai/utils/task_app_state.py +318 -0
synth_ai/utils/user_config.py +137 -0
synth_ai/v0/config/__init__.py +1 -5
synth_ai/v0/config/base_url.py +1 -7
synth_ai/v0/tracing/config.py +1 -1
synth_ai/v0/tracing/decorators.py +1 -1
synth_ai/v0/tracing/upload.py +1 -1
synth_ai/v0/tracing_v1/config.py +1 -1
synth_ai/v0/tracing_v1/decorators.py +1 -1
synth_ai/v0/tracing_v1/upload.py +1 -1
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/METADATA +85 -31
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/RECORD +229 -117
synth_ai/cli/man.py +0 -106
synth_ai/compound/cais.py +0 -0
synth_ai/core/experiment.py +0 -13
synth_ai/core/system.py +0 -15
synth_ai/demo_registry.py +0 -295
synth_ai/handshake.py +0 -109
synth_ai/http.py +0 -26
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/WHEEL +0 -0
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/entry_points.txt +0 -0
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/licenses/LICENSE +0 -0
{synth_ai-0.2.14.dist-info → synth_ai-0.2.16.dist-info}/top_level.txt +0 -0

synth_ai/cli/setup.py ADDED Viewed

@@ -0,0 +1,266 @@
+from __future__ import annotations
+import contextlib
+import os
+import time
+import webbrowser
+from pathlib import Path
+from typing import Any, cast
+from urllib.parse import urljoin, urlsplit, urlunsplit
+import requests
+from click.exceptions import Exit
+from synth_ai.demos import core as demo_core
+from synth_ai.utils.cli import print_next_step
+from synth_ai.utils.env import mask_str
+from synth_ai.utils.modal import is_modal_public_url
+from synth_ai.utils.process import popen_capture
+from synth_ai.utils.user_config import USER_CONFIG_PATH, update_user_config
+class HandshakeError(Exception):
+    pass
+def _get_canonical_origin() -> str:
+    """Resolve the dashboard origin for the browser handshake.
+    Priority order:
+      1. Explicit ``SYNTH_CANONICAL_ORIGIN`` override.
+      2. Development flag ``SYNTH_CANONICAL_DEV`` (case-insensitive truthy) → localhost.
+      3. Production dashboard at ``https://www.usesynth.ai/dashboard``.
+    """
+    override = (os.getenv("SYNTH_CANONICAL_ORIGIN") or "").strip()
+    if override:
+        return override.rstrip("/")
+    dev_flag = (os.getenv("SYNTH_CANONICAL_DEV") or "").strip().lower()
+    if dev_flag in { "1", "true", "yes", "on" }:
+        print("USING DEV ORIGIN")
+        return "http://localhost:3000"
+    return "https://www.usesynth.ai/dashboard"
+def _split_origin(origin: str) -> tuple[str, str]:
+    parsed = urlsplit(origin)
+    bare = cast(str, urlunsplit((parsed.scheme, parsed.netloc, "", "", "")))
+    path = parsed.path.rstrip("/")
+    return bare, path
+def _ensure_verification_uri(data: dict[str, Any], base_with_path: str) -> None:
+    uri = data.get("verification_uri")
+    if not isinstance(uri, str) or not uri:
+        return
+    if uri.startswith("http://") or uri.startswith("https://"):
+        return
+    data["verification_uri"] = urljoin(base_with_path.rstrip("/") + "/", uri.lstrip("/"))
+def _start_handshake_session(origin: str | None = None) -> tuple[str, str, int, int]:
+    base = (origin or _get_canonical_origin()).rstrip("/")
+    api_origin, _ = _split_origin(base)
+    url = urljoin(api_origin.rstrip("/") + "/", "api/sdk/handshake/init")
+    r = requests.post(url, timeout=10)
+    if r.status_code != 200:
+        raise HandshakeError(f"init failed: {r.status_code} {r.text}")
+    try:
+        data = r.json()
+    except ValueError as exc:  # pragma: no cover - network dependent
+        raise HandshakeError(f"init returned malformed JSON: {exc}") from exc
+    _ensure_verification_uri(data, base)
+    return (
+        str(data.get("device_code")),
+        str(data.get("verification_uri")),
+        int(data.get("expires_in", 600)),
+        int(data.get("interval", 3)),
+    )
+def _poll_handshake_token(
+    device_code: str, origin: str | None = None, *, timeout_s: int | None = None
+) -> dict[str, Any]:
+    base = (origin or _get_canonical_origin()).rstrip("/")
+    api_origin, _ = _split_origin(base)
+    url = urljoin(api_origin.rstrip("/") + "/", "api/sdk/handshake/token")
+    deadline = time.time() + (timeout_s or 600)
+    while True:
+        if time.time() > deadline:
+            raise HandshakeError("handshake timed out")
+        try:
+            r = requests.post(url, json={"device_code": device_code}, timeout=10)
+        except Exception:
+            time.sleep(2)
+            continue
+        if r.status_code == 200:
+            try:
+                data = r.json()
+            except ValueError as exc:  # pragma: no cover - network dependent
+                raise HandshakeError(f"token returned malformed JSON: {exc}") from exc
+            _ensure_verification_uri(data, base)
+            return data
+        elif r.status_code in (404, 410):
+            raise HandshakeError(f"handshake failed: {r.status_code}")
+        # 428 authorization_pending or others → wait and retry
+        time.sleep(2)
+def _run_handshake(origin: str | None = None) -> dict[str, Any]:
+    device_code, verification_uri, expires_in, interval = _start_handshake_session(origin)
+    with contextlib.suppress(Exception):
+        webbrowser.open(verification_uri)
+    return _poll_handshake_token(device_code, origin, timeout_s=expires_in)
+def setup() -> int:
+    # Prefer the demo directory provided in the current shell session, then fall back to persisted state
+    demo_dir_env = (os.environ.get("DEMO_DIR") or "").strip()
+    demo_dir: str | None = None
+    if demo_dir_env:
+        candidate = Path(demo_dir_env).expanduser()
+        if candidate.is_dir():
+            demo_dir = str(candidate.resolve())
+        else:
+            print(f"Warning: DEMO_DIR={demo_dir_env} does not exist; falling back to stored demo directory.")
+    if demo_dir is None:
+        loaded = demo_core.load_demo_dir()
+        if loaded:
+            demo_dir = loaded
+    if demo_dir and os.path.isdir(demo_dir):
+        os.chdir(demo_dir)
+        print(f"Using demo directory: {demo_dir}")
+    synth_key = ""
+    rl_env_key = ""
+    org_name = ""
+    try:
+        print("\n⏳ Connecting to your browser session…")
+        res = _run_handshake()
+        org = res.get("org") or {}
+        keys = res.get("keys") or {}
+        synth_key = str(keys.get("synth") or "").strip()
+        rl_env_key = str(keys.get("rl_env") or "").strip()
+        org_name = org.get("name") or "Unamed Organization ™️"
+        print(f"✅ Connected to {org_name}!")
+    except (HandshakeError, Exception) as exc:
+        print(f"⚠️  Failed to fetch keys from frontend: {exc}")
+        print("Falling back to manual entry...")
+    if not synth_key:
+        try:
+            synth_key = input(
+                "Failed to fetch your Synth API key. Please enter your Synth API key here:\n> "
+            ).strip()
+        except (EOFError, KeyboardInterrupt):
+            print("\nSetup cancelled.")
+            return 1
+        if not synth_key:
+            print("Synth API key is required.")
+            return 1
+    if not rl_env_key:
+        try:
+            rl_env_key = input(
+                "Failed to fetch your Environment API key. Please enter your Environment API key here:\n> "
+            ).strip()
+        except (EOFError, KeyboardInterrupt):
+            print("\nSetup cancelled.")
+            return 1
+        if not rl_env_key:
+            print("Environment API key is required.")
+            return 1
+    # Persist keys to user config
+    config_updates = {
+        "SYNTH_API_KEY": synth_key,
+        "ENVIRONMENT_API_KEY": rl_env_key,
+    }
+    update_user_config(config_updates)
+    os.environ["SYNTH_API_KEY"] = synth_key
+    os.environ["ENVIRONMENT_API_KEY"] = rl_env_key
+    env = demo_core.load_env()
+    def _refresh_env() -> None:
+        nonlocal env
+        env = demo_core.load_env()
+    def _maybe_fix_task_url() -> None:
+        if not env.task_app_name:
+            return
+        current = env.task_app_base_url
+        needs_lookup = not current or not is_modal_public_url(current)
+        if not needs_lookup:
+            return
+        code, out = popen_capture(
+            [
+                "uv",
+                "run",
+                "python",
+                "-m",
+                "modal",
+                "app",
+                "url",
+                env.task_app_name,
+            ]
+        )
+        if code != 0 or not out:
+            return
+        new_url = ""
+        for token in out.split():
+            if is_modal_public_url(token):
+                new_url = token.strip().rstrip("/")
+                break
+        if new_url and new_url != current:
+            print(f"Updating TASK_APP_BASE_URL from Modal CLI → {new_url}")
+            persist_path = demo_dir or os.getcwd()
+            demo_core.persist_task_url(new_url, name=env.task_app_name, path=persist_path)
+            os.environ["TASK_APP_BASE_URL"] = new_url
+            _refresh_env()
+    modal_ok, modal_msg = demo_core.modal_auth_status()
+    if modal_ok:
+        print(f"✓ Modal authenticated: {modal_msg}")
+    else:
+        print(f"[setup] Modal authentication status: {modal_msg}")
+    _maybe_fix_task_url()
+    if env.dev_backend_url:
+        api = env.dev_backend_url.rstrip("/") + (
+            "" if env.dev_backend_url.endswith("/api") else "/api"
+        )
+        demo_core.assert_http_ok(api + "/health", method="GET")
+    if env.task_app_base_url:
+        base = env.task_app_base_url.rstrip("/")
+        demo_core.assert_http_ok(
+            base + "/health", method="GET"
+        ) or demo_core.assert_http_ok(
+            base, method="GET"
+        )
+    print("\nSaved keys:")
+    print(f"  SYNTH_API_KEY={mask_str(synth_key)}")
+    print(f"  ENVIRONMENT_API_KEY={mask_str(rl_env_key)}")
+    if env.task_app_base_url:
+        print(f"  TASK_APP_BASE_URL={env.task_app_base_url}")
+    print(f"Configuration persisted to: {USER_CONFIG_PATH}")
+    demo_core.persist_demo_dir(os.getcwd())
+    print_next_step("deploy our task app", ["uvx synth-ai deploy"])
+    return 0
+def register(group):
+    @group.command("setup")
+    def demo_setup():
+        code = setup()
+        if code:
+            raise Exit(code)

synth_ai/cli/status.py CHANGED Viewed

@@ -12,7 +12,7 @@ from rich.console import Console
 from rich.panel import Panel
 from rich.table import Table
-from synth_ai.cli._storage import load_storage
+from ._storage import load_storage
 async def _db_stats(db_url: str) -> dict:

synth_ai/cli/task_app_deploy.py ADDED Viewed

@@ -0,0 +1,16 @@
+"""Compatibility wrapper for task-app deploy command."""
+from __future__ import annotations
+import click
+from .task_apps import task_app_group
+_deploy = task_app_group.commands.get("deploy")
+if _deploy is None:
+    raise RuntimeError("task_app_group does not define a 'deploy' command")
+deploy_command: click.Command = _deploy
+__all__ = ["deploy_command"]

synth_ai/cli/task_app_list.py ADDED Viewed

@@ -0,0 +1,25 @@
+"""Task app list command."""
+from __future__ import annotations
+import click
+from synth_ai.task.apps import registry
+from .task_apps import task_app_group
+@task_app_group.command("list")
+def list_apps() -> None:
+    """List registered task apps."""
+    entries = registry.list()
+    if not entries:
+        click.echo("No task apps registered.")
+        return
+    for entry in entries:
+        aliases = f" (aliases: {', '.join(entry.aliases)})" if entry.aliases else ""
+        click.echo(f"- {entry.app_id}{aliases}: {entry.description}")
+__all__ = ["list_apps"]

synth_ai/cli/task_app_modal_serve.py ADDED Viewed

@@ -0,0 +1,16 @@
+"""Compatibility wrapper for task-app modal-serve command."""
+from __future__ import annotations
+import click
+from .task_apps import task_app_group
+_modal_serve = task_app_group.commands.get("modal-serve")
+if _modal_serve is None:
+    raise RuntimeError("task_app_group does not define a 'modal-serve' command")
+modal_serve_command: click.Command = _modal_serve
+__all__ = ["modal_serve_command"]

synth_ai/cli/task_app_serve.py ADDED Viewed

@@ -0,0 +1,18 @@
+"""Compatibility wrapper for task-app serve command."""
+from __future__ import annotations
+import click
+from .task_apps import serve_command as task_app_serve_command
+from .task_apps import task_app_group
+serve_command = task_app_serve_command
+_group_serve = task_app_group.commands.get("serve")
+if _group_serve is None:
+    raise RuntimeError("task_app_group does not define a 'serve' command")
+serve_task_group: click.Command = _group_serve
+__all__ = ["serve_command", "serve_task_group"]

synth_ai/cli/task_apps.py CHANGED Viewed

@@ -24,9 +24,9 @@ import types
 import uuid
 from collections.abc import Callable, Iterable, Iterator, Sequence
 from dataclasses import dataclass
-from datetime import datetime, timezone
+from datetime import UTC, datetime
 from pathlib import Path
-from typing import Any, Optional, cast
+from typing import Any, cast
 try:  # Python 3.11+
     import tomllib as _toml
@@ -92,14 +92,14 @@ except Exception as exc:  # pragma: no cover - critical dependency
     raise RuntimeError("Unable to load task app server utilities") from exc
-def _load_demo_directory() -> Optional[Path]:
+def _load_demo_directory() -> Path | None:
     """Return the demo task apps directory if available."""
     try:
         module = cast(
             Any, importlib.import_module("synth_ai.demos.demo_task_apps.core")
         )
-        loader = cast(Callable[[], Optional[str | Path]], module.load_demo_dir)
+        loader = cast(Callable[[], str | Path | None], module.load_demo_dir)
         demo_dir = loader()
         if isinstance(demo_dir, str | Path):
             demo_path = Path(demo_dir)
@@ -139,7 +139,7 @@ DEFAULT_SEARCH_RELATIVE = (
 )
-def _pearson(xs: Sequence[float], ys: Sequence[float]) -> Optional[float]:
+def _pearson(xs: Sequence[float], ys: Sequence[float]) -> float | None:
     if len(xs) != len(ys) or len(xs) < 2:
         return None
     mean_x = sum(xs) / len(xs)
@@ -164,7 +164,7 @@ class AppChoice:
     label: str
     path: Path
     source: str
-    description: Optional[str] = None
+    description: str | None = None
     aliases: tuple[str, ...] = ()
     entry: TaskAppEntryType | None = None
     entry_loader: Callable[[], TaskAppEntryType] | None = None
@@ -188,21 +188,21 @@ class JudgeSpec:
     kwargs: dict[str, Any]
-def _parse_datetime_for_trace(value: Any) -> Optional[datetime]:
+def _parse_datetime_for_trace(value: Any) -> datetime | None:
     if isinstance(value, datetime):
-        return value if value.tzinfo else value.replace(tzinfo=timezone.utc)
+        return value if value.tzinfo else value.replace(tzinfo=UTC)
     if isinstance(value, str):
         value = value.replace("Z", "+00:00")
         try:
             dt = datetime.fromisoformat(value)
         except ValueError:
             try:
-                dt = datetime.fromtimestamp(float(value), tz=timezone.utc)
+                dt = datetime.fromtimestamp(float(value), tz=UTC)
             except Exception:
                 return None
-        return dt if dt.tzinfo else dt.replace(tzinfo=timezone.utc)
+        return dt if dt.tzinfo else dt.replace(tzinfo=UTC)
     if isinstance(value, int | float):
-        return datetime.fromtimestamp(float(value), tz=timezone.utc)
+        return datetime.fromtimestamp(float(value), tz=UTC)
     return None
@@ -241,6 +241,24 @@ def _event_from_dict(payload: dict[str, Any]) -> BaseEvent:
             system_state_after=payload.get("system_state_after"),
             **base_kwargs,
         )
+    # Check for LM CAIS event fields
+    if any(key in payload for key in ("model_name", "provider", "call_records")):
+        from synth_ai.tracing_v3.abstractions import LMCAISEvent
+        # Note: call_records are left as dicts - the storage layer will handle serialization
+        call_records = payload.get("call_records") or []
+        return LMCAISEvent(
+            model_name=payload.get("model_name", ""),
+            provider=payload.get("provider", ""),
+            input_tokens=payload.get("input_tokens"),
+            output_tokens=payload.get("output_tokens"),
+            total_tokens=payload.get("total_tokens"),
+            cost_usd=payload.get("cost_usd"),
+            latency_ms=payload.get("latency_ms"),
+            span_id=payload.get("span_id"),
+            trace_id=payload.get("trace_id"),
+            call_records=call_records,
+            **base_kwargs,
+        )
     return BaseEvent(**base_kwargs)
@@ -279,7 +297,7 @@ def _step_from_dict(payload: dict[str, Any]) -> SessionTimeStep:
         for msg in payload.get("markov_blanket_messages", [])
         if isinstance(msg, dict)
     ]
-    timestamp = _parse_datetime_for_trace(payload.get("timestamp")) or datetime.now(timezone.utc)
+    timestamp = _parse_datetime_for_trace(payload.get("timestamp")) or datetime.now(UTC)
     completed_at = _parse_datetime_for_trace(payload.get("completed_at"))
     return SessionTimeStep(
         step_id=payload.get("step_id", ""),
@@ -293,7 +311,7 @@ def _step_from_dict(payload: dict[str, Any]) -> SessionTimeStep:
     )
-def _session_trace_from_dict(payload: dict[str, Any]) -> Optional[V3SessionTrace]:
+def _session_trace_from_dict(payload: dict[str, Any]) -> V3SessionTrace | None:
     if not isinstance(payload, dict):
         return None
     steps = [
@@ -311,7 +329,7 @@ def _session_trace_from_dict(payload: dict[str, Any]) -> Optional[V3SessionTrace
         for msg in payload.get("markov_blanket_message_history", [])
         if isinstance(msg, dict)
     ]
-    created_at = _parse_datetime_for_trace(payload.get("created_at")) or datetime.now(timezone.utc)
+    created_at = _parse_datetime_for_trace(payload.get("created_at")) or datetime.now(UTC)
     metadata = payload.get("metadata") or {}
     session_metadata = payload.get("session_metadata")
     return V3SessionTrace(
@@ -341,10 +359,18 @@ async def _store_trace(
     _logger.info(f"[STORE_TRACE_DEBUG] trace_namespace keys: {list(trace_namespace.keys())}")
+    # Handle both formats:
+    # - With session_trace key: {"session_trace": {...}}
+    # - Without session_trace key (trace itself is the session): {"session_id": ..., "markov_blanket_message_history": ...}
     session_payload = trace_namespace.get("session_trace")
     if not isinstance(session_payload, dict):
-        _logger.warning(f"[STORE_TRACE_DEBUG] No session_trace found or wrong type: {type(session_payload)}")
-        return
+        # If no session_trace key, assume "full" format where trace itself is the session_trace
+        if "session_id" in trace_namespace:
+            session_payload = trace_namespace
+            _logger.info("[STORE_TRACE_DEBUG] Using trace_namespace directly as session_payload (no session_trace key)")
+        else:
+            _logger.warning(f"[STORE_TRACE_DEBUG] No session_trace found or wrong type: {type(session_payload)}")
+            return
     _logger.info(f"[STORE_TRACE_DEBUG] session_payload keys: {list(session_payload.keys())}")
     msg_count = len(session_payload.get("markov_blanket_message_history", []))
@@ -352,7 +378,7 @@ async def _store_trace(
     trace_obj = _session_trace_from_dict(session_payload)
     if trace_obj is None:
-        _logger.warning(f"[STORE_TRACE_DEBUG] _session_trace_from_dict returned None")
+        _logger.warning("[STORE_TRACE_DEBUG] _session_trace_from_dict returned None")
         return
     _logger.info(f"[STORE_TRACE_DEBUG] Created SessionTrace object with {len(trace_obj.markov_blanket_message_history)} messages")
@@ -366,7 +392,7 @@ async def _store_trace(
     _logger.info(f"[STORE_TRACE_DEBUG] Calling insert_session_trace for session_id={trace_obj.session_id}")
     await tracer.db.insert_session_trace(trace_obj)
-    _logger.info(f"[STORE_TRACE_DEBUG] Successfully inserted trace")
+    _logger.info("[STORE_TRACE_DEBUG] Successfully inserted trace")
 def _temporary_sys_path(paths: Sequence[Path]):
     """Context manager to prepend entries to sys.path temporarily."""
@@ -913,43 +939,43 @@ def _build_modal_config_from_ast(modal_call: ast.Call) -> ModalDeploymentConfigT
         for kw in modal_call.keywords:
             if kw.arg and isinstance(kw.value, ast.Constant):
                 kwargs[kw.arg] = kw.value.value
-            elif kw.arg == "pip_packages" and isinstance(kw.value, (ast.List, ast.Tuple)):
+            elif kw.arg == "pip_packages" and isinstance(kw.value, ast.List | ast.Tuple):
                 # Handle pip_packages list/tuple
                 packages: list[str] = []
                 value_node = kw.value
-                if isinstance(value_node, (ast.List, ast.Tuple)):
+                if isinstance(value_node, ast.List | ast.Tuple):
                     for elt in value_node.elts:
                         if isinstance(elt, ast.Constant):
                             packages.append(elt.value)
                 kwargs[kw.arg] = tuple(packages)
-            elif kw.arg == "extra_local_dirs" and isinstance(kw.value, (ast.List, ast.Tuple)):
+            elif kw.arg == "extra_local_dirs" and isinstance(kw.value, ast.List | ast.Tuple):
                 # Handle extra_local_dirs list/tuple of tuples
                 dirs = []
                 value_node = kw.value
-                if isinstance(value_node, (ast.List, ast.Tuple)):
+                if isinstance(value_node, ast.List | ast.Tuple):
                     for elt in value_node.elts:
-                        if isinstance(elt, (ast.List, ast.Tuple)) and len(elt.elts) == 2:
+                        if isinstance(elt, ast.List | ast.Tuple) and len(elt.elts) == 2:
                             src = elt.elts[0].value if isinstance(elt.elts[0], ast.Constant) else None
                             dst = elt.elts[1].value if isinstance(elt.elts[1], ast.Constant) else None
                             if src and dst:
                                 dirs.append((src, dst))
                 kwargs[kw.arg] = tuple(dirs)
-            elif kw.arg == "secret_names" and isinstance(kw.value, (ast.List, ast.Tuple)):
+            elif kw.arg == "secret_names" and isinstance(kw.value, ast.List | ast.Tuple):
                 # Handle secret_names list/tuple
                 secrets = []
                 value_node = kw.value
-                if isinstance(value_node, (ast.List, ast.Tuple)):
+                if isinstance(value_node, ast.List | ast.Tuple):
                     for elt in value_node.elts:
                         if isinstance(elt, ast.Constant):
                             secrets.append(elt.value)
                 kwargs[kw.arg] = tuple(secrets)
-            elif kw.arg == "volume_mounts" and isinstance(kw.value, (ast.List, ast.Tuple)):
+            elif kw.arg == "volume_mounts" and isinstance(kw.value, ast.List | ast.Tuple):
                 # Handle volume_mounts list/tuple of tuples
                 mounts = []
                 value_node = kw.value
-                if isinstance(value_node, (ast.List, ast.Tuple)):
+                if isinstance(value_node, ast.List | ast.Tuple):
                     for elt in value_node.elts:
-                        if isinstance(elt, (ast.List, ast.Tuple)) and len(elt.elts) == 2:
+                        if isinstance(elt, ast.List | ast.Tuple) and len(elt.elts) == 2:
                             name = elt.elts[0].value if isinstance(elt.elts[0], ast.Constant) else None
                             mount = elt.elts[1].value if isinstance(elt.elts[1], ast.Constant) else None
                             if name and mount:
@@ -2245,7 +2271,7 @@ def validate_task_app_cmd(
     import time
     # Import the validate_task_app function defined in this module
-    from synth_ai.cli._validate_task_app import validate_task_app  # type: ignore[attr-defined]
+    from ._validate_task_app import validate_task_app  # type: ignore[attr-defined]
     proc = None
     task_app_url = url
@@ -4442,6 +4468,10 @@ def filter_command(config_path: str) -> None:
                     except Exception:
                         user_content = content_raw
+                    # If user_content is a message dict with a 'content' key, extract it
+                    if isinstance(user_content, dict) and "content" in user_content:
+                        user_content = user_content["content"]
                     # Extract text from structured content
                     def extract_text(content: Any) -> str:
                         if isinstance(content, str):
@@ -4472,21 +4502,31 @@ def filter_command(config_path: str) -> None:
                     # For assistant, we might not have it recorded, so use tool calls as completion
                     assistant_text = ""
+                    assistant_content = None
                     if assistant_msg:
                         assistant_content_raw = assistant_msg.get("content")
                         try:
                             assistant_content = json.loads(assistant_content_raw) if isinstance(assistant_content_raw, str) else assistant_content_raw
                         except Exception:
                             assistant_content = assistant_content_raw
+                        # If assistant_content is a message dict with a 'content' key, extract it
+                        if isinstance(assistant_content, dict) and "content" in assistant_content:
+                            assistant_content = assistant_content["content"]
                         assistant_text = extract_text(assistant_content)
                     if not user_text:
                         continue
+                    # Use full multimodal content if it's a list (contains images), otherwise use text
+                    user_content_for_message = user_content if isinstance(user_content, list) else user_text
+                    assistant_content_for_message = assistant_content if isinstance(assistant_content, list) else (assistant_text if assistant_text else "[no response recorded]")
                     record = {
                         "messages": [
-                            {"role": "user", "content": user_text},
-                            {"role": "assistant", "content": assistant_text if assistant_text else "[no response recorded]"},
+                            {"role": "user", "content": user_content_for_message},
+                            {"role": "assistant", "content": assistant_content_for_message},
                         ],
                         "metadata": {
                             "session_id": session_id,

synth_ai/cli/traces.py CHANGED Viewed

@@ -11,7 +11,7 @@ from rich import box
 from rich.console import Console
 from rich.table import Table
-from synth_ai.cli._storage import load_storage
+from ._storage import load_storage
 def register(cli):

synth_ai/cli/train.py ADDED Viewed

@@ -0,0 +1,18 @@
+from __future__ import annotations
+from typing import Any
+from synth_ai.api.train.cli import register as _register
+from synth_ai.api.train.cli import train_command as _train_command
+__all__ = ["register", "train_command"]
+def register(cli: Any) -> None:
+    """Compatibility wrapper for the legacy train CLI location."""
+    _register(cli)
+def train_command(*args: Any, **kwargs: Any) -> Any:
+    return _train_command(*args, **kwargs)

synth-ai 0.2.14__py3-none-any.whl → 0.2.16__py3-none-any.whl

Potentially problematic release.

synth-ai 0.2.14py3-none-any.whl → 0.2.16py3-none-any.whl