PyPI - braintrust - Versions diffs - 0.3.15__py3-none-any.whl → 0.4.1__py3-none-any.whl - Mend

braintrust 0.3.15py3-none-any.whl → 0.4.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (82) hide show

braintrust/_generated_types.py +737 -672
braintrust/audit.py +2 -2
braintrust/bt_json.py +178 -19
braintrust/cli/eval.py +6 -7
braintrust/cli/push.py +11 -11
braintrust/context.py +12 -17
braintrust/contrib/temporal/__init__.py +16 -27
braintrust/contrib/temporal/test_temporal.py +8 -3
braintrust/devserver/auth.py +8 -8
braintrust/devserver/cache.py +3 -4
braintrust/devserver/cors.py +8 -7
braintrust/devserver/dataset.py +3 -5
braintrust/devserver/eval_hooks.py +7 -6
braintrust/devserver/schemas.py +22 -19
braintrust/devserver/server.py +19 -12
braintrust/devserver/test_cached_login.py +4 -4
braintrust/framework.py +139 -142
braintrust/framework2.py +88 -87
braintrust/functions/invoke.py +66 -59
braintrust/functions/stream.py +3 -2
braintrust/generated_types.py +3 -1
braintrust/git_fields.py +11 -11
braintrust/gitutil.py +2 -3
braintrust/graph_util.py +10 -10
braintrust/id_gen.py +2 -2
braintrust/logger.py +373 -471
braintrust/merge_row_batch.py +10 -9
braintrust/oai.py +21 -20
braintrust/otel/__init__.py +49 -49
braintrust/otel/context.py +16 -30
braintrust/otel/test_distributed_tracing.py +14 -11
braintrust/otel/test_otel_bt_integration.py +32 -31
braintrust/parameters.py +8 -8
braintrust/prompt.py +14 -14
braintrust/prompt_cache/disk_cache.py +5 -4
braintrust/prompt_cache/lru_cache.py +3 -2
braintrust/prompt_cache/prompt_cache.py +13 -14
braintrust/queue.py +4 -4
braintrust/score.py +4 -4
braintrust/serializable_data_class.py +4 -4
braintrust/span_identifier_v1.py +1 -2
braintrust/span_identifier_v2.py +3 -4
braintrust/span_identifier_v3.py +23 -20
braintrust/span_identifier_v4.py +34 -25
braintrust/test_bt_json.py +644 -0
braintrust/test_framework.py +72 -6
braintrust/test_helpers.py +5 -5
braintrust/test_id_gen.py +2 -3
braintrust/test_logger.py +211 -107
braintrust/test_otel.py +61 -53
braintrust/test_queue.py +0 -1
braintrust/test_score.py +1 -3
braintrust/test_span_components.py +29 -44
braintrust/util.py +9 -8
braintrust/version.py +2 -2
braintrust/wrappers/_anthropic_utils.py +4 -4
braintrust/wrappers/agno/__init__.py +3 -4
braintrust/wrappers/agno/agent.py +1 -2
braintrust/wrappers/agno/function_call.py +1 -2
braintrust/wrappers/agno/model.py +1 -2
braintrust/wrappers/agno/team.py +1 -2
braintrust/wrappers/agno/utils.py +12 -12
braintrust/wrappers/anthropic.py +7 -8
braintrust/wrappers/claude_agent_sdk/__init__.py +3 -4
braintrust/wrappers/claude_agent_sdk/_wrapper.py +29 -27
braintrust/wrappers/dspy.py +15 -17
braintrust/wrappers/google_genai/__init__.py +17 -30
braintrust/wrappers/langchain.py +22 -24
braintrust/wrappers/litellm.py +4 -3
braintrust/wrappers/openai.py +15 -15
braintrust/wrappers/pydantic_ai.py +225 -110
braintrust/wrappers/test_agno.py +0 -1
braintrust/wrappers/test_dspy.py +0 -1
braintrust/wrappers/test_google_genai.py +64 -4
braintrust/wrappers/test_litellm.py +0 -1
braintrust/wrappers/test_pydantic_ai_integration.py +819 -22
{braintrust-0.3.15.dist-info → braintrust-0.4.1.dist-info}/METADATA +3 -2
braintrust-0.4.1.dist-info/RECORD +121 -0
braintrust-0.3.15.dist-info/RECORD +0 -120
{braintrust-0.3.15.dist-info → braintrust-0.4.1.dist-info}/WHEEL +0 -0
{braintrust-0.3.15.dist-info → braintrust-0.4.1.dist-info}/entry_points.txt +0 -0
{braintrust-0.3.15.dist-info → braintrust-0.4.1.dist-info}/top_level.txt +0 -0

braintrust/logger.py CHANGED Viewed

@@ -9,7 +9,6 @@ import inspect
 import io
 import json
 import logging
-import math
 import os
 import sys
 import textwrap
@@ -19,24 +18,16 @@ import traceback
 import types
 import uuid
 from abc import ABC, abstractmethod
+from collections.abc import Callable, Iterator, Mapping, MutableMapping, Sequence
 from functools import partial, wraps
 from multiprocessing import cpu_count
 from types import TracebackType
 from typing import (
     Any,
-    Callable,
     Dict,
     Generic,
-    Iterator,
-    List,
     Literal,
-    Mapping,
-    MutableMapping,
     Optional,
-    Sequence,
-    Set,
-    Tuple,
-    Type,
     TypedDict,
     TypeVar,
     Union,
@@ -54,7 +45,7 @@ from requests.adapters import HTTPAdapter
 from urllib3.util.retry import Retry
 from . import context, id_gen
-from .bt_json import bt_dumps, bt_loads
+from .bt_json import bt_dumps, bt_safe_deep_copy
 from .db_fields import (
     ASYNC_SCORING_CONTROL_FIELD,
     AUDIT_METADATA_FIELD,
@@ -107,7 +98,7 @@ from .util import (
 REDACTION_FIELDS = ["input", "output", "expected", "metadata", "context", "scores", "metrics"]
 from .xact_ids import prettify_xact
-Metadata = Dict[str, Any]
+Metadata = dict[str, Any]
 DATA_API_VERSION = 2
 T = TypeVar("T")
@@ -161,12 +152,12 @@ class Span(Exportable, contextlib.AbstractContextManager, ABC):
     @abstractmethod
     def start_span(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
         **event: Any,
     ) -> "Span":
         """Create a new span. This is useful if you want to log more detailed trace information beyond the scope of a single log event. Data logged over several calls to `Span.log` will be merged into one logical row.
@@ -224,7 +215,7 @@ class Span(Exportable, contextlib.AbstractContextManager, ABC):
         """
     @abstractmethod
-    def end(self, end_time: Optional[float] = None) -> float:
+    def end(self, end_time: float | None = None) -> float:
         """Log an end time to the span (defaults to the current time). Returns the logged time.
         Will be invoked automatically if the span is bound to a context manager.
@@ -238,15 +229,15 @@ class Span(Exportable, contextlib.AbstractContextManager, ABC):
         """Flush any pending rows to the server."""
     @abstractmethod
-    def close(self, end_time: Optional[float] = None) -> float:
+    def close(self, end_time: float | None = None) -> float:
         """Alias for `end`."""
     @abstractmethod
     def set_attributes(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
     ) -> None:
         """Set the span's name, type, or other attributes. These attributes will be attached to all log events within the span.
         The attributes are equivalent to the arguments to start_span.
@@ -279,6 +270,10 @@ class _NoopSpan(Span):
     def id(self):
         return ""
+    @property
+    def propagated_event(self):
+        return None
     def log(self, **event: Any):
         pass
@@ -287,17 +282,17 @@ class _NoopSpan(Span):
     def start_span(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
         **event: Any,
     ):
         return self
-    def end(self, end_time: Optional[float] = None) -> float:
+    def end(self, end_time: float | None = None) -> float:
         return end_time or time.time()
     def export(self):
@@ -312,14 +307,14 @@ class _NoopSpan(Span):
     def flush(self):
         pass
-    def close(self, end_time: Optional[float] = None) -> float:
+    def close(self, end_time: float | None = None) -> float:
         return self.end(end_time)
     def set_attributes(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
     ):
         pass
@@ -334,9 +329,9 @@ class _NoopSpan(Span):
     def __exit__(
         self,
-        exc_type: Optional[Type[BaseException]],
-        exc_value: Optional[BaseException],
-        traceback: Optional[TracebackType],
+        exc_type: type[BaseException] | None,
+        exc_value: BaseException | None,
+        traceback: TracebackType | None,
     ):
         pass
@@ -348,11 +343,11 @@ NOOP_SPAN_PERMALINK = "https://www.braintrust.dev/noop-span"
 class BraintrustState:
     def __init__(self):
         self.id = str(uuid.uuid4())
-        self.current_experiment: Optional[Experiment] = None
-        self.current_logger: contextvars.ContextVar[Optional[Logger]] = contextvars.ContextVar(
+        self.current_experiment: Experiment | None = None
+        self.current_logger: contextvars.ContextVar[Logger | None] = contextvars.ContextVar(
             "braintrust_current_logger", default=None
         )
-        self.current_parent: contextvars.ContextVar[Optional[str]] = contextvars.ContextVar(
+        self.current_parent: contextvars.ContextVar[str | None] = contextvars.ContextVar(
             "braintrust_current_parent", default=None
         )
         self.current_span: contextvars.ContextVar[Span] = contextvars.ContextVar(
@@ -402,20 +397,20 @@ class BraintrustState:
         )
     def reset_login_info(self):
-        self.app_url: Optional[str] = None
-        self.app_public_url: Optional[str] = None
-        self.login_token: Optional[str] = None
-        self.org_id: Optional[str] = None
-        self.org_name: Optional[str] = None
-        self.api_url: Optional[str] = None
-        self.proxy_url: Optional[str] = None
+        self.app_url: str | None = None
+        self.app_public_url: str | None = None
+        self.login_token: str | None = None
+        self.org_id: str | None = None
+        self.org_name: str | None = None
+        self.api_url: str | None = None
+        self.proxy_url: str | None = None
         self.logged_in: bool = False
-        self.git_metadata_settings: Optional[GitMetadataSettings] = None
+        self.git_metadata_settings: GitMetadataSettings | None = None
-        self._app_conn: Optional[HTTPConnection] = None
-        self._api_conn: Optional[HTTPConnection] = None
-        self._proxy_conn: Optional[HTTPConnection] = None
-        self._user_info: Optional[Mapping[str, Any]] = None
+        self._app_conn: HTTPConnection | None = None
+        self._api_conn: HTTPConnection | None = None
+        self._proxy_conn: HTTPConnection | None = None
+        self._user_info: Mapping[str, Any] | None = None
     def reset_parent_state(self):
         # reset possible parent state for tests
@@ -480,9 +475,9 @@ class BraintrustState:
     def login(
         self,
-        app_url: Optional[str] = None,
-        api_key: Optional[str] = None,
-        org_name: Optional[str] = None,
+        app_url: str | None = None,
+        api_key: str | None = None,
+        org_name: str | None = None,
         force_login: bool = False,
     ) -> None:
         if not force_login and self.logged_in:
@@ -558,7 +553,7 @@ class BraintrustState:
         bg_logger = self._global_bg_logger.get()
         bg_logger.enforce_queue_size_limit(enforce)
-    def set_masking_function(self, masking_function: Optional[Callable[[Any], Any]]) -> None:
+    def set_masking_function(self, masking_function: Callable[[Any], Any] | None) -> None:
         """Set the masking function on the background logger."""
         self.global_bg_logger().set_masking_function(masking_function)
@@ -566,7 +561,7 @@ class BraintrustState:
 _state: BraintrustState = None  # type: ignore
-_http_adapter: Optional[HTTPAdapter] = None
+_http_adapter: HTTPAdapter | None = None
 def set_http_adapter(adapter: HTTPAdapter) -> None:
@@ -632,7 +627,7 @@ class RetryRequestExceptionsAdapter(HTTPAdapter):
 class HTTPConnection:
-    def __init__(self, base_url: str, adapter: Optional[HTTPAdapter] = None):
+    def __init__(self, base_url: str, adapter: HTTPAdapter | None = None):
         self.base_url = base_url
         self.token = None
         self.adapter = adapter
@@ -661,7 +656,7 @@ class HTTPConnection:
         self.token = token
         self._set_session_token()
-    def _set_adapter(self, adapter: Optional[HTTPAdapter]) -> None:
+    def _set_adapter(self, adapter: HTTPAdapter | None) -> None:
         self.adapter = adapter
     def _reset(self, **retry_kwargs: Any) -> None:
@@ -693,9 +688,7 @@ class HTTPConnection:
     def delete(self, path: str, *args: Any, **kwargs: Any) -> requests.Response:
         return self.session.delete(_urljoin(self.base_url, path), *args, **kwargs)
-    def get_json(
-        self, object_type: str, args: Optional[Mapping[str, Any]] = None, retries: int = 0
-    ) -> Mapping[str, Any]:
+    def get_json(self, object_type: str, args: Mapping[str, Any] | None = None, retries: int = 0) -> Mapping[str, Any]:
         tries = retries + 1
         for i in range(tries):
             resp = self.get(f"/{object_type}", params=args)
@@ -708,7 +701,7 @@ class HTTPConnection:
         # Needed for type checking.
         raise Exception("unreachable")
-    def post_json(self, object_type: str, args: Optional[Mapping[str, Any]] = None) -> Any:
+    def post_json(self, object_type: str, args: Mapping[str, Any] | None = None) -> Any:
         resp = self.post(f"/{object_type.lstrip('/')}", json=args)
         response_raise_for_status(resp)
         return resp.json()
@@ -749,13 +742,6 @@ def construct_logs3_data(items: Sequence[str]):
     return '{"rows": ' + rowsS + ', "api_version": ' + str(DATA_API_VERSION) + "}"
-def _check_json_serializable(event):
-    try:
-        return bt_dumps(event)
-    except (TypeError, ValueError) as e:
-        raise Exception(f"All logged values must be JSON-serializable: {event}") from e
 class _MaskingError:
     """Internal class to signal masking errors that need special handling."""
@@ -792,11 +778,11 @@ def _apply_masking_to_field(masking_function: Callable[[Any], Any], data: Any, f
 class _BackgroundLogger(ABC):
     @abstractmethod
-    def log(self, *args: LazyValue[Dict[str, Any]]) -> None:
+    def log(self, *args: LazyValue[dict[str, Any]]) -> None:
         pass
     @abstractmethod
-    def flush(self, batch_size: Optional[int] = None):
+    def flush(self, batch_size: int | None = None):
         pass
@@ -804,21 +790,36 @@ class _MemoryBackgroundLogger(_BackgroundLogger):
     def __init__(self):
         self.lock = threading.Lock()
         self.logs = []
-        self.masking_function: Optional[Callable[[Any], Any]] = None
+        self.masking_function: Callable[[Any], Any] | None = None
+        self.upload_attempts: list[BaseAttachment] = []  # Track upload attempts
     def enforce_queue_size_limit(self, enforce: bool) -> None:
         pass
-    def log(self, *args: LazyValue[Dict[str, Any]]) -> None:
+    def log(self, *args: LazyValue[dict[str, Any]]) -> None:
         with self.lock:
             self.logs.extend(args)
-    def set_masking_function(self, masking_function: Optional[Callable[[Any], Any]]) -> None:
+    def set_masking_function(self, masking_function: Callable[[Any], Any] | None) -> None:
         """Set the masking function for the memory logger."""
         self.masking_function = masking_function
-    def flush(self, batch_size: Optional[int] = None):
-        pass
+    def flush(self, batch_size: int | None = None):
+        """Flush the memory logger, extracting attachments and tracking upload attempts."""
+        with self.lock:
+            if not self.logs:
+                return
+            # Unwrap lazy values and extract attachments
+            logs = [l.get() for l in self.logs]
+            # Extract attachments from all logs
+            attachments: list[BaseAttachment] = []
+            for log in logs:
+                _extract_attachments(log, attachments)
+            # Track upload attempts (don't actually call upload() in tests)
+            self.upload_attempts.extend(attachments)
     def pop(self):
         with self.lock:
@@ -871,7 +872,7 @@ BACKGROUND_LOGGER_BASE_SLEEP_TIME_S = 1.0
 class _HTTPBackgroundLogger:
     def __init__(self, api_conn: LazyValue[HTTPConnection]):
         self.api_conn = api_conn
-        self.masking_function: Optional[Callable[[Any], Any]] = None
+        self.masking_function: Callable[[Any], Any] | None = None
         self.outfile = sys.stderr
         self.flush_lock = threading.RLock()
@@ -934,7 +935,7 @@ class _HTTPBackgroundLogger:
         """
         self.queue.enforce_queue_size_limit(enforce)
-    def log(self, *args: LazyValue[Dict[str, Any]]) -> None:
+    def log(self, *args: LazyValue[dict[str, Any]]) -> None:
         self._start()
         dropped_items = []
         for event in args:
@@ -981,7 +982,7 @@ class _HTTPBackgroundLogger:
                     else:
                         raise
-    def flush(self, batch_size: Optional[int] = None):
+    def flush(self, batch_size: int | None = None):
         if batch_size is None:
             batch_size = self.default_batch_size
@@ -1020,7 +1021,7 @@ class _HTTPBackgroundLogger:
                         f"Encountered the following errors while logging:", post_promise_exceptions
                     )
-            attachment_errors: List[Exception] = []
+            attachment_errors: list[Exception] = []
             for attachment in attachments:
                 try:
                     result = attachment.upload()
@@ -1038,8 +1039,8 @@ class _HTTPBackgroundLogger:
                 )
     def _unwrap_lazy_values(
-        self, wrapped_items: Sequence[LazyValue[Dict[str, Any]]]
-    ) -> Tuple[List[List[Dict[str, Any]]], List["BaseAttachment"]]:
+        self, wrapped_items: Sequence[LazyValue[dict[str, Any]]]
+    ) -> tuple[list[list[dict[str, Any]]], list["BaseAttachment"]]:
         for i in range(self.num_tries):
             try:
                 unwrapped_items = [item.get() for item in wrapped_items]
@@ -1069,7 +1070,7 @@ class _HTTPBackgroundLogger:
                             batched_items[batch_idx][item_idx] = masked_item
-                attachments: List["BaseAttachment"] = []
+                attachments: list["BaseAttachment"] = []
                 for batch in batched_items:
                     for item in batch:
                         _extract_attachments(item, attachments)
@@ -1179,7 +1180,7 @@ class _HTTPBackgroundLogger:
     def internal_replace_api_conn(self, api_conn: HTTPConnection):
         self.api_conn = LazyValue(lambda: api_conn, use_mutex=False)
-    def set_masking_function(self, masking_function: Optional[Callable[[Any], Any]]):
+    def set_masking_function(self, masking_function: Callable[[Any], Any] | None):
         """Set or update the masking function."""
         self.masking_function = masking_function
@@ -1221,7 +1222,7 @@ def _internal_with_memory_background_logger():
 class ObjectMetadata:
     id: str
     name: str
-    full_info: Dict[str, Any]
+    full_info: dict[str, Any]
 @dataclasses.dataclass
@@ -1250,69 +1251,69 @@ class OrgProjectMetadata:
 # this.
 @overload
 def init(
-    project: Optional[str] = ...,
-    experiment: Optional[str] = ...,
-    description: Optional[str] = ...,
+    project: str | None = ...,
+    experiment: str | None = ...,
+    description: str | None = ...,
     dataset: Optional["Dataset"] = ...,
     open: Literal[False] = ...,
-    base_experiment: Optional[str] = ...,
+    base_experiment: str | None = ...,
     is_public: bool = ...,
-    app_url: Optional[str] = ...,
-    api_key: Optional[str] = ...,
-    org_name: Optional[str] = ...,
-    metadata: Optional[Metadata] = ...,
-    git_metadata_settings: Optional[GitMetadataSettings] = ...,
+    app_url: str | None = ...,
+    api_key: str | None = ...,
+    org_name: str | None = ...,
+    metadata: Metadata | None = ...,
+    git_metadata_settings: GitMetadataSettings | None = ...,
     set_current: bool = ...,
-    update: Optional[bool] = ...,
-    project_id: Optional[str] = ...,
-    base_experiment_id: Optional[str] = ...,
-    repo_info: Optional[RepoInfo] = ...,
-    state: Optional[BraintrustState] = ...,
+    update: bool | None = ...,
+    project_id: str | None = ...,
+    base_experiment_id: str | None = ...,
+    repo_info: RepoInfo | None = ...,
+    state: BraintrustState | None = ...,
 ) -> "Experiment": ...
 @overload
 def init(
-    project: Optional[str] = ...,
-    experiment: Optional[str] = ...,
-    description: Optional[str] = ...,
+    project: str | None = ...,
+    experiment: str | None = ...,
+    description: str | None = ...,
     dataset: Optional["Dataset"] = ...,
     open: Literal[True] = ...,
-    base_experiment: Optional[str] = ...,
+    base_experiment: str | None = ...,
     is_public: bool = ...,
-    app_url: Optional[str] = ...,
-    api_key: Optional[str] = ...,
-    org_name: Optional[str] = ...,
-    metadata: Optional[Metadata] = ...,
-    git_metadata_settings: Optional[GitMetadataSettings] = ...,
+    app_url: str | None = ...,
+    api_key: str | None = ...,
+    org_name: str | None = ...,
+    metadata: Metadata | None = ...,
+    git_metadata_settings: GitMetadataSettings | None = ...,
     set_current: bool = ...,
-    update: Optional[bool] = ...,
-    project_id: Optional[str] = ...,
-    base_experiment_id: Optional[str] = ...,
-    repo_info: Optional[RepoInfo] = ...,
-    state: Optional[BraintrustState] = ...,
+    update: bool | None = ...,
+    project_id: str | None = ...,
+    base_experiment_id: str | None = ...,
+    repo_info: RepoInfo | None = ...,
+    state: BraintrustState | None = ...,
 ) -> "ReadonlyExperiment": ...
 def init(
-    project: Optional[str] = None,
-    experiment: Optional[str] = None,
-    description: Optional[str] = None,
+    project: str | None = None,
+    experiment: str | None = None,
+    description: str | None = None,
     dataset: Optional["Dataset"] = None,
     open: bool = False,
-    base_experiment: Optional[str] = None,
+    base_experiment: str | None = None,
     is_public: bool = False,
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
-    metadata: Optional[Metadata] = None,
-    git_metadata_settings: Optional[GitMetadataSettings] = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
+    metadata: Metadata | None = None,
+    git_metadata_settings: GitMetadataSettings | None = None,
     set_current: bool = True,
-    update: Optional[bool] = None,
-    project_id: Optional[str] = None,
-    base_experiment_id: Optional[str] = None,
-    repo_info: Optional[RepoInfo] = None,
-    state: Optional[BraintrustState] = None,
+    update: bool | None = None,
+    project_id: str | None = None,
+    base_experiment_id: str | None = None,
+    repo_info: RepoInfo | None = None,
+    state: BraintrustState | None = None,
 ) -> Union["Experiment", "ReadonlyExperiment"]:
     """
     Log in, and then initialize a new experiment in a specified project. If the project does not exist, it will be created.
@@ -1460,18 +1461,18 @@ def init_experiment(*args, **kwargs) -> Union["Experiment", "ReadonlyExperiment"
 def init_dataset(
-    project: Optional[str] = None,
-    name: Optional[str] = None,
-    description: Optional[str] = None,
-    version: Optional[Union[str, int]] = None,
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
-    project_id: Optional[str] = None,
-    metadata: Optional[Metadata] = None,
+    project: str | None = None,
+    name: str | None = None,
+    description: str | None = None,
+    version: str | int | None = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
+    project_id: str | None = None,
+    metadata: Metadata | None = None,
     use_output: bool = DEFAULT_IS_LEGACY_DATASET,
-    _internal_btql: Optional[Dict[str, Any]] = None,
-    state: Optional[BraintrustState] = None,
+    _internal_btql: dict[str, Any] | None = None,
+    state: BraintrustState | None = None,
 ) -> "Dataset":
     """
     Create a new dataset in a specified project. If the project does not exist, it will be created.
@@ -1519,7 +1520,7 @@ def init_dataset(
     )
-def _compute_logger_metadata(project_name: Optional[str] = None, project_id: Optional[str] = None):
+def _compute_logger_metadata(project_name: str | None = None, project_id: str | None = None):
     login()
     org_id = _state.org_id
     if project_id is None:
@@ -1547,15 +1548,15 @@ def _compute_logger_metadata(project_name: Optional[str] = None, project_id: Opt
 def init_logger(
-    project: Optional[str] = None,
-    project_id: Optional[str] = None,
+    project: str | None = None,
+    project_id: str | None = None,
     async_flush: bool = True,
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
     force_login: bool = False,
     set_current: bool = True,
-    state: Optional[BraintrustState] = None,
+    state: BraintrustState | None = None,
 ) -> "Logger":
     """
     Create a new logger in a specified project. If the project does not exist, it will be created.
@@ -1604,17 +1605,17 @@ def init_logger(
 def load_prompt(
-    project: Optional[str] = None,
-    slug: Optional[str] = None,
-    version: Optional[Union[str, int]] = None,
-    project_id: Optional[str] = None,
-    id: Optional[str] = None,
-    defaults: Optional[Mapping[str, Any]] = None,
+    project: str | None = None,
+    slug: str | None = None,
+    version: str | int | None = None,
+    project_id: str | None = None,
+    id: str | None = None,
+    defaults: Mapping[str, Any] | None = None,
     no_trace: bool = False,
-    environment: Optional[str] = None,
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
+    environment: str | None = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
 ) -> "Prompt":
     """
     Loads a prompt from the specified project.
@@ -1737,9 +1738,9 @@ login_lock = threading.RLock()
 def login(
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
     force_login: bool = False,
 ) -> None:
     """
@@ -1763,9 +1764,9 @@ def login(
 def login_to_state(
-    app_url: Optional[str] = None,
-    api_key: Optional[str] = None,
-    org_name: Optional[str] = None,
+    app_url: str | None = None,
+    api_key: str | None = None,
+    org_name: str | None = None,
 ) -> BraintrustState:
     app_url = _get_app_url(app_url)
@@ -1845,7 +1846,7 @@ def login_to_state(
     return state
-def set_masking_function(masking_function: Optional[Callable[[Any], Any]]) -> None:
+def set_masking_function(masking_function: Callable[[Any], Any] | None) -> None:
     """
     Set a global masking function that will be applied to all logged data before sending to Braintrust.
     The masking function will be applied after records are merged but before they are sent to the backend.
@@ -1872,7 +1873,7 @@ def log(**event: Any) -> str:
     return e.log(**event)
-def summarize(summarize_scores: bool = True, comparison_experiment_id: Optional[str] = None) -> "ExperimentSummary":
+def summarize(summarize_scores: bool = True, comparison_experiment_id: str | None = None) -> "ExperimentSummary":
     """
     Summarize the current experiment, including the scores (compared to the closest reference experiment) and metadata.
@@ -1918,7 +1919,7 @@ def current_span() -> Span:
 @contextlib.contextmanager
-def parent_context(parent: Optional[str], state: Optional[BraintrustState] = None):
+def parent_context(parent: str | None, state: BraintrustState | None = None):
     """
     Context manager to temporarily set the parent context for spans.
@@ -1940,7 +1941,7 @@ def parent_context(parent: Optional[str], state: Optional[BraintrustState] = Non
 def get_span_parent_object(
-    parent: Optional[str] = None, state: Optional[BraintrustState] = None
+    parent: str | None = None, state: BraintrustState | None = None
 ) -> Union[SpanComponentsV4, "Logger", "Experiment", Span]:
     """Mainly for internal use. Return the parent object for starting a span in a global context.
     Applies precedence: current span > propagated parent string > experiment > logger."""
@@ -1969,24 +1970,14 @@ def get_span_parent_object(
 def _try_log_input(span, f_sig, f_args, f_kwargs):
     if f_sig:
-        bound_args = f_sig.bind(*f_args, **f_kwargs).arguments
-        input_serializable = bound_args
+        input_data = f_sig.bind(*f_args, **f_kwargs).arguments
     else:
-        input_serializable = dict(args=f_args, kwargs=f_kwargs)
-    try:
-        _check_json_serializable(input_serializable)
-    except Exception as e:
-        input_serializable = "<input not json-serializable>: " + str(e)
-    span.log(input=input_serializable)
+        input_data = dict(args=f_args, kwargs=f_kwargs)
+    span.log(input=input_data)
 def _try_log_output(span, output):
-    output_serializable = output
-    try:
-        _check_json_serializable(output)
-    except Exception as e:
-        output_serializable = "<output not json-serializable>: " + str(e)
-    span.log(output=output_serializable)
+    span.log(output=output)
 F = TypeVar("F", bound=Callable[..., Any])
@@ -2155,14 +2146,14 @@ def traced(*span_args: Any, **span_kwargs: Any) -> Callable[[F], F]:
 def start_span(
-    name: Optional[str] = None,
-    type: Optional[SpanTypeAttribute] = None,
-    span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-    start_time: Optional[float] = None,
-    set_current: Optional[bool] = None,
-    parent: Optional[str] = None,
-    propagated_event: Optional[Dict[str, Any]] = None,
-    state: Optional[BraintrustState] = None,
+    name: str | None = None,
+    type: SpanTypeAttribute | None = None,
+    span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+    start_time: float | None = None,
+    set_current: bool | None = None,
+    parent: str | None = None,
+    propagated_event: dict[str, Any] | None = None,
+    state: BraintrustState | None = None,
     **event: Any,
 ) -> Span:
     """Lower-level alternative to `@traced` for starting a span at the toplevel. It creates a span under the first active object (using the same precedence order as `@traced`), or if `parent` is specified, under the specified parent row, or returns a no-op span object.
@@ -2265,7 +2256,7 @@ def validate_tags(tags: Sequence[str]) -> None:
         seen.add(tag)
-def _extract_attachments(event: Dict[str, Any], attachments: List["BaseAttachment"]) -> None:
+def _extract_attachments(event: dict[str, Any], attachments: list["BaseAttachment"]) -> None:
     """
     Helper function for uploading attachments. Recursively extracts `Attachment`
     and `ExternalAttachment` values and replaces them with their associated
@@ -2282,13 +2273,13 @@ def _extract_attachments(event: Dict[str, Any], attachments: List["BaseAttachmen
             return v.reference  # Attachment cannot be nested.
         # Recursive case: object.
-        if isinstance(v, Dict):
+        if isinstance(v, dict):
             for k, v2 in v.items():
                 v[k] = _helper(v2)
             return v
         # Recursive case: array.
-        if isinstance(v, List):
+        if isinstance(v, list):
             for i in range(len(v)):
                 v[i] = _helper(v[i])
             return v
@@ -2308,7 +2299,7 @@ def _enrich_attachments(event: TMutableMapping) -> TMutableMapping:
     """
     def _helper(v: Any) -> Any:
-        if isinstance(v, Dict):
+        if isinstance(v, dict):
             # Base case: AttachmentReference.
             if v.get("type") == "braintrust_attachment" or v.get("type") == "external_attachment":
                 return ReadonlyAttachment(cast(AttachmentReference, v))
@@ -2319,7 +2310,7 @@ def _enrich_attachments(event: TMutableMapping) -> TMutableMapping:
                 return v
         # Recursive case: array.
-        if isinstance(v, List):
+        if isinstance(v, list):
             for i in range(len(v)):
                 v[i] = _helper(v[i])
             return v
@@ -2333,7 +2324,7 @@ def _enrich_attachments(event: TMutableMapping) -> TMutableMapping:
     return event
-def _validate_and_sanitize_experiment_log_partial_args(event: Mapping[str, Any]) -> Dict[str, Any]:
+def _validate_and_sanitize_experiment_log_partial_args(event: Mapping[str, Any]) -> dict[str, Any]:
     # Make sure only certain keys are specified.
     forbidden_keys = set(event.keys()) - {
         "input",
@@ -2436,91 +2427,6 @@ def _validate_and_sanitize_experiment_log_full_args(event: Mapping[str, Any], ha
     return event
-def _deep_copy_event(event: Mapping[str, Any]) -> Dict[str, Any]:
-    """
-    Creates a deep copy of the given event. Replaces references to user objects
-    with placeholder strings to ensure serializability, except for `Attachment`
-    and `ExternalAttachment` objects, which are preserved and not deep-copied.
-    Handles circular references and excessive nesting depth to prevent
-    RecursionError during serialization.
-    """
-    # Maximum depth to prevent hitting Python's recursion limit
-    # Python's default limit is ~1000, we use a conservative limit
-    # to account for existing call stack usage from pytest, application code, etc.
-    MAX_DEPTH = 200
-    # Track visited objects to detect circular references
-    visited: set[int] = set()
-    def _deep_copy_object(v: Any, depth: int = 0) -> Any:
-        # Check depth limit - use >= to stop before exceeding
-        if depth >= MAX_DEPTH:
-            return "<max depth exceeded>"
-        # Check for circular references in mutable containers
-        # Use id() to track object identity
-        if isinstance(v, (Mapping, List, Tuple, Set)):
-            obj_id = id(v)
-            if obj_id in visited:
-                return "<circular reference>"
-            visited.add(obj_id)
-            try:
-                if isinstance(v, Mapping):
-                    # Prevent dict keys from holding references to user data. Note that
-                    # `bt_json` already coerces keys to string, a behavior that comes from
-                    # `json.dumps`. However, that runs at log upload time, while we want to
-                    # cut out all the references to user objects synchronously in this
-                    # function.
-                    result = {}
-                    for k in v:
-                        try:
-                            key_str = str(k)
-                        except Exception:
-                            # If str() fails on the key, use a fallback representation
-                            key_str = f"<non-stringifiable-key: {type(k).__name__}>"
-                        result[key_str] = _deep_copy_object(v[k], depth + 1)
-                    return result
-                elif isinstance(v, (List, Tuple, Set)):
-                    return [_deep_copy_object(x, depth + 1) for x in v]
-            finally:
-                # Remove from visited set after processing to allow the same object
-                # to appear in different branches of the tree
-                visited.discard(obj_id)
-        if isinstance(v, Span):
-            return "<span>"
-        elif isinstance(v, Experiment):
-            return "<experiment>"
-        elif isinstance(v, Dataset):
-            return "<dataset>"
-        elif isinstance(v, Logger):
-            return "<logger>"
-        elif isinstance(v, BaseAttachment):
-            return v
-        elif isinstance(v, ReadonlyAttachment):
-            return v.reference
-        elif isinstance(v, float):
-            # Handle NaN and Infinity for JSON compatibility
-            if math.isnan(v):
-                return "NaN"
-            elif math.isinf(v):
-                return "Infinity" if v > 0 else "-Infinity"
-            return v
-        elif isinstance(v, (int, str, bool)) or v is None:
-            # Skip roundtrip for primitive types.
-            return v
-        else:
-            # Note: we avoid using copy.deepcopy, because it's difficult to
-            # guarantee the independence of such copied types from their origin.
-            # E.g. the original type could have a `__del__` method that alters
-            # some shared internal state, and we need this deep copy to be
-            # fully-independent from the original.
-            return bt_loads(bt_dumps(v))
-    return _deep_copy_object(event)
 class ObjectIterator(Generic[T]):
     def __init__(self, refetch_fn: Callable[[], Sequence[T]]):
         self.refetch_fn = refetch_fn
@@ -2547,9 +2453,9 @@ class ObjectFetcher(ABC, Generic[TMapping]):
     def __init__(
         self,
         object_type: str,
-        pinned_version: Union[None, int, str] = None,
-        mutate_record: Optional[Callable[[TMapping], TMapping]] = None,
-        _internal_btql: Optional[Dict[str, Any]] = None,
+        pinned_version: None | int | str = None,
+        mutate_record: Callable[[TMapping], TMapping] | None = None,
+        _internal_btql: dict[str, Any] | None = None,
     ):
         self.object_type = object_type
@@ -2563,10 +2469,10 @@ class ObjectFetcher(ABC, Generic[TMapping]):
         self._pinned_version = str(pinned_version) if pinned_version is not None else None
         self._mutate_record = mutate_record
-        self._fetched_data: Optional[List[TMapping]] = None
+        self._fetched_data: list[TMapping] | None = None
         self._internal_btql = _internal_btql
-    def fetch(self, batch_size: Optional[int] = None) -> Iterator[TMapping]:
+    def fetch(self, batch_size: int | None = None) -> Iterator[TMapping]:
         """
         Fetch all records.
@@ -2601,7 +2507,7 @@ class ObjectFetcher(ABC, Generic[TMapping]):
     @abstractmethod
     def id(self) -> str: ...
-    def _refetch(self, batch_size: Optional[int] = None) -> List[TMapping]:
+    def _refetch(self, batch_size: int | None = None) -> list[TMapping]:
         state = self._get_state()
         limit = batch_size if batch_size is not None else DEFAULT_FETCH_BATCH_SIZE
         if self._fetched_data is None:
@@ -2642,7 +2548,7 @@ class ObjectFetcher(ABC, Generic[TMapping]):
                 )
                 response_raise_for_status(resp)
                 resp_json = resp.json()
-                data = (data or []) + cast(List[TMapping], resp_json["data"])
+                data = (data or []) + cast(list[TMapping], resp_json["data"])
                 if not resp_json.get("cursor", None):
                     break
                 cursor = resp_json.get("cursor", None)
@@ -2699,7 +2605,7 @@ class Attachment(BaseAttachment):
     def __init__(
         self,
         *,
-        data: Union[str, bytes, bytearray],
+        data: str | bytes | bytearray,
         filename: str,
         content_type: str,
     ):
@@ -2770,7 +2676,7 @@ class Attachment(BaseAttachment):
             try:
                 data = self._data.get()
             except Exception as e:
-                raise IOError(f"Failed to read file: {e}") from e
+                raise OSError(f"Failed to read file: {e}") from e
             signed_url = metadata.get("signedUrl")
             headers = metadata.get("headers")
@@ -2823,7 +2729,7 @@ class Attachment(BaseAttachment):
         return LazyValue(error_wrapper, use_mutex=True)
-    def _init_data(self, data: Union[str, bytes, bytearray]) -> LazyValue[bytes]:
+    def _init_data(self, data: str | bytes | bytearray) -> LazyValue[bytes]:
         if isinstance(data, str):
             self._ensure_file_readable(data)
@@ -3041,11 +2947,11 @@ def _log_feedback_impl(
     parent_object_type: SpanObjectTypeV3,
     parent_object_id: LazyValue[str],
     id: str,
-    scores: Optional[Mapping[str, Union[int, float]]] = None,
-    expected: Optional[Any] = None,
-    tags: Optional[Sequence[str]] = None,
-    comment: Optional[str] = None,
-    metadata: Optional[Mapping[str, Any]] = None,
+    scores: Mapping[str, int | float] | None = None,
+    expected: Any | None = None,
+    tags: Sequence[str] | None = None,
+    comment: str | None = None,
+    metadata: Mapping[str, Any] | None = None,
     source: Literal["external", "app", "api", None] = None,
 ):
     if source is None:
@@ -3070,7 +2976,7 @@ def _log_feedback_impl(
     metadata = update_event.pop("metadata")
     update_event = {k: v for k, v in update_event.items() if v is not None}
-    update_event = _deep_copy_event(update_event)
+    update_event = bt_safe_deep_copy(update_event)
     def parent_ids():
         exporter = _get_exporter()
@@ -3126,7 +3032,7 @@ def _update_span_impl(
         event=event,
     )
-    update_event = _deep_copy_event(update_event)
+    update_event = bt_safe_deep_copy(update_event)
     def parent_ids():
         exporter = _get_exporter()
@@ -3185,13 +3091,13 @@ class SpanIds:
     span_id: str
     root_span_id: str
-    span_parents: Optional[List[str]]
+    span_parents: list[str] | None
 def _resolve_span_ids(
-    span_id: Optional[str],
-    root_span_id: Optional[str],
-    parent_span_ids: Optional[ParentSpanIds],
+    span_id: str | None,
+    root_span_id: str | None,
+    parent_span_ids: ParentSpanIds | None,
     lookup_span_parent: bool,
     id_generator: "id_gen.IDGenerator",
     context_manager: "context.ContextManager",
@@ -3265,7 +3171,7 @@ def span_components_to_object_id(components: SpanComponentsV4) -> str:
     return _span_components_to_object_id_lambda(components)()
-def permalink(slug: str, org_name: Optional[str] = None, app_url: Optional[str] = None) -> str:
+def permalink(slug: str, org_name: str | None = None, app_url: str | None = None) -> str:
     """
     Format a permalink to the Braintrust application for viewing the span represented by the provided `slug`.
@@ -3314,13 +3220,13 @@ def permalink(slug: str, org_name: Optional[str] = None, app_url: Optional[str]
 def _start_span_parent_args(
-    parent: Optional[str],
+    parent: str | None,
     parent_object_type: SpanObjectTypeV3,
     parent_object_id: LazyValue[str],
-    parent_compute_object_metadata_args: Optional[Dict[str, Any]],
-    parent_span_ids: Optional[ParentSpanIds],
-    propagated_event: Optional[Dict[str, Any]],
-) -> Dict[str, Any]:
+    parent_compute_object_metadata_args: dict[str, Any] | None,
+    parent_span_ids: ParentSpanIds | None,
+    propagated_event: dict[str, Any] | None,
+) -> dict[str, Any]:
     if parent:
         assert parent_span_ids is None, "Cannot specify both parent and parent_span_ids"
         parent_components = SpanComponentsV4.from_str(parent)
@@ -3374,9 +3280,9 @@ class _ExperimentDatasetEvent(TypedDict):
     id: str
     _xact_id: str
-    input: Optional[Any]
-    expected: Optional[Any]
-    tags: Optional[Sequence[str]]
+    input: Any | None
+    expected: Any | None
+    tags: Sequence[str] | None
 class ExperimentDatasetIterator:
@@ -3422,7 +3328,7 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
         self,
         lazy_metadata: LazyValue[ProjectExperimentMetadata],
         dataset: Optional["Dataset"] = None,
-        state: Optional[BraintrustState] = None,
+        state: BraintrustState | None = None,
     ):
         self._lazy_metadata = lazy_metadata
         self.dataset = dataset
@@ -3473,16 +3379,16 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
     def log(
         self,
-        input: Optional[Any] = None,
-        output: Optional[Any] = None,
-        expected: Optional[Any] = None,
-        error: Optional[str] = None,
-        tags: Optional[Sequence[str]] = None,
-        scores: Optional[Mapping[str, Union[int, float]]] = None,
-        metadata: Optional[Mapping[str, Any]] = None,
-        metrics: Optional[Mapping[str, Union[int, float]]] = None,
-        id: Optional[str] = None,
-        dataset_record_id: Optional[str] = None,
+        input: Any | None = None,
+        output: Any | None = None,
+        expected: Any | None = None,
+        error: str | None = None,
+        tags: Sequence[str] | None = None,
+        scores: Mapping[str, int | float] | None = None,
+        metadata: Mapping[str, Any] | None = None,
+        metrics: Mapping[str, int | float] | None = None,
+        id: str | None = None,
+        dataset_record_id: str | None = None,
         allow_concurrent_with_spans: bool = False,
     ) -> str:
         """
@@ -3527,11 +3433,11 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
     def log_feedback(
         self,
         id: str,
-        scores: Optional[Mapping[str, Union[int, float]]] = None,
-        expected: Optional[Any] = None,
-        tags: Optional[Sequence[str]] = None,
-        comment: Optional[str] = None,
-        metadata: Optional[Mapping[str, Any]] = None,
+        scores: Mapping[str, int | float] | None = None,
+        expected: Any | None = None,
+        tags: Sequence[str] | None = None,
+        comment: str | None = None,
+        metadata: Mapping[str, Any] | None = None,
         source: Literal["external", "app", "api", None] = None,
     ) -> None:
         """
@@ -3559,13 +3465,13 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
     def start_span(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
+        propagated_event: dict[str, Any] | None = None,
         **event: Any,
     ) -> Span:
         """Create a new toplevel span underneath the experiment. The name defaults to "root" and the span type to "eval".
@@ -3599,7 +3505,7 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
             **event,
         )
-    def fetch_base_experiment(self) -> Optional[ExperimentIdentifier]:
+    def fetch_base_experiment(self) -> ExperimentIdentifier | None:
         state = self._get_state()
         conn = state.app_conn()
@@ -3616,7 +3522,7 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
             return None
     def summarize(
-        self, summarize_scores: bool = True, comparison_experiment_id: Optional[str] = None
+        self, summarize_scores: bool = True, comparison_experiment_id: str | None = None
     ) -> "ExperimentSummary":
         """
         Summarize the experiment, including the scores (compared to the closest reference experiment) and metadata.
@@ -3703,13 +3609,13 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
     def _start_span_impl(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
+        propagated_event: dict[str, Any] | None = None,
         lookup_span_parent: bool = True,
         **event: Any,
     ) -> Span:
@@ -3739,9 +3645,9 @@ class Experiment(ObjectFetcher[ExperimentEvent], Exportable):
     def __exit__(
         self,
-        exc_type: Optional[Type[BaseException]],
-        exc_value: Optional[BaseException],
-        traceback: Optional[TracebackType],
+        exc_type: type[BaseException] | None,
+        exc_value: BaseException | None,
+        traceback: TracebackType | None,
     ) -> None:
         del exc_type, exc_value, traceback
@@ -3754,7 +3660,7 @@ class ReadonlyExperiment(ObjectFetcher[ExperimentEvent]):
     def __init__(
         self,
         lazy_metadata: LazyValue[ProjectExperimentMetadata],
-        state: Optional[BraintrustState] = None,
+        state: BraintrustState | None = None,
     ):
         self._lazy_metadata = lazy_metadata
         self.state = state or _state
@@ -3779,7 +3685,7 @@ class ReadonlyExperiment(ObjectFetcher[ExperimentEvent]):
         self._lazy_metadata.get()
         return self.state
-    def as_dataset(self, batch_size: Optional[int] = None) -> Iterator[_ExperimentDatasetEvent]:
+    def as_dataset(self, batch_size: int | None = None) -> Iterator[_ExperimentDatasetEvent]:
         """
         Return the experiment's data as a dataset iterator.
@@ -3805,19 +3711,19 @@ class SpanImpl(Span):
         self,
         parent_object_type: SpanObjectTypeV3,
         parent_object_id: LazyValue[str],
-        parent_compute_object_metadata_args: Optional[Dict[str, Any]],
-        parent_span_ids: Optional[ParentSpanIds],
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        default_root_type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        event: Optional[Dict[str, Any]] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
-        span_id: Optional[str] = None,
-        root_span_id: Optional[str] = None,
-        state: Optional[BraintrustState] = None,
+        parent_compute_object_metadata_args: dict[str, Any] | None,
+        parent_span_ids: ParentSpanIds | None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        default_root_type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        event: dict[str, Any] | None = None,
+        propagated_event: dict[str, Any] | None = None,
+        span_id: str | None = None,
+        root_span_id: str | None = None,
+        state: BraintrustState | None = None,
         lookup_span_parent: bool = True,
     ):
         if span_attributes is None:
@@ -3830,11 +3736,11 @@ class SpanImpl(Span):
         self.state = state or _state
         self.can_set_current = cast(bool, coalesce(set_current, True))
-        self._logged_end_time: Optional[float] = None
+        self._logged_end_time: float | None = None
         # Context token for proper cleanup - used by both OTEL and Braintrust context managers
         # This is set by the context manager when the span becomes active
-        self._context_token: Optional[Any] = None
+        self._context_token: Any | None = None
         self.parent_object_type = parent_object_type
         self.parent_object_id = parent_object_id
@@ -3867,7 +3773,7 @@ class SpanImpl(Span):
             _EXEC_COUNTER += 1
             exec_counter = _EXEC_COUNTER
-        internal_data: Dict[str, Any] = dict(
+        internal_data: dict[str, Any] = dict(
             metrics=dict(
                 start=start_time or time.time(),
             ),
@@ -3909,9 +3815,9 @@ class SpanImpl(Span):
     def set_attributes(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Mapping[str, Any]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: Mapping[str, Any] | None = None,
     ) -> None:
         self.log_internal(
             internal_data={
@@ -3929,9 +3835,7 @@ class SpanImpl(Span):
     def log(self, **event: Any) -> None:
         return self.log_internal(event=event, internal_data=None)
-    def log_internal(
-        self, event: Optional[Dict[str, Any]] = None, internal_data: Optional[Dict[str, Any]] = None
-    ) -> None:
+    def log_internal(self, event: dict[str, Any] | None = None, internal_data: dict[str, Any] | None = None) -> None:
         serializable_partial_record, lazy_partial_record = split_logging_data(event, internal_data)
         # We both check for serializability and round-trip `partial_record`
@@ -3939,7 +3843,7 @@ class SpanImpl(Span):
         # cutting out any reference to user objects when the object is logged
         # asynchronously, so that in case the objects are modified, the logging
         # is unaffected.
-        partial_record: Dict[str, Any] = dict(
+        partial_record: dict[str, Any] = dict(
             id=self.id,
             span_id=self.span_id,
             root_span_id=self.root_span_id,
@@ -3948,15 +3852,14 @@ class SpanImpl(Span):
             **{IS_MERGE_FIELD: self._is_merge},
         )
-        serializable_partial_record = _deep_copy_event(partial_record)
-        _check_json_serializable(serializable_partial_record)
+        serializable_partial_record = bt_safe_deep_copy(partial_record)
         if serializable_partial_record.get("metrics", {}).get("end") is not None:
             self._logged_end_time = serializable_partial_record["metrics"]["end"]
         if len(serializable_partial_record.get("tags", [])) > 0 and self.span_parents:
             raise Exception("Tags can only be logged to the root span")
-        def compute_record() -> Dict[str, Any]:
+        def compute_record() -> dict[str, Any]:
             exporter = _get_exporter()
             return dict(
                 **serializable_partial_record,
@@ -3979,13 +3882,13 @@ class SpanImpl(Span):
     def start_span(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
+        propagated_event: dict[str, Any] | None = None,
         **event: Any,
     ) -> Span:
         if parent:
@@ -4017,7 +3920,7 @@ class SpanImpl(Span):
             state=self.state,
         )
-    def end(self, end_time: Optional[float] = None) -> float:
+    def end(self, end_time: float | None = None) -> float:
         internal_data = {}
         if not self._logged_end_time:
             end_time = end_time or time.time()
@@ -4162,13 +4065,13 @@ class SpanImpl(Span):
 def log_exc_info_to_span(
-    span: Span, exc_type: Type[BaseException], exc_value: BaseException, tb: Optional[TracebackType]
+    span: Span, exc_type: type[BaseException], exc_value: BaseException, tb: TracebackType | None
 ) -> None:
     error = stringify_exception(exc_type, exc_value, tb)
     span.log(error=error)
-def stringify_exception(exc_type: Type[BaseException], exc_value: BaseException, tb: Optional[TracebackType]) -> str:
+def stringify_exception(exc_type: type[BaseException], exc_value: BaseException, tb: TracebackType | None) -> str:
     return "".join(
         traceback.format_exception_only(exc_type, exc_value)
         + ["\nTraceback (most recent call last):\n"]
@@ -4183,8 +4086,8 @@ def _strip_nones(d: T, deep: bool) -> T:
 def split_logging_data(
-    event: Optional[Dict[str, Any]], internal_data: Optional[Dict[str, Any]]
-) -> Tuple[Dict[str, Any], Dict[str, Any]]:
+    event: dict[str, Any] | None, internal_data: dict[str, Any] | None
+) -> tuple[dict[str, Any], dict[str, Any]]:
     # There should be no overlap between the dictionaries being merged,
     # except for `sanitized` and `internal_data`, where the former overrides
     # the latter.
@@ -4192,8 +4095,8 @@ def split_logging_data(
     sanitized_and_internal_data = _strip_nones(internal_data or {}, deep=True)
     merge_dicts(sanitized_and_internal_data, _strip_nones(sanitized, deep=False))
-    serializable_partial_record: Dict[str, Any] = {}
-    lazy_partial_record: Dict[str, Any] = {}
+    serializable_partial_record: dict[str, Any] = {}
+    lazy_partial_record: dict[str, Any] = {}
     for k, v in sanitized_and_internal_data.items():
         if isinstance(v, BraintrustStream):
             # Python has weird semantics with loop variables and lambda functions, so we
@@ -4220,10 +4123,10 @@ class Dataset(ObjectFetcher[DatasetEvent]):
     def __init__(
         self,
         lazy_metadata: LazyValue[ProjectDatasetMetadata],
-        version: Union[None, int, str] = None,
+        version: None | int | str = None,
         legacy: bool = DEFAULT_IS_LEGACY_DATASET,
-        _internal_btql: Optional[Dict[str, Any]] = None,
-        state: Optional[BraintrustState] = None,
+        _internal_btql: dict[str, Any] | None = None,
+        state: BraintrustState | None = None,
     ):
         if legacy:
             eprint(
@@ -4231,7 +4134,7 @@ class Dataset(ObjectFetcher[DatasetEvent]):
             )
         def mutate_record(r: DatasetEvent) -> DatasetEvent:
-            _enrich_attachments(cast(Dict[str, Any], r))
+            _enrich_attachments(cast(dict[str, Any], r))
             return ensure_dataset_record(r, legacy)
         self._lazy_metadata = lazy_metadata
@@ -4278,10 +4181,10 @@ class Dataset(ObjectFetcher[DatasetEvent]):
     def _validate_event(
         self,
-        metadata: Optional[Dict[str, Any]] = None,
-        expected: Optional[Any] = None,
-        output: Optional[Any] = None,
-        tags: Optional[Sequence[str]] = None,
+        metadata: dict[str, Any] | None = None,
+        expected: Any | None = None,
+        output: Any | None = None,
+        tags: Sequence[str] | None = None,
     ):
         if metadata is not None:
             if not isinstance(metadata, dict):
@@ -4298,7 +4201,7 @@ class Dataset(ObjectFetcher[DatasetEvent]):
     def _create_args(
         self, id, input=None, expected=None, metadata=None, tags=None, output=None, is_merge=False
-    ) -> LazyValue[Dict[str, Any]]:
+    ) -> LazyValue[dict[str, Any]]:
         expected_value = expected if expected is not None else output
         args = _populate_args(
@@ -4316,10 +4219,9 @@ class Dataset(ObjectFetcher[DatasetEvent]):
             args[IS_MERGE_FIELD] = True
             args = _filter_none_args(args)  # If merging, then remove None values to prevent null value writes
-        _check_json_serializable(args)
-        args = _deep_copy_event(args)
+        args = bt_safe_deep_copy(args)
-        def compute_args() -> Dict[str, Any]:
+        def compute_args() -> dict[str, Any]:
             return dict(
                 **args,
                 dataset_id=self.id,
@@ -4329,12 +4231,12 @@ class Dataset(ObjectFetcher[DatasetEvent]):
     def insert(
         self,
-        input: Optional[Any] = None,
-        expected: Optional[Any] = None,
-        tags: Optional[Sequence[str]] = None,
-        metadata: Optional[Dict[str, Any]] = None,
-        id: Optional[str] = None,
-        output: Optional[Any] = None,
+        input: Any | None = None,
+        expected: Any | None = None,
+        tags: Sequence[str] | None = None,
+        metadata: dict[str, Any] | None = None,
+        id: str | None = None,
+        output: Any | None = None,
     ) -> str:
         """
         Insert a single record to the dataset. The record will be batched and uploaded behind the scenes. If you pass in an `id`,
@@ -4373,10 +4275,10 @@ class Dataset(ObjectFetcher[DatasetEvent]):
     def update(
         self,
         id: str,
-        input: Optional[Any] = None,
-        expected: Optional[Any] = None,
-        tags: Optional[Sequence[str]] = None,
-        metadata: Optional[Dict[str, Any]] = None,
+        input: Any | None = None,
+        expected: Any | None = None,
+        tags: Sequence[str] | None = None,
+        metadata: dict[str, Any] | None = None,
     ) -> str:
         """
         Update fields of a single record in the dataset. The updated fields will be batched and uploaded behind the scenes.
@@ -4420,8 +4322,7 @@ class Dataset(ObjectFetcher[DatasetEvent]):
                 "_object_delete": True,  # XXX potentially place this in the logging endpoint
             },
         )
-        _check_json_serializable(partial_args)
-        partial_args = _deep_copy_event(partial_args)
+        partial_args = bt_safe_deep_copy(partial_args)
         def compute_args():
             return dict(
@@ -4488,7 +4389,7 @@ class Dataset(ObjectFetcher[DatasetEvent]):
 def render_message(render: Callable[[str], str], message: PromptMessage):
     base = {k: v for (k, v) in message.as_dict().items() if v is not None}
     # TODO: shouldn't load_prompt guarantee content is a PromptMessage?
-    content = cast(Union[str, List[Union[TextPart, ImagePart]], Dict[str, Any]], message.content)
+    content = cast(Union[str, list[Union[TextPart, ImagePart]], dict[str, Any]], message.content)
     if content is not None:
         if isinstance(content, str):
             base["content"] = render(content)
@@ -4552,7 +4453,7 @@ def render_message(render: Callable[[str], str], message: PromptMessage):
 def _create_custom_render():
-    def _get_key(key: str, scopes: List[Dict[str, Any]], warn: bool) -> Any:
+    def _get_key(key: str, scopes: list[dict[str, Any]], warn: bool) -> Any:
         thing = chevron.renderer._get_key(key, scopes, warn)  # type: ignore
         if isinstance(thing, str):
             return thing
@@ -4592,7 +4493,7 @@ def render_templated_object(obj: Any, args: Any) -> Any:
     return obj
-def render_prompt_params(params: Dict[str, Any], args: Any) -> Dict[str, Any]:
+def render_prompt_params(params: dict[str, Any], args: Any) -> dict[str, Any]:
     if not params:
         return params
@@ -4617,7 +4518,7 @@ def render_prompt_params(params: Dict[str, Any], args: Any) -> Dict[str, Any]:
     return {**params, "response_format": {**response_format, "json_schema": {**json_schema, "schema": parsed_schema}}}
-def render_mustache(template: str, data: Any, *, strict: bool = False, renderer: Optional[Callable[..., Any]] = None):
+def render_mustache(template: str, data: Any, *, strict: bool = False, renderer: Callable[..., Any] | None = None):
     if renderer is None:
         renderer = chevron.render
@@ -4694,7 +4595,7 @@ class Prompt:
         return self._lazy_metadata.get().slug
     @property
-    def prompt(self) -> Optional[PromptBlockData]:
+    def prompt(self) -> PromptBlockData | None:
         return self._lazy_metadata.get().prompt_data.prompt
     @property
@@ -4791,7 +4692,7 @@ class Prompt:
 class Project:
-    def __init__(self, name: Optional[str] = None, id: Optional[str] = None):
+    def __init__(self, name: str | None = None, id: str | None = None):
         self._name = name
         self._id = id
         self.init_lock = threading.RLock()
@@ -4831,9 +4732,9 @@ class Logger(Exportable):
         self,
         lazy_metadata: LazyValue[OrgProjectMetadata],
         async_flush: bool = True,
-        compute_metadata_args: Optional[Dict] = None,
-        link_args: Optional[Dict] = None,
-        state: Optional[BraintrustState] = None,
+        compute_metadata_args: dict | None = None,
+        link_args: dict | None = None,
+        state: BraintrustState | None = None,
     ):
         self._lazy_metadata = lazy_metadata
         self.async_flush = async_flush
@@ -4873,15 +4774,15 @@ class Logger(Exportable):
     def log(
         self,
-        input: Optional[Any] = None,
-        output: Optional[Any] = None,
-        expected: Optional[Any] = None,
-        error: Optional[str] = None,
-        tags: Optional[Sequence[str]] = None,
-        scores: Optional[Mapping[str, Union[int, float]]] = None,
-        metadata: Optional[Mapping[str, Any]] = None,
-        metrics: Optional[Mapping[str, Union[int, float]]] = None,
-        id: Optional[str] = None,
+        input: Any | None = None,
+        output: Any | None = None,
+        expected: Any | None = None,
+        error: str | None = None,
+        tags: Sequence[str] | None = None,
+        scores: Mapping[str, int | float] | None = None,
+        metadata: Mapping[str, Any] | None = None,
+        metrics: Mapping[str, int | float] | None = None,
+        id: str | None = None,
         allow_concurrent_with_spans: bool = False,
     ) -> str:
         """
@@ -4926,11 +4827,11 @@ class Logger(Exportable):
     def log_feedback(
         self,
         id: str,
-        scores: Optional[Mapping[str, Union[int, float]]] = None,
-        expected: Optional[Any] = None,
-        tags: Optional[Sequence[str]] = None,
-        comment: Optional[str] = None,
-        metadata: Optional[Mapping[str, Any]] = None,
+        scores: Mapping[str, int | float] | None = None,
+        expected: Any | None = None,
+        tags: Sequence[str] | None = None,
+        comment: str | None = None,
+        metadata: Mapping[str, Any] | None = None,
         source: Literal["external", "app", "api", None] = None,
     ) -> None:
         """
@@ -4958,15 +4859,15 @@ class Logger(Exportable):
     def start_span(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
-        span_id: Optional[str] = None,
-        root_span_id: Optional[str] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
+        propagated_event: dict[str, Any] | None = None,
+        span_id: str | None = None,
+        root_span_id: str | None = None,
         **event: Any,
     ) -> Span:
         """Create a new toplevel span underneath the logger. The name defaults to "root" and the span type to "task".
@@ -5004,15 +4905,15 @@ class Logger(Exportable):
     def _start_span_impl(
         self,
-        name: Optional[str] = None,
-        type: Optional[SpanTypeAttribute] = None,
-        span_attributes: Optional[Union[SpanAttributes, Mapping[str, Any]]] = None,
-        start_time: Optional[float] = None,
-        set_current: Optional[bool] = None,
-        parent: Optional[str] = None,
-        propagated_event: Optional[Dict[str, Any]] = None,
-        span_id: Optional[str] = None,
-        root_span_id: Optional[str] = None,
+        name: str | None = None,
+        type: SpanTypeAttribute | None = None,
+        span_attributes: SpanAttributes | Mapping[str, Any] | None = None,
+        start_time: float | None = None,
+        set_current: bool | None = None,
+        parent: str | None = None,
+        propagated_event: dict[str, Any] | None = None,
+        span_id: str | None = None,
+        root_span_id: str | None = None,
         lookup_span_parent: bool = True,
         **event: Any,
     ) -> Span:
@@ -5062,7 +4963,7 @@ class Logger(Exportable):
     def __enter__(self) -> "Logger":
         return self
-    def _get_link_base_url(self) -> Optional[str]:
+    def _get_link_base_url(self) -> str | None:
         """Return the base of link urls (e.g. https://braintrust.dev/app/my-org-name/) if we have the info
         otherwise return None.
         """
@@ -5098,11 +4999,11 @@ class ScoreSummary(SerializableDataClass):
     score: float
     """Average score across all examples."""
-    improvements: Optional[int]
+    improvements: int | None
     """Number of improvements in the score."""
-    regressions: Optional[int]
+    regressions: int | None
     """Number of regressions in the score."""
-    diff: Optional[float] = None
+    diff: float | None = None
     """Difference in score between the current and reference experiment."""
     def __str__(self):
@@ -5133,15 +5034,15 @@ class MetricSummary(SerializableDataClass):
     # Used to help with formatting
     _longest_metric_name: int
-    metric: Union[float, int]
+    metric: float | int
     """Average metric across all examples."""
     unit: str
     """Unit label for the metric."""
-    improvements: Optional[int]
+    improvements: int | None
     """Number of improvements in the metric."""
-    regressions: Optional[int]
+    regressions: int | None
     """Number of regressions in the metric."""
-    diff: Optional[float] = None
+    diff: float | None = None
     """Difference in metric between the current and reference experiment."""
     def __str__(self):
@@ -5167,21 +5068,21 @@ class ExperimentSummary(SerializableDataClass):
     project_name: str
     """Name of the project that the experiment belongs to."""
-    project_id: Optional[str]
+    project_id: str | None
     """ID of the project. May be `None` if the eval was run locally."""
-    experiment_id: Optional[str]
+    experiment_id: str | None
     """ID of the experiment. May be `None` if the eval was run locally."""
     experiment_name: str
     """Name of the experiment."""
-    project_url: Optional[str]
+    project_url: str | None
     """URL to the project's page in the Braintrust app."""
-    experiment_url: Optional[str]
+    experiment_url: str | None
     """URL to the experiment's page in the Braintrust app."""
-    comparison_experiment_name: Optional[str]
+    comparison_experiment_name: str | None
     """The experiment scores are baselined against."""
-    scores: Dict[str, ScoreSummary]
+    scores: dict[str, ScoreSummary]
     """Summary of the experiment's scores."""
-    metrics: Dict[str, MetricSummary]
+    metrics: dict[str, MetricSummary]
     """Summary of the experiment's metrics."""
     def __str__(self):
@@ -5230,7 +5131,7 @@ class DatasetSummary(SerializableDataClass):
     """URL to the project's page in the Braintrust app."""
     dataset_url: str
     """URL to the experiment's page in the Braintrust app."""
-    data_summary: Optional[DataSummary]
+    data_summary: DataSummary | None
     """Summary of the dataset's data."""
     def __str__(self):
@@ -5245,7 +5146,8 @@ class DatasetSummary(SerializableDataClass):
 class TracedThreadPoolExecutor(concurrent.futures.ThreadPoolExecutor):
-    # Returns Any because Future is not generic in Python 3.8.
+    # Returns Any because Future[T] generic typing was stabilized in Python 3.9,
+    # but we maintain compatibility with older type checkers.
     def submit(self, fn: Callable[..., Any], *args: Any, **kwargs: Any) -> Any:
         # Capture all current context variables
         context = contextvars.copy_context()
@@ -5257,7 +5159,7 @@ class TracedThreadPoolExecutor(concurrent.futures.ThreadPoolExecutor):
         return super().submit(wrapped_fn, *args, **kwargs)
-def get_prompt_versions(project_id: str, prompt_id: str) -> List[str]:
+def get_prompt_versions(project_id: str, prompt_id: str) -> list[str]:
     """
     Get the versions for a specific prompt.
@@ -5317,13 +5219,13 @@ def get_prompt_versions(project_id: str, prompt_id: str) -> List[str]:
     ]
-def _get_app_url(app_url: Optional[str] = None) -> str:
+def _get_app_url(app_url: str | None = None) -> str:
     if app_url:
         return app_url
     return os.getenv("BRAINTRUST_APP_URL", DEFAULT_APP_URL)
-def _get_org_name(org_name: Optional[str] = None) -> Optional[str]:
+def _get_org_name(org_name: str | None = None) -> str | None:
     if org_name:
         return org_name
     return os.getenv("BRAINTRUST_ORG_NAME")

braintrust 0.3.15__py3-none-any.whl → 0.4.1__py3-none-any.whl

braintrust 0.3.15py3-none-any.whl → 0.4.1py3-none-any.whl