PyPI - arize-phoenix - Versions diffs - 3.25.0__py3-none-any.whl → 4.0.1__py3-none-any.whl - Mend

arize-phoenix 3.25.0py3-none-any.whl → 4.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (113) hide show

{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.1.dist-info}/METADATA +26 -4
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.1.dist-info}/RECORD +80 -75
phoenix/__init__.py +9 -5
phoenix/config.py +109 -53
phoenix/datetime_utils.py +18 -1
phoenix/db/README.md +25 -0
phoenix/db/__init__.py +4 -0
phoenix/db/alembic.ini +119 -0
phoenix/db/bulk_inserter.py +206 -0
phoenix/db/engines.py +152 -0
phoenix/db/helpers.py +47 -0
phoenix/db/insertion/evaluation.py +209 -0
phoenix/db/insertion/helpers.py +51 -0
phoenix/db/insertion/span.py +142 -0
phoenix/db/migrate.py +71 -0
phoenix/db/migrations/env.py +121 -0
phoenix/db/migrations/script.py.mako +26 -0
phoenix/db/migrations/versions/cf03bd6bae1d_init.py +280 -0
phoenix/db/models.py +371 -0
phoenix/exceptions.py +5 -1
phoenix/server/api/context.py +40 -3
phoenix/server/api/dataloaders/__init__.py +97 -0
phoenix/server/api/dataloaders/cache/__init__.py +3 -0
phoenix/server/api/dataloaders/cache/two_tier_cache.py +67 -0
phoenix/server/api/dataloaders/document_evaluation_summaries.py +152 -0
phoenix/server/api/dataloaders/document_evaluations.py +37 -0
phoenix/server/api/dataloaders/document_retrieval_metrics.py +98 -0
phoenix/server/api/dataloaders/evaluation_summaries.py +151 -0
phoenix/server/api/dataloaders/latency_ms_quantile.py +198 -0
phoenix/server/api/dataloaders/min_start_or_max_end_times.py +93 -0
phoenix/server/api/dataloaders/record_counts.py +125 -0
phoenix/server/api/dataloaders/span_descendants.py +64 -0
phoenix/server/api/dataloaders/span_evaluations.py +37 -0
phoenix/server/api/dataloaders/token_counts.py +138 -0
phoenix/server/api/dataloaders/trace_evaluations.py +37 -0
phoenix/server/api/input_types/SpanSort.py +138 -68
phoenix/server/api/routers/v1/__init__.py +11 -0
phoenix/server/api/routers/v1/evaluations.py +275 -0
phoenix/server/api/routers/v1/spans.py +126 -0
phoenix/server/api/routers/v1/traces.py +82 -0
phoenix/server/api/schema.py +112 -48
phoenix/server/api/types/DocumentEvaluationSummary.py +1 -1
phoenix/server/api/types/Evaluation.py +29 -12
phoenix/server/api/types/EvaluationSummary.py +29 -44
phoenix/server/api/types/MimeType.py +2 -2
phoenix/server/api/types/Model.py +9 -9
phoenix/server/api/types/Project.py +240 -171
phoenix/server/api/types/Span.py +87 -131
phoenix/server/api/types/Trace.py +29 -20
phoenix/server/api/types/pagination.py +151 -10
phoenix/server/app.py +263 -35
phoenix/server/grpc_server.py +93 -0
phoenix/server/main.py +75 -60
phoenix/server/openapi/docs.py +218 -0
phoenix/server/prometheus.py +23 -7
phoenix/server/static/index.js +662 -643
phoenix/server/telemetry.py +68 -0
phoenix/services.py +4 -0
phoenix/session/client.py +34 -30
phoenix/session/data_extractor.py +8 -3
phoenix/session/session.py +176 -155
phoenix/settings.py +13 -0
phoenix/trace/attributes.py +349 -0
phoenix/trace/dsl/README.md +116 -0
phoenix/trace/dsl/filter.py +660 -192
phoenix/trace/dsl/helpers.py +24 -5
phoenix/trace/dsl/query.py +562 -185
phoenix/trace/fixtures.py +69 -7
phoenix/trace/otel.py +44 -200
phoenix/trace/schemas.py +14 -8
phoenix/trace/span_evaluations.py +5 -2
phoenix/utilities/__init__.py +0 -26
phoenix/utilities/span_store.py +0 -23
phoenix/version.py +1 -1
phoenix/core/project.py +0 -773
phoenix/core/traces.py +0 -96
phoenix/datasets/dataset.py +0 -214
phoenix/datasets/fixtures.py +0 -24
phoenix/datasets/schema.py +0 -31
phoenix/experimental/evals/__init__.py +0 -73
phoenix/experimental/evals/evaluators.py +0 -413
phoenix/experimental/evals/functions/__init__.py +0 -4
phoenix/experimental/evals/functions/classify.py +0 -453
phoenix/experimental/evals/functions/executor.py +0 -353
phoenix/experimental/evals/functions/generate.py +0 -138
phoenix/experimental/evals/functions/processing.py +0 -76
phoenix/experimental/evals/models/__init__.py +0 -14
phoenix/experimental/evals/models/anthropic.py +0 -175
phoenix/experimental/evals/models/base.py +0 -170
phoenix/experimental/evals/models/bedrock.py +0 -221
phoenix/experimental/evals/models/litellm.py +0 -134
phoenix/experimental/evals/models/openai.py +0 -453
phoenix/experimental/evals/models/rate_limiters.py +0 -246
phoenix/experimental/evals/models/vertex.py +0 -173
phoenix/experimental/evals/models/vertexai.py +0 -186
phoenix/experimental/evals/retrievals.py +0 -96
phoenix/experimental/evals/templates/__init__.py +0 -50
phoenix/experimental/evals/templates/default_templates.py +0 -472
phoenix/experimental/evals/templates/template.py +0 -195
phoenix/experimental/evals/utils/__init__.py +0 -172
phoenix/experimental/evals/utils/threads.py +0 -27
phoenix/server/api/routers/evaluation_handler.py +0 -110
phoenix/server/api/routers/span_handler.py +0 -70
phoenix/server/api/routers/trace_handler.py +0 -60
phoenix/storage/span_store/__init__.py +0 -23
phoenix/storage/span_store/text_file.py +0 -85
phoenix/trace/dsl/missing.py +0 -60
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.1.dist-info}/WHEEL +0 -0
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.1.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.1.dist-info}/licenses/LICENSE +0 -0
/phoenix/{datasets → db/insertion}/__init__.py +0 -0
/phoenix/{experimental → db/migrations}/__init__.py +0 -0
/phoenix/{storage → server/openapi}/__init__.py +0 -0

phoenix/core/project.py DELETED Viewed

@@ -1,773 +0,0 @@
-import logging
-from collections import defaultdict
-from datetime import datetime, timezone
-from threading import RLock
-from types import MappingProxyType
-from typing import (
-    Any,
-    DefaultDict,
-    Dict,
-    Iterable,
-    Iterator,
-    List,
-    Mapping,
-    Optional,
-    Set,
-    Sized,
-    Tuple,
-    Union,
-    cast,
-)
-import numpy as np
-from google.protobuf.json_format import MessageToDict
-from openinference.semconv.trace import SpanAttributes
-from pandas import DataFrame, Index, MultiIndex
-from sortedcontainers import SortedKeyList
-from typing_extensions import TypeAlias, assert_never
-from wrapt import ObjectProxy
-import phoenix.trace.v1 as pb
-from phoenix.datetime_utils import right_open_time_range
-from phoenix.trace import DocumentEvaluations, Evaluations, SpanEvaluations
-from phoenix.trace.schemas import (
-    ComputedAttributes,
-    Span,
-    SpanID,
-    SpanStatusCode,
-    TraceID,
-)
-logger = logging.getLogger(__name__)
-logger.addHandler(logging.NullHandler())
-END_OF_QUEUE = None  # sentinel value for queue termination
-class WrappedSpan(ObjectProxy):  # type: ignore
-    """
-    A wrapped Span object with __getitem__ and __setitem__ methods for accessing
-    computed attributes.
-    """
-    def __init__(self, span: Span) -> None:
-        super().__init__(span)
-        self._self_computed_values: Dict[ComputedAttributes, Union[float, int]] = {}
-    def get_computed_value(self, key: str) -> Optional[Union[float, int]]:
-        try:
-            attr = ComputedAttributes(key)
-        except Exception:
-            return None
-        return self._self_computed_values.get(attr)
-    def __getitem__(self, key: Union[str, ComputedAttributes]) -> Any:
-        if isinstance(key, ComputedAttributes):
-            return self._self_computed_values.get(key)
-        return self.__wrapped__.attributes.get(key)
-    def __setitem__(self, key: ComputedAttributes, value: Any) -> None:
-        if not isinstance(key, ComputedAttributes):
-            raise KeyError(f"{key} is not a computed value")
-        self._self_computed_values[key] = value
-    def __eq__(self, other: Any) -> bool:
-        return self is other
-    def __hash__(self) -> int:
-        return id(self)
-_ParentSpanID: TypeAlias = SpanID
-_ChildSpanID: TypeAlias = SpanID
-_ProjectName: TypeAlias = str
-EvaluationName: TypeAlias = str
-DocumentPosition: TypeAlias = int
-class Project:
-    def __init__(self) -> None:
-        self._spans = _Spans()
-        self._evals = _Evals()
-        self._is_archived = False
-    @property
-    def last_updated_at(self) -> Optional[datetime]:
-        spans_last_updated_at = self._spans.last_updated_at
-        evals_last_updated_at = self._evals.last_updated_at
-        if (
-            not spans_last_updated_at
-            or evals_last_updated_at
-            and evals_last_updated_at > spans_last_updated_at
-        ):
-            return evals_last_updated_at
-        return spans_last_updated_at
-    def add_span(self, span: Span) -> None:
-        self._spans.add(WrappedSpan(span))
-    def add_eval(self, pb_eval: pb.Evaluation) -> None:
-        self._evals.add(pb_eval)
-    def has_trace(self, trace_id: TraceID) -> bool:
-        return self._spans.has_trace(trace_id)
-    def get_trace(self, trace_id: TraceID) -> Iterator[WrappedSpan]:
-        yield from self._spans.get_trace(trace_id)
-    def get_trace_ids(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-        trace_ids: Optional[Iterable[TraceID]] = None,
-    ) -> Iterator[TraceID]:
-        yield from self._spans.get_trace_ids(start_time, stop_time, trace_ids)
-    def get_spans(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-        root_spans_only: Optional[bool] = False,
-        span_ids: Optional[Iterable[SpanID]] = None,
-    ) -> Iterator[WrappedSpan]:
-        yield from self._spans.get_spans(start_time, stop_time, root_spans_only, span_ids)
-    def get_num_documents(self, span_id: SpanID) -> int:
-        return self._spans.get_num_documents(span_id)
-    def root_span_latency_ms_quantiles(self, probability: float) -> Optional[float]:
-        """Root span latency quantiles in milliseconds"""
-        return self._spans.root_span_latency_ms_quantiles(probability)
-    def get_descendant_spans(self, span_id: SpanID) -> Iterator[WrappedSpan]:
-        yield from self._spans.get_descendant_spans(span_id)
-    def span_count(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-    ) -> int:
-        return self._spans.span_count(start_time, stop_time)
-    def trace_count(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-    ) -> int:
-        return self._spans.trace_count(start_time, stop_time)
-    @property
-    def token_count_total(self) -> int:
-        return self._spans.token_count_total
-    @property
-    def right_open_time_range(self) -> Tuple[Optional[datetime], Optional[datetime]]:
-        return self._spans.right_open_time_range
-    def get_trace_evaluation(self, trace_id: TraceID, name: str) -> Optional[pb.Evaluation]:
-        return self._evals.get_trace_evaluation(trace_id, name)
-    def get_trace_evaluation_names(self) -> List[EvaluationName]:
-        return self._evals.get_trace_evaluation_names()
-    def get_trace_evaluation_labels(self, name: EvaluationName) -> Tuple[str, ...]:
-        return self._evals.get_trace_evaluation_labels(name)
-    def get_trace_evaluation_trace_ids(self, name: EvaluationName) -> Tuple[TraceID, ...]:
-        return self._evals.get_trace_evaluation_trace_ids(name)
-    def get_evaluations_by_trace_id(self, trace_id: TraceID) -> List[pb.Evaluation]:
-        return self._evals.get_evaluations_by_trace_id(trace_id)
-    def get_span_evaluation(self, span_id: SpanID, name: str) -> Optional[pb.Evaluation]:
-        return self._evals.get_span_evaluation(span_id, name)
-    def get_span_evaluation_names(self) -> List[EvaluationName]:
-        return self._evals.get_span_evaluation_names()
-    def get_document_evaluation_names(
-        self,
-        span_id: Optional[SpanID] = None,
-    ) -> List[EvaluationName]:
-        return self._evals.get_document_evaluation_names(span_id)
-    def get_span_evaluation_labels(self, name: EvaluationName) -> Tuple[str, ...]:
-        return self._evals.get_span_evaluation_labels(name)
-    def get_span_evaluation_span_ids(self, name: EvaluationName) -> Tuple[SpanID, ...]:
-        return self._evals.get_span_evaluation_span_ids(name)
-    def get_evaluations_by_span_id(self, span_id: SpanID) -> List[pb.Evaluation]:
-        return self._evals.get_evaluations_by_span_id(span_id)
-    def get_document_evaluation_span_ids(self, name: EvaluationName) -> Tuple[SpanID, ...]:
-        return self._evals.get_document_evaluation_span_ids(name)
-    def get_document_evaluations_by_span_id(self, span_id: SpanID) -> List[pb.Evaluation]:
-        return self._evals.get_document_evaluations_by_span_id(span_id)
-    def get_document_evaluation_scores(
-        self,
-        span_id: SpanID,
-        evaluation_name: str,
-        num_documents: int,
-    ) -> List[float]:
-        return self._evals.get_document_evaluation_scores(span_id, evaluation_name, num_documents)
-    def export_evaluations(self) -> List[Evaluations]:
-        return self._evals.export_evaluations()
-    def archive(self) -> None:
-        self._is_archived = True
-    @property
-    def is_archived(self) -> bool:
-        return self._is_archived
-class _Trace:
-    def __init__(self, span: WrappedSpan) -> None:
-        self._trace_id: TraceID = span.context.trace_id
-        self._min_start_time: datetime = span.start_time
-        self._max_end_time: datetime = span.end_time
-        self._spans: List[WrappedSpan] = [span]
-    @property
-    def trace_id(self) -> TraceID:
-        return self._trace_id
-    @property
-    def start_time(self) -> datetime:
-        return self._min_start_time
-    @property
-    def latency_ms(self) -> float:
-        return (self._max_end_time - self._min_start_time).total_seconds() * 1000
-    def add(self, span: WrappedSpan) -> None:
-        self._min_start_time = min(self._min_start_time, span.start_time)
-        self._max_end_time = max(self._max_end_time, span.end_time)
-        self._spans.append(span)
-    def __eq__(self, other: Any) -> bool:
-        return self is other
-    def __iter__(self) -> Iterator[WrappedSpan]:
-        yield from self._spans
-class _Spans:
-    def __init__(self) -> None:
-        self._lock = RLock()
-        self._spans: Dict[SpanID, WrappedSpan] = {}
-        self._parent_span_ids: Dict[SpanID, _ParentSpanID] = {}
-        self._traces: Dict[TraceID, _Trace] = {}
-        self._child_spans: DefaultDict[SpanID, Set[WrappedSpan]] = defaultdict(set)
-        self._num_documents: DefaultDict[SpanID, int] = defaultdict(int)
-        self._start_time_sorted_spans: SortedKeyList[WrappedSpan] = SortedKeyList(
-            key=lambda span: span.start_time,
-        )
-        self._start_time_sorted_root_spans: SortedKeyList[WrappedSpan] = SortedKeyList(
-            key=lambda span: span.start_time,
-        )
-        """
-        A root span is defined to be a span whose parent span is not in our collection.
-        This includes spans whose parent is None and spans whose parent has not arrived
-        (or will not arrive). For spans whose parent is not None, the root span status
-        is temporary and will be revoked when its parent span arrives.
-        """
-        self._latency_sorted_traces: SortedKeyList[_Trace] = SortedKeyList(
-            key=lambda trace: trace.latency_ms,
-        )
-        self._start_time_sorted_traces: SortedKeyList[_Trace] = SortedKeyList(
-            key=lambda trace: trace.start_time,
-        )
-        self._token_count_total: int = 0
-        self._last_updated_at: Optional[datetime] = None
-    def has_trace(self, trace_id: TraceID) -> bool:
-        return trace_id in self._traces
-    def get_trace(self, trace_id: TraceID) -> Iterator[WrappedSpan]:
-        with self._lock:
-            # make a copy because source data can mutate during iteration
-            if not (trace := self._traces.get(trace_id)):
-                return
-            spans = tuple(trace)
-        for span in spans:
-            yield span
-    def get_trace_ids(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-        trace_ids: Optional[Iterable[TraceID]] = None,
-    ) -> Iterator[TraceID]:
-        if not self._spans:
-            return
-        if start_time is None or stop_time is None:
-            min_start_time, max_stop_time = cast(
-                Tuple[datetime, datetime],
-                self.right_open_time_range,
-            )
-            start_time = start_time or min_start_time
-            stop_time = stop_time or max_stop_time
-        if trace_ids is not None:
-            with self._lock:
-                traces = tuple(
-                    trace
-                    for trace_id in trace_ids
-                    if (
-                        (trace := self._traces.get(trace_id))
-                        and start_time <= trace.start_time < stop_time
-                    )
-                )
-        else:
-            sorted_traces = self._start_time_sorted_traces
-            # make a copy because source data can mutate during iteration
-            with self._lock:
-                traces = tuple(
-                    sorted_traces.irange_key(
-                        start_time.astimezone(timezone.utc),
-                        stop_time.astimezone(timezone.utc),
-                        inclusive=(True, False),
-                        reverse=True,  # most recent traces first
-                    )
-                )
-        for trace in traces:
-            yield trace.trace_id
-    def get_spans(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-        root_spans_only: Optional[bool] = False,
-        span_ids: Optional[Iterable[SpanID]] = None,
-    ) -> Iterator[WrappedSpan]:
-        if not self._spans:
-            return
-        if start_time is None or stop_time is None:
-            min_start_time, max_stop_time = cast(
-                Tuple[datetime, datetime],
-                self.right_open_time_range,
-            )
-            start_time = start_time or min_start_time
-            stop_time = stop_time or max_stop_time
-        if span_ids is not None:
-            with self._lock:
-                spans = tuple(
-                    span
-                    for span_id in span_ids
-                    if (
-                        (span := self._spans.get(span_id))
-                        and start_time <= span.start_time < stop_time
-                        and (not root_spans_only or span.parent_id is None)
-                    )
-                )
-        else:
-            sorted_spans = (
-                self._start_time_sorted_root_spans
-                if root_spans_only
-                else self._start_time_sorted_spans
-            )
-            # make a copy because source data can mutate during iteration
-            with self._lock:
-                spans = tuple(
-                    sorted_spans.irange_key(
-                        start_time.astimezone(timezone.utc),
-                        stop_time.astimezone(timezone.utc),
-                        inclusive=(True, False),
-                        reverse=True,  # most recent spans first
-                    )
-                )
-        for span in spans:
-            yield span
-    def get_num_documents(self, span_id: SpanID) -> int:
-        with self._lock:
-            return self._num_documents.get(span_id) or 0
-    def root_span_latency_ms_quantiles(self, probability: float) -> Optional[float]:
-        """Root span latency quantiles in milliseconds"""
-        with self._lock:
-            traces = self._latency_sorted_traces
-            if not (n := len(traces)):
-                return None
-            if probability >= 1:
-                return cast(float, traces[-1].latency_ms)
-            if probability <= 0:
-                return cast(float, traces[0].latency_ms)
-            k = max(0, round(n * probability) - 1)
-            return cast(float, traces[k].latency_ms)
-    def get_descendant_spans(self, span_id: SpanID) -> Iterator[WrappedSpan]:
-        for span in self._get_descendant_spans(span_id):
-            yield span
-    def _get_descendant_spans(self, span_id: SpanID) -> Iterator[WrappedSpan]:
-        with self._lock:
-            # make a copy because source data can mutate during iteration
-            if not (child_spans := self._child_spans.get(span_id)):
-                return
-            spans = tuple(child_spans)
-        for child_span in spans:
-            yield child_span
-            yield from self._get_descendant_spans(child_span.context.span_id)
-    @property
-    def last_updated_at(self) -> Optional[datetime]:
-        return self._last_updated_at
-    def span_count(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-    ) -> int:
-        _index = self._start_time_sorted_spans.bisect_key_left
-        with self._lock:
-            start: int = _index(start_time) if start_time else 0
-            stop: int = _index(stop_time) if stop_time else len(self._spans)
-        return stop - start
-    def trace_count(
-        self,
-        start_time: Optional[datetime] = None,
-        stop_time: Optional[datetime] = None,
-    ) -> int:
-        _index = self._start_time_sorted_root_spans.bisect_key_left
-        with self._lock:
-            start: int = _index(start_time) if start_time else 0
-            stop: int = _index(stop_time) if stop_time else len(self._traces)
-        return stop - start
-    @property
-    def token_count_total(self) -> int:
-        return self._token_count_total
-    @property
-    def right_open_time_range(self) -> Tuple[Optional[datetime], Optional[datetime]]:
-        with self._lock:
-            if not self._start_time_sorted_spans:
-                return None, None
-            first_span = self._start_time_sorted_spans[0]
-            last_span = self._start_time_sorted_spans[-1]
-        min_start_time = first_span.start_time
-        max_start_time = last_span.start_time
-        return right_open_time_range(min_start_time, max_start_time)
-    def add(self, span: WrappedSpan) -> None:
-        with self._lock:
-            self._add_span(span)
-    def _add_span(self, span: WrappedSpan) -> None:
-        span_id = span.context.span_id
-        if span_id in self._spans:
-            # Update is not allowed.
-            return
-        parent_span_id = span.parent_id
-        if parent_span_id is not None:
-            self._child_spans[parent_span_id].add(span)
-            self._parent_span_ids[span_id] = parent_span_id
-        for child_span in self._child_spans.get(span_id, ()):
-            # A root span is a span whose parent span is not in our collection.
-            # Now that their parent span has arrived, they are no longer root spans.
-            self._start_time_sorted_root_spans.remove(child_span)
-        # Add computed attributes to span
-        start_time = span.start_time
-        end_time = span.end_time
-        span[ComputedAttributes.LATENCY_MS] = (end_time - start_time).total_seconds() * 1000
-        span[ComputedAttributes.ERROR_COUNT] = int(span.status_code is SpanStatusCode.ERROR)
-        # Store the new span (after adding computed attributes)
-        self._spans[span_id] = span
-        self._add_span_to_trace(span)
-        self._start_time_sorted_spans.add(span)
-        if parent_span_id is None or parent_span_id not in self._spans:
-            self._start_time_sorted_root_spans.add(span)
-        self._propagate_cumulative_values(span)
-        self._update_cached_statistics(span)
-        # Update last updated timestamp, letting users know
-        # when they should refresh the page.
-        self._last_updated_at = datetime.now(timezone.utc)
-    def _add_span_to_trace(self, span: WrappedSpan) -> None:
-        trace_id = span.context.trace_id
-        if (trace := self._traces.get(trace_id)) is None:
-            self._traces[trace_id] = trace = _Trace(span)
-        else:
-            # Must remove trace before mutating it.
-            self._latency_sorted_traces.remove(trace)
-            self._start_time_sorted_traces.remove(trace)
-            trace.add(span)
-        self._latency_sorted_traces.add(trace)
-        self._start_time_sorted_traces.add(trace)
-    def _update_cached_statistics(self, span: WrappedSpan) -> None:
-        # Update statistics for quick access later
-        span_id = span.context.span_id
-        if token_count_update := span.attributes.get(SpanAttributes.LLM_TOKEN_COUNT_TOTAL):
-            self._token_count_total += token_count_update
-        if isinstance(
-            (retrieval_documents := span.attributes.get(SpanAttributes.RETRIEVAL_DOCUMENTS)),
-            Sized,
-        ) and (num_documents_update := len(retrieval_documents)):
-            self._num_documents[span_id] += num_documents_update
-    def _propagate_cumulative_values(self, span: WrappedSpan) -> None:
-        child_spans: Iterable[WrappedSpan] = self._child_spans.get(span.context.span_id) or ()
-        for cumulative_attribute, attribute in _CUMULATIVE_ATTRIBUTES.items():
-            span[cumulative_attribute] = span[attribute] or 0
-            for child_span in child_spans:
-                span[cumulative_attribute] += child_span[cumulative_attribute] or 0
-        self._update_ancestors(span)
-    def _update_ancestors(self, span: WrappedSpan) -> None:
-        # Add cumulative values to each of the span's ancestors.
-        span_id = span.context.span_id
-        for attribute in _CUMULATIVE_ATTRIBUTES.keys():
-            value = span[attribute] or 0
-            self._add_value_to_span_ancestors(span_id, attribute, value)
-    def _add_value_to_span_ancestors(
-        self,
-        span_id: SpanID,
-        attribute: ComputedAttributes,
-        value: float,
-    ) -> None:
-        while parent_span_id := self._parent_span_ids.get(span_id):
-            if not (parent_span := self._spans.get(parent_span_id)):
-                return
-            cumulative_value = parent_span[attribute] or 0
-            parent_span[attribute] = cumulative_value + value
-            span_id = parent_span_id
-class _Evals:
-    def __init__(self) -> None:
-        self._lock = RLock()
-        self._trace_evaluations_by_name: DefaultDict[
-            EvaluationName, Dict[TraceID, pb.Evaluation]
-        ] = defaultdict(dict)
-        self._evaluations_by_trace_id: DefaultDict[TraceID, Dict[EvaluationName, pb.Evaluation]] = (
-            defaultdict(dict)
-        )
-        self._trace_evaluation_labels: DefaultDict[EvaluationName, Set[str]] = defaultdict(set)
-        self._span_evaluations_by_name: DefaultDict[EvaluationName, Dict[SpanID, pb.Evaluation]] = (
-            defaultdict(dict)
-        )
-        self._evaluations_by_span_id: DefaultDict[SpanID, Dict[EvaluationName, pb.Evaluation]] = (
-            defaultdict(dict)
-        )
-        self._span_evaluation_labels: DefaultDict[EvaluationName, Set[str]] = defaultdict(set)
-        self._document_evaluations_by_span_id: DefaultDict[
-            SpanID, DefaultDict[EvaluationName, Dict[DocumentPosition, pb.Evaluation]]
-        ] = defaultdict(lambda: defaultdict(dict))
-        self._document_evaluations_by_name: DefaultDict[
-            EvaluationName, DefaultDict[SpanID, Dict[DocumentPosition, pb.Evaluation]]
-        ] = defaultdict(lambda: defaultdict(dict))
-        self._last_updated_at: Optional[datetime] = None
-    def add(self, evaluation: pb.Evaluation) -> None:
-        with self._lock:
-            self._add(evaluation)
-    def _add(self, evaluation: pb.Evaluation) -> None:
-        subject_id = evaluation.subject_id
-        name = evaluation.name
-        subject_id_kind = subject_id.WhichOneof("kind")
-        if subject_id_kind == "document_retrieval_id":
-            document_retrieval_id = subject_id.document_retrieval_id
-            span_id = SpanID(document_retrieval_id.span_id)
-            document_position = document_retrieval_id.document_position
-            self._document_evaluations_by_span_id[span_id][name][document_position] = evaluation
-            self._document_evaluations_by_name[name][span_id][document_position] = evaluation
-        elif subject_id_kind == "span_id":
-            span_id = SpanID(subject_id.span_id)
-            self._evaluations_by_span_id[span_id][name] = evaluation
-            self._span_evaluations_by_name[name][span_id] = evaluation
-            if evaluation.result.HasField("label"):
-                label = evaluation.result.label.value
-                self._span_evaluation_labels[name].add(label)
-        elif subject_id_kind == "trace_id":
-            trace_id = TraceID(subject_id.trace_id)
-            self._evaluations_by_trace_id[trace_id][name] = evaluation
-            self._trace_evaluations_by_name[name][trace_id] = evaluation
-            if evaluation.result.HasField("label"):
-                label = evaluation.result.label.value
-                self._trace_evaluation_labels[name].add(label)
-        elif subject_id_kind is None:
-            logger.warning(
-                f"discarding evaluation with missing subject_id: {MessageToDict(evaluation)}"
-            )
-        else:
-            assert_never(subject_id_kind)
-        self._last_updated_at = datetime.now(timezone.utc)
-    @property
-    def last_updated_at(self) -> Optional[datetime]:
-        return self._last_updated_at
-    def get_trace_evaluation(self, trace_id: TraceID, name: str) -> Optional[pb.Evaluation]:
-        with self._lock:
-            trace_evaluations = self._evaluations_by_trace_id.get(trace_id)
-            return trace_evaluations.get(name) if trace_evaluations else None
-    def get_trace_evaluation_names(self) -> List[EvaluationName]:
-        with self._lock:
-            return list(self._trace_evaluations_by_name)
-    def get_trace_evaluation_labels(self, name: EvaluationName) -> Tuple[str, ...]:
-        with self._lock:
-            labels = self._trace_evaluation_labels.get(name)
-            return tuple(labels) if labels else ()
-    def get_trace_evaluation_trace_ids(self, name: EvaluationName) -> Tuple[TraceID, ...]:
-        with self._lock:
-            trace_evaluations = self._trace_evaluations_by_name.get(name)
-            return tuple(trace_evaluations.keys()) if trace_evaluations else ()
-    def get_evaluations_by_trace_id(self, trace_id: TraceID) -> List[pb.Evaluation]:
-        with self._lock:
-            evaluations = self._evaluations_by_trace_id.get(trace_id)
-            return list(evaluations.values()) if evaluations else []
-    def get_span_evaluation(self, span_id: SpanID, name: str) -> Optional[pb.Evaluation]:
-        with self._lock:
-            span_evaluations = self._evaluations_by_span_id.get(span_id)
-            return span_evaluations.get(name) if span_evaluations else None
-    def get_span_evaluation_names(self) -> List[EvaluationName]:
-        with self._lock:
-            return list(self._span_evaluations_by_name)
-    def get_document_evaluation_names(
-        self,
-        span_id: Optional[SpanID] = None,
-    ) -> List[EvaluationName]:
-        with self._lock:
-            if span_id is None:
-                return list(self._document_evaluations_by_name)
-            document_evaluations = self._document_evaluations_by_span_id.get(span_id)
-            return list(document_evaluations) if document_evaluations else []
-    def get_span_evaluation_labels(self, name: EvaluationName) -> Tuple[str, ...]:
-        with self._lock:
-            labels = self._span_evaluation_labels.get(name)
-            return tuple(labels) if labels else ()
-    def get_span_evaluation_span_ids(self, name: EvaluationName) -> Tuple[SpanID, ...]:
-        with self._lock:
-            span_evaluations = self._span_evaluations_by_name.get(name)
-            return tuple(span_evaluations.keys()) if span_evaluations else ()
-    def get_evaluations_by_span_id(self, span_id: SpanID) -> List[pb.Evaluation]:
-        with self._lock:
-            evaluations = self._evaluations_by_span_id.get(span_id)
-            return list(evaluations.values()) if evaluations else []
-    def get_document_evaluation_span_ids(self, name: EvaluationName) -> Tuple[SpanID, ...]:
-        with self._lock:
-            document_evaluations = self._document_evaluations_by_name.get(name)
-            return tuple(document_evaluations.keys()) if document_evaluations else ()
-    def get_document_evaluations_by_span_id(self, span_id: SpanID) -> List[pb.Evaluation]:
-        all_evaluations: List[pb.Evaluation] = []
-        with self._lock:
-            document_evaluations = self._document_evaluations_by_span_id.get(span_id)
-            if not document_evaluations:
-                return all_evaluations
-            for evaluations in document_evaluations.values():
-                all_evaluations.extend(evaluations.values())
-        return all_evaluations
-    def get_document_evaluation_scores(
-        self,
-        span_id: SpanID,
-        evaluation_name: str,
-        num_documents: int,
-    ) -> List[float]:
-        # num_documents is needed as argument because the document position values
-        # are not checked during ingestion: e.g. if there exists a position value
-        # of one trillion, we would not want to create a result that large.
-        scores: List[float] = [np.nan] * num_documents
-        with self._lock:
-            document_evaluations = self._document_evaluations_by_span_id.get(span_id)
-            if not document_evaluations:
-                return scores
-            evaluations = document_evaluations.get(evaluation_name)
-            if not evaluations:
-                return scores
-            for document_position, evaluation in evaluations.items():
-                result = evaluation.result
-                if result.HasField("score") and document_position < num_documents:
-                    scores[document_position] = result.score.value
-        return scores
-    def export_evaluations(self) -> List[Evaluations]:
-        evaluations: List[Evaluations] = []
-        evaluations.extend(self._export_span_evaluations())
-        evaluations.extend(self._export_document_evaluations())
-        return evaluations
-    def _export_span_evaluations(self) -> List[SpanEvaluations]:
-        span_evaluations = []
-        with self._lock:
-            span_evaluations_by_name = tuple(self._span_evaluations_by_name.items())
-        for eval_name, _span_evaluations_by_id in span_evaluations_by_name:
-            span_ids = []
-            rows = []
-            with self._lock:
-                span_evaluations_by_id = tuple(_span_evaluations_by_id.items())
-            for span_id, pb_eval in span_evaluations_by_id:
-                span_ids.append(span_id)
-                rows.append(MessageToDict(pb_eval.result))
-            dataframe = DataFrame(rows, index=Index(span_ids, name="context.span_id"))
-            span_evaluations.append(SpanEvaluations(eval_name, dataframe))
-        return span_evaluations
-    def _export_document_evaluations(self) -> List[DocumentEvaluations]:
-        evaluations = []
-        with self._lock:
-            document_evaluations_by_name = tuple(self._document_evaluations_by_name.items())
-        for eval_name, _document_evaluations_by_id in document_evaluations_by_name:
-            span_ids = []
-            document_positions = []
-            rows = []
-            with self._lock:
-                document_evaluations_by_id = tuple(_document_evaluations_by_id.items())
-            for span_id, _document_evaluations_by_position in document_evaluations_by_id:
-                with self._lock:
-                    document_evaluations_by_position = sorted(
-                        _document_evaluations_by_position.items()
-                    )  # ensure the evals are sorted by document position
-                for document_position, pb_eval in document_evaluations_by_position:
-                    span_ids.append(span_id)
-                    document_positions.append(document_position)
-                    rows.append(MessageToDict(pb_eval.result))
-            dataframe = DataFrame(
-                rows,
-                index=MultiIndex.from_arrays(
-                    (span_ids, document_positions),
-                    names=("context.span_id", "document_position"),
-                ),
-            )
-            evaluations.append(DocumentEvaluations(eval_name, dataframe))
-        return evaluations
-_CUMULATIVE_ATTRIBUTES: Mapping[ComputedAttributes, Union[str, ComputedAttributes]] = (
-    MappingProxyType(
-        {
-            ComputedAttributes.CUMULATIVE_LLM_TOKEN_COUNT_TOTAL: SpanAttributes.LLM_TOKEN_COUNT_TOTAL,  # noqa: E501
-            ComputedAttributes.CUMULATIVE_LLM_TOKEN_COUNT_PROMPT: SpanAttributes.LLM_TOKEN_COUNT_PROMPT,  # noqa: E501
-            ComputedAttributes.CUMULATIVE_LLM_TOKEN_COUNT_COMPLETION: SpanAttributes.LLM_TOKEN_COUNT_COMPLETION,  # noqa: E501
-            ComputedAttributes.CUMULATIVE_ERROR_COUNT: ComputedAttributes.ERROR_COUNT,
-        }
-    )
-)

arize-phoenix 3.25.0__py3-none-any.whl → 4.0.1__py3-none-any.whl

Potentially problematic release.

arize-phoenix 3.25.0py3-none-any.whl → 4.0.1py3-none-any.whl