PyPI - arize-phoenix - Versions diffs - 4.21.0__py3-none-any.whl → 4.22.1__py3-none-any.whl - Mend

arize-phoenix 4.21.0py3-none-any.whl → 4.22.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (28) hide show

{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/METADATA +1 -1
{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/RECORD +25 -25
phoenix/config.py +59 -1
phoenix/db/migrations/future_versions/README.md +4 -0
phoenix/db/migrations/future_versions/cd164e83824f_users_and_tokens.py +292 -0
phoenix/db/migrations/versions/.gitignore +1 -0
phoenix/db/models.py +61 -0
phoenix/experiments/functions.py +4 -4
phoenix/experiments/types.py +3 -3
phoenix/server/api/context.py +0 -6
phoenix/server/api/dataloaders/__init__.py +0 -9
phoenix/server/api/routers/v1/experiment_runs.py +7 -2
phoenix/server/api/types/Evaluation.py +1 -26
phoenix/server/api/types/Project.py +1 -60
phoenix/server/api/types/Span.py +1 -9
phoenix/server/app.py +0 -11
phoenix/server/dml_event_handler.py +0 -3
phoenix/server/static/.vite/manifest.json +9 -9
phoenix/server/static/assets/{components-D2V-mOGq.js → components-BC3-LP_a.js} +44 -44
phoenix/server/static/assets/{index-B52Z3aZG.js → index-BjJvafYL.js} +1 -1
phoenix/server/static/assets/{pages-CChOjmat.js → pages--n2933VW.js} +214 -195
phoenix/version.py +1 -1
phoenix/server/api/dataloaders/evaluation_summaries.py +0 -149
phoenix/server/api/dataloaders/span_evaluations.py +0 -35
phoenix/server/api/dataloaders/trace_evaluations.py +0 -35
{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/WHEEL +0 -0
{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/licenses/LICENSE +0 -0

phoenix/version.py CHANGED Viewed

	@@ -1 +1 @@
1	- __version__ = "4.21.0"
1	+ __version__ = "4.22.1"

phoenix/server/api/dataloaders/evaluation_summaries.py DELETED Viewed

@@ -1,149 +0,0 @@
-from collections import defaultdict
-from datetime import datetime
-from typing import (
-    Any,
-    DefaultDict,
-    List,
-    Literal,
-    Optional,
-    Tuple,
-)
-import pandas as pd
-from aioitertools.itertools import groupby
-from cachetools import LFUCache, TTLCache
-from sqlalchemy import Select, func, or_, select
-from strawberry.dataloader import AbstractCache, DataLoader
-from typing_extensions import TypeAlias, assert_never
-from phoenix.db import models
-from phoenix.server.api.dataloaders.cache import TwoTierCache
-from phoenix.server.api.input_types.TimeRange import TimeRange
-from phoenix.server.api.types.EvaluationSummary import EvaluationSummary
-from phoenix.server.types import DbSessionFactory
-from phoenix.trace.dsl import SpanFilter
-Kind: TypeAlias = Literal["span", "trace"]
-ProjectRowId: TypeAlias = int
-TimeInterval: TypeAlias = Tuple[Optional[datetime], Optional[datetime]]
-FilterCondition: TypeAlias = Optional[str]
-EvalName: TypeAlias = str
-Segment: TypeAlias = Tuple[Kind, ProjectRowId, TimeInterval, FilterCondition]
-Param: TypeAlias = EvalName
-Key: TypeAlias = Tuple[Kind, ProjectRowId, Optional[TimeRange], FilterCondition, EvalName]
-Result: TypeAlias = Optional[EvaluationSummary]
-ResultPosition: TypeAlias = int
-DEFAULT_VALUE: Result = None
-def _cache_key_fn(key: Key) -> Tuple[Segment, Param]:
-    kind, project_rowid, time_range, filter_condition, eval_name = key
-    interval = (
-        (time_range.start, time_range.end) if isinstance(time_range, TimeRange) else (None, None)
-    )
-    return (kind, project_rowid, interval, filter_condition), eval_name
-_Section: TypeAlias = Tuple[ProjectRowId, EvalName, Kind]
-_SubKey: TypeAlias = Tuple[TimeInterval, FilterCondition]
-class EvaluationSummaryCache(
-    TwoTierCache[Key, Result, _Section, _SubKey],
-):
-    def __init__(self) -> None:
-        super().__init__(
-            # TTL=3600 (1-hour) because time intervals are always moving forward, but
-            # interval endpoints are rounded down to the hour by the UI, so anything
-            # older than an hour most likely won't be a cache-hit anyway.
-            main_cache=TTLCache(maxsize=64 * 32 * 2, ttl=3600),
-            sub_cache_factory=lambda: LFUCache(maxsize=2 * 2),
-        )
-    def invalidate_project(self, project_rowid: ProjectRowId) -> None:
-        for section in self._cache.keys():
-            if section[0] == project_rowid:
-                del self._cache[section]
-    def _cache_key(self, key: Key) -> Tuple[_Section, _SubKey]:
-        (kind, project_rowid, interval, filter_condition), eval_name = _cache_key_fn(key)
-        return (project_rowid, eval_name, kind), (interval, filter_condition)
-class EvaluationSummaryDataLoader(DataLoader[Key, Result]):
-    def __init__(
-        self,
-        db: DbSessionFactory,
-        cache_map: Optional[AbstractCache[Key, Result]] = None,
-    ) -> None:
-        super().__init__(
-            load_fn=self._load_fn,
-            cache_key_fn=_cache_key_fn,
-            cache_map=cache_map,
-        )
-        self._db = db
-    async def _load_fn(self, keys: List[Key]) -> List[Result]:
-        results: List[Result] = [DEFAULT_VALUE] * len(keys)
-        arguments: DefaultDict[
-            Segment,
-            DefaultDict[Param, List[ResultPosition]],
-        ] = defaultdict(lambda: defaultdict(list))
-        for position, key in enumerate(keys):
-            segment, param = _cache_key_fn(key)
-            arguments[segment][param].append(position)
-        for segment, params in arguments.items():
-            stmt = _get_stmt(segment, *params.keys())
-            async with self._db() as session:
-                data = await session.stream(stmt)
-                async for eval_name, group in groupby(data, lambda row: row.name):
-                    summary = EvaluationSummary(pd.DataFrame(group))
-                    for position in params[eval_name]:
-                        results[position] = summary
-        return results
-def _get_stmt(
-    segment: Segment,
-    *eval_names: Param,
-) -> Select[Any]:
-    kind, project_rowid, (start_time, end_time), filter_condition = segment
-    stmt = select()
-    if kind == "span":
-        msa = models.SpanAnnotation
-        name_column, label_column, score_column = msa.name, msa.label, msa.score
-        annotator_kind_column = msa.annotator_kind
-        time_column = models.Span.start_time
-        stmt = stmt.join(models.Span).join_from(models.Span, models.Trace)
-        if filter_condition:
-            sf = SpanFilter(filter_condition)
-            stmt = sf(stmt)
-    elif kind == "trace":
-        mta = models.TraceAnnotation
-        name_column, label_column, score_column = mta.name, mta.label, mta.score
-        annotator_kind_column = mta.annotator_kind
-        time_column = models.Trace.start_time
-        stmt = stmt.join(models.Trace)
-    else:
-        assert_never(kind)
-    stmt = stmt.add_columns(
-        name_column,
-        label_column,
-        func.count().label("record_count"),
-        func.count(label_column).label("label_count"),
-        func.count(score_column).label("score_count"),
-        func.sum(score_column).label("score_sum"),
-    )
-    stmt = stmt.group_by(name_column, label_column)
-    stmt = stmt.order_by(name_column, label_column)
-    stmt = stmt.where(models.Trace.project_rowid == project_rowid)
-    stmt = stmt.where(annotator_kind_column == "LLM")
-    stmt = stmt.where(or_(score_column.is_not(None), label_column.is_not(None)))
-    stmt = stmt.where(name_column.in_(eval_names))
-    if start_time:
-        stmt = stmt.where(start_time <= time_column)
-    if end_time:
-        stmt = stmt.where(time_column < end_time)
-    return stmt

phoenix/server/api/dataloaders/span_evaluations.py DELETED Viewed

@@ -1,35 +0,0 @@
-from collections import defaultdict
-from typing import (
-    DefaultDict,
-    List,
-)
-from sqlalchemy import select
-from strawberry.dataloader import DataLoader
-from typing_extensions import TypeAlias
-from phoenix.db import models
-from phoenix.server.api.types.Evaluation import SpanEvaluation
-from phoenix.server.types import DbSessionFactory
-Key: TypeAlias = int
-Result: TypeAlias = List[SpanEvaluation]
-class SpanEvaluationsDataLoader(DataLoader[Key, Result]):
-    def __init__(self, db: DbSessionFactory) -> None:
-        super().__init__(load_fn=self._load_fn)
-        self._db = db
-    async def _load_fn(self, keys: List[Key]) -> List[Result]:
-        span_evaluations_by_id: DefaultDict[Key, Result] = defaultdict(list)
-        msa = models.SpanAnnotation
-        async with self._db() as session:
-            data = await session.stream_scalars(
-                select(msa).where(msa.span_rowid.in_(keys)).where(msa.annotator_kind == "LLM")
-            )
-            async for span_evaluation in data:
-                span_evaluations_by_id[span_evaluation.span_rowid].append(
-                    SpanEvaluation.from_sql_span_annotation(span_evaluation)
-                )
-        return [span_evaluations_by_id[key] for key in keys]

phoenix/server/api/dataloaders/trace_evaluations.py DELETED Viewed

@@ -1,35 +0,0 @@
-from collections import defaultdict
-from typing import (
-    DefaultDict,
-    List,
-)
-from sqlalchemy import select
-from strawberry.dataloader import DataLoader
-from typing_extensions import TypeAlias
-from phoenix.db import models
-from phoenix.server.api.types.Evaluation import TraceEvaluation
-from phoenix.server.types import DbSessionFactory
-Key: TypeAlias = int
-Result: TypeAlias = List[TraceEvaluation]
-class TraceEvaluationsDataLoader(DataLoader[Key, Result]):
-    def __init__(self, db: DbSessionFactory) -> None:
-        super().__init__(load_fn=self._load_fn)
-        self._db = db
-    async def _load_fn(self, keys: List[Key]) -> List[Result]:
-        trace_evaluations_by_id: DefaultDict[Key, Result] = defaultdict(list)
-        mta = models.TraceAnnotation
-        async with self._db() as session:
-            data = await session.stream_scalars(
-                select(mta).where(mta.trace_rowid.in_(keys)).where(mta.annotator_kind == "LLM")
-            )
-            async for trace_evaluation in data:
-                trace_evaluations_by_id[trace_evaluation.trace_rowid].append(
-                    TraceEvaluation.from_sql_trace_annotation(trace_evaluation)
-                )
-        return [trace_evaluations_by_id[key] for key in keys]

{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/WHEEL RENAMED Viewed

File without changes

{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/licenses/IP_NOTICE RENAMED Viewed

File without changes

{arize_phoenix-4.21.0.dist-info → arize_phoenix-4.22.1.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

arize-phoenix 4.21.0__py3-none-any.whl → 4.22.1__py3-none-any.whl

Potentially problematic release.

arize-phoenix 4.21.0py3-none-any.whl → 4.22.1py3-none-any.whl