PyPI - arize-phoenix - Versions diffs - 4.4.4rc6__py3-none-any.whl → 4.5.0__py3-none-any.whl - Mend

arize-phoenix 4.4.4rc6py3-none-any.whl → 4.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (123) hide show

{arize_phoenix-4.4.4rc6.dist-info → arize_phoenix-4.5.0.dist-info}/METADATA +8 -14
{arize_phoenix-4.4.4rc6.dist-info → arize_phoenix-4.5.0.dist-info}/RECORD +58 -122
{arize_phoenix-4.4.4rc6.dist-info → arize_phoenix-4.5.0.dist-info}/WHEEL +1 -1
phoenix/__init__.py +27 -0
phoenix/config.py +7 -42
phoenix/core/model.py +25 -25
phoenix/core/model_schema.py +62 -64
phoenix/core/model_schema_adapter.py +25 -27
phoenix/datetime_utils.py +0 -4
phoenix/db/bulk_inserter.py +14 -54
phoenix/db/insertion/evaluation.py +10 -10
phoenix/db/insertion/helpers.py +14 -17
phoenix/db/insertion/span.py +3 -3
phoenix/db/migrations/versions/cf03bd6bae1d_init.py +28 -2
phoenix/db/models.py +4 -236
phoenix/inferences/fixtures.py +23 -23
phoenix/inferences/inferences.py +7 -7
phoenix/inferences/validation.py +1 -1
phoenix/server/api/context.py +0 -20
phoenix/server/api/dataloaders/__init__.py +0 -20
phoenix/server/api/dataloaders/span_descendants.py +3 -2
phoenix/server/api/routers/v1/__init__.py +2 -77
phoenix/server/api/routers/v1/evaluations.py +13 -8
phoenix/server/api/routers/v1/spans.py +5 -9
phoenix/server/api/routers/v1/traces.py +4 -1
phoenix/server/api/schema.py +303 -2
phoenix/server/api/types/Cluster.py +19 -19
phoenix/server/api/types/Dataset.py +63 -282
phoenix/server/api/types/DatasetRole.py +23 -0
phoenix/server/api/types/Dimension.py +29 -30
phoenix/server/api/types/EmbeddingDimension.py +34 -40
phoenix/server/api/types/Event.py +16 -16
phoenix/server/api/{mutations/export_events_mutations.py → types/ExportEventsMutation.py} +14 -17
phoenix/server/api/types/Model.py +42 -43
phoenix/server/api/types/Project.py +12 -26
phoenix/server/api/types/Span.py +2 -79
phoenix/server/api/types/TimeSeries.py +6 -6
phoenix/server/api/types/Trace.py +4 -15
phoenix/server/api/types/UMAPPoints.py +1 -1
phoenix/server/api/types/node.py +111 -5
phoenix/server/api/types/pagination.py +52 -10
phoenix/server/app.py +49 -103
phoenix/server/main.py +27 -49
phoenix/server/openapi/docs.py +0 -3
phoenix/server/static/index.js +1384 -2390
phoenix/server/templates/index.html +0 -1
phoenix/services.py +15 -15
phoenix/session/client.py +23 -611
phoenix/session/session.py +37 -47
phoenix/trace/exporter.py +9 -14
phoenix/trace/fixtures.py +7 -133
phoenix/trace/schemas.py +2 -1
phoenix/trace/span_evaluations.py +3 -3
phoenix/trace/trace_dataset.py +6 -6
phoenix/version.py +1 -1
phoenix/db/insertion/dataset.py +0 -237
phoenix/db/migrations/types.py +0 -29
phoenix/db/migrations/versions/10460e46d750_datasets.py +0 -291
phoenix/experiments/__init__.py +0 -6
phoenix/experiments/evaluators/__init__.py +0 -29
phoenix/experiments/evaluators/base.py +0 -153
phoenix/experiments/evaluators/code_evaluators.py +0 -99
phoenix/experiments/evaluators/llm_evaluators.py +0 -244
phoenix/experiments/evaluators/utils.py +0 -189
phoenix/experiments/functions.py +0 -616
phoenix/experiments/tracing.py +0 -85
phoenix/experiments/types.py +0 -722
phoenix/experiments/utils.py +0 -9
phoenix/server/api/dataloaders/average_experiment_run_latency.py +0 -54
phoenix/server/api/dataloaders/dataset_example_revisions.py +0 -100
phoenix/server/api/dataloaders/dataset_example_spans.py +0 -43
phoenix/server/api/dataloaders/experiment_annotation_summaries.py +0 -85
phoenix/server/api/dataloaders/experiment_error_rates.py +0 -43
phoenix/server/api/dataloaders/experiment_run_counts.py +0 -42
phoenix/server/api/dataloaders/experiment_sequence_number.py +0 -49
phoenix/server/api/dataloaders/project_by_name.py +0 -31
phoenix/server/api/dataloaders/span_projects.py +0 -33
phoenix/server/api/dataloaders/trace_row_ids.py +0 -39
phoenix/server/api/helpers/dataset_helpers.py +0 -179
phoenix/server/api/input_types/AddExamplesToDatasetInput.py +0 -16
phoenix/server/api/input_types/AddSpansToDatasetInput.py +0 -14
phoenix/server/api/input_types/ClearProjectInput.py +0 -15
phoenix/server/api/input_types/CreateDatasetInput.py +0 -12
phoenix/server/api/input_types/DatasetExampleInput.py +0 -14
phoenix/server/api/input_types/DatasetSort.py +0 -17
phoenix/server/api/input_types/DatasetVersionSort.py +0 -16
phoenix/server/api/input_types/DeleteDatasetExamplesInput.py +0 -13
phoenix/server/api/input_types/DeleteDatasetInput.py +0 -7
phoenix/server/api/input_types/DeleteExperimentsInput.py +0 -9
phoenix/server/api/input_types/PatchDatasetExamplesInput.py +0 -35
phoenix/server/api/input_types/PatchDatasetInput.py +0 -14
phoenix/server/api/mutations/__init__.py +0 -13
phoenix/server/api/mutations/auth.py +0 -11
phoenix/server/api/mutations/dataset_mutations.py +0 -520
phoenix/server/api/mutations/experiment_mutations.py +0 -65
phoenix/server/api/mutations/project_mutations.py +0 -47
phoenix/server/api/openapi/__init__.py +0 -0
phoenix/server/api/openapi/main.py +0 -6
phoenix/server/api/openapi/schema.py +0 -16
phoenix/server/api/queries.py +0 -503
phoenix/server/api/routers/v1/dataset_examples.py +0 -178
phoenix/server/api/routers/v1/datasets.py +0 -965
phoenix/server/api/routers/v1/experiment_evaluations.py +0 -65
phoenix/server/api/routers/v1/experiment_runs.py +0 -96
phoenix/server/api/routers/v1/experiments.py +0 -174
phoenix/server/api/types/AnnotatorKind.py +0 -10
phoenix/server/api/types/CreateDatasetPayload.py +0 -8
phoenix/server/api/types/DatasetExample.py +0 -85
phoenix/server/api/types/DatasetExampleRevision.py +0 -34
phoenix/server/api/types/DatasetVersion.py +0 -14
phoenix/server/api/types/ExampleRevisionInterface.py +0 -14
phoenix/server/api/types/Experiment.py +0 -147
phoenix/server/api/types/ExperimentAnnotationSummary.py +0 -13
phoenix/server/api/types/ExperimentComparison.py +0 -19
phoenix/server/api/types/ExperimentRun.py +0 -91
phoenix/server/api/types/ExperimentRunAnnotation.py +0 -57
phoenix/server/api/types/Inferences.py +0 -80
phoenix/server/api/types/InferencesRole.py +0 -23
phoenix/utilities/json.py +0 -61
phoenix/utilities/re.py +0 -50
{arize_phoenix-4.4.4rc6.dist-info → arize_phoenix-4.5.0.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-4.4.4rc6.dist-info → arize_phoenix-4.5.0.dist-info}/licenses/LICENSE +0 -0
/phoenix/server/api/{helpers/__init__.py → helpers.py} +0 -0

phoenix/server/api/types/Cluster.py CHANGED Viewed

@@ -9,9 +9,9 @@ from phoenix.core.model_schema import PRIMARY, REFERENCE
 from phoenix.server.api.context import Context
 from phoenix.server.api.input_types.DataQualityMetricInput import DataQualityMetricInput
 from phoenix.server.api.input_types.PerformanceMetricInput import PerformanceMetricInput
+from phoenix.server.api.types.DatasetRole import AncillaryDatasetRole, DatasetRole
 from phoenix.server.api.types.DatasetValues import DatasetValues
 from phoenix.server.api.types.Event import unpack_event_id
-from phoenix.server.api.types.InferencesRole import AncillaryInferencesRole, InferencesRole
 @strawberry.type
@@ -36,8 +36,8 @@ class Cluster:
         """
         Calculates the drift score of the cluster. The score will be a value
         representing the balance of points between the primary and the reference
-        inferences, and will be on a scale between 1 (all primary) and -1 (all
-        reference), with 0 being an even balance between the two inference sets.
+        datasets, and will be on a scale between 1 (all primary) and -1 (all
+        reference), with 0 being an even balance between the two datasets.
         Returns
         -------
@@ -47,8 +47,8 @@ class Cluster:
         if model[REFERENCE].empty:
             return None
         count_by_role = Counter(unpack_event_id(event_id)[1] for event_id in self.event_ids)
-        primary_count = count_by_role[InferencesRole.primary]
-        reference_count = count_by_role[InferencesRole.reference]
+        primary_count = count_by_role[DatasetRole.primary]
+        reference_count = count_by_role[DatasetRole.reference]
         return (
             None
             if not (denominator := (primary_count + reference_count))
@@ -76,8 +76,8 @@ class Cluster:
         if corpus is None or corpus[PRIMARY].empty:
             return None
         count_by_role = Counter(unpack_event_id(event_id)[1] for event_id in self.event_ids)
-        primary_count = count_by_role[InferencesRole.primary]
-        corpus_count = count_by_role[AncillaryInferencesRole.corpus]
+        primary_count = count_by_role[DatasetRole.primary]
+        corpus_count = count_by_role[AncillaryDatasetRole.corpus]
         return (
             None
             if not (denominator := (primary_count + corpus_count))
@@ -94,19 +94,19 @@ class Cluster:
         metric: DataQualityMetricInput,
     ) -> DatasetValues:
         model = info.context.model
-        row_ids: Dict[InferencesRole, List[int]] = defaultdict(list)
-        for row_id, inferences_role in map(unpack_event_id, self.event_ids):
-            if not isinstance(inferences_role, InferencesRole):
+        row_ids: Dict[DatasetRole, List[int]] = defaultdict(list)
+        for row_id, dataset_role in map(unpack_event_id, self.event_ids):
+            if not isinstance(dataset_role, DatasetRole):
                 continue
-            row_ids[inferences_role].append(row_id)
+            row_ids[dataset_role].append(row_id)
         return DatasetValues(
             primary_value=metric.metric_instance(
                 model[PRIMARY],
-                subset_rows=row_ids[InferencesRole.primary],
+                subset_rows=row_ids[DatasetRole.primary],
             ),
             reference_value=metric.metric_instance(
                 model[REFERENCE],
-                subset_rows=row_ids[InferencesRole.reference],
+                subset_rows=row_ids[DatasetRole.reference],
             ),
         )
@@ -120,20 +120,20 @@ class Cluster:
         metric: PerformanceMetricInput,
     ) -> DatasetValues:
         model = info.context.model
-        row_ids: Dict[InferencesRole, List[int]] = defaultdict(list)
-        for row_id, inferences_role in map(unpack_event_id, self.event_ids):
-            if not isinstance(inferences_role, InferencesRole):
+        row_ids: Dict[DatasetRole, List[int]] = defaultdict(list)
+        for row_id, dataset_role in map(unpack_event_id, self.event_ids):
+            if not isinstance(dataset_role, DatasetRole):
                 continue
-            row_ids[inferences_role].append(row_id)
+            row_ids[dataset_role].append(row_id)
         metric_instance = metric.metric_instance(model)
         return DatasetValues(
             primary_value=metric_instance(
                 model[PRIMARY],
-                subset_rows=row_ids[InferencesRole.primary],
+                subset_rows=row_ids[DatasetRole.primary],
             ),
             reference_value=metric_instance(
                 model[REFERENCE],
-                subset_rows=row_ids[InferencesRole.reference],
+                subset_rows=row_ids[DatasetRole.reference],
             ),
         )

phoenix/server/api/types/Dataset.py CHANGED Viewed

@@ -1,299 +1,80 @@
 from datetime import datetime
-from typing import AsyncIterable, List, Optional, Tuple, cast
+from typing import Iterable, List, Optional, Set, Union
 import strawberry
-from sqlalchemy import and_, func, select
-from sqlalchemy.sql.functions import count
-from strawberry import UNSET
-from strawberry.relay import Connection, GlobalID, Node, NodeID
-from strawberry.scalars import JSON
-from strawberry.types import Info
+from strawberry.scalars import ID
+from strawberry.unset import UNSET
-from phoenix.db import models
-from phoenix.server.api.context import Context
-from phoenix.server.api.input_types.DatasetVersionSort import DatasetVersionSort
-from phoenix.server.api.types.DatasetExample import DatasetExample
-from phoenix.server.api.types.DatasetVersion import DatasetVersion
-from phoenix.server.api.types.Experiment import Experiment, to_gql_experiment
-from phoenix.server.api.types.ExperimentAnnotationSummary import ExperimentAnnotationSummary
-from phoenix.server.api.types.node import from_global_id_with_expected_type
-from phoenix.server.api.types.pagination import (
-    ConnectionArgs,
-    CursorString,
-    connection_from_list,
-)
-from phoenix.server.api.types.SortDir import SortDir
+import phoenix.core.model_schema as ms
+from phoenix.core.model_schema import FEATURE, TAG, ScalarDimension
+from ..input_types.DimensionInput import DimensionInput
+from .DatasetRole import AncillaryDatasetRole, DatasetRole
+from .Dimension import Dimension, to_gql_dimension
+from .Event import Event, create_event, create_event_id, parse_event_ids_by_dataset_role
-@strawberry.type
-class Dataset(Node):
-    id_attr: NodeID[int]
-    name: str
-    description: Optional[str]
-    metadata: JSON
-    created_at: datetime
-    updated_at: datetime
-    @strawberry.field
-    async def versions(
-        self,
-        info: Info[Context, None],
-        first: Optional[int] = 50,
-        last: Optional[int] = UNSET,
-        after: Optional[CursorString] = UNSET,
-        before: Optional[CursorString] = UNSET,
-        sort: Optional[DatasetVersionSort] = UNSET,
-    ) -> Connection[DatasetVersion]:
-        args = ConnectionArgs(
-            first=first,
-            after=after if isinstance(after, CursorString) else None,
-            last=last,
-            before=before if isinstance(before, CursorString) else None,
-        )
-        async with info.context.db() as session:
-            stmt = select(models.DatasetVersion).filter_by(dataset_id=self.id_attr)
-            if sort:
-                # For now assume the the column names match 1:1 with the enum values
-                sort_col = getattr(models.DatasetVersion, sort.col.value)
-                if sort.dir is SortDir.desc:
-                    stmt = stmt.order_by(sort_col.desc(), models.DatasetVersion.id.desc())
-                else:
-                    stmt = stmt.order_by(sort_col.asc(), models.DatasetVersion.id.asc())
-            else:
-                stmt = stmt.order_by(models.DatasetVersion.created_at.desc())
-            versions = await session.scalars(stmt)
-        data = [
-            DatasetVersion(
-                id_attr=version.id,
-                description=version.description,
-                metadata=version.metadata_,
-                created_at=version.created_at,
-            )
-            for version in versions
-        ]
-        return connection_from_list(data=data, args=args)
-    @strawberry.field(
-        description="Number of examples in a specific version if version is specified, or in the "
-        "latest version if version is not specified."
-    )  # type: ignore
-    async def example_count(
-        self,
-        info: Info[Context, None],
-        dataset_version_id: Optional[GlobalID] = UNSET,
-    ) -> int:
-        dataset_id = self.id_attr
-        version_id = (
-            from_global_id_with_expected_type(
-                global_id=dataset_version_id,
-                expected_type_name=DatasetVersion.__name__,
-            )
-            if dataset_version_id
-            else None
-        )
-        revision_ids = (
-            select(func.max(models.DatasetExampleRevision.id))
-            .join(models.DatasetExample)
-            .where(models.DatasetExample.dataset_id == dataset_id)
-            .group_by(models.DatasetExampleRevision.dataset_example_id)
-        )
-        if version_id:
-            version_id_subquery = (
-                select(models.DatasetVersion.id)
-                .where(models.DatasetVersion.dataset_id == dataset_id)
-                .where(models.DatasetVersion.id == version_id)
-                .scalar_subquery()
-            )
-            revision_ids = revision_ids.where(
-                models.DatasetExampleRevision.dataset_version_id <= version_id_subquery
-            )
-        stmt = (
-            select(count(models.DatasetExampleRevision.id))
-            .where(models.DatasetExampleRevision.id.in_(revision_ids))
-            .where(models.DatasetExampleRevision.revision_kind != "DELETE")
-        )
-        async with info.context.db() as session:
-            return (await session.scalar(stmt)) or 0
-    @strawberry.field
-    async def examples(
-        self,
-        info: Info[Context, None],
-        dataset_version_id: Optional[GlobalID] = UNSET,
-        first: Optional[int] = 50,
-        last: Optional[int] = UNSET,
-        after: Optional[CursorString] = UNSET,
-        before: Optional[CursorString] = UNSET,
-    ) -> Connection[DatasetExample]:
-        args = ConnectionArgs(
-            first=first,
-            after=after if isinstance(after, CursorString) else None,
-            last=last,
-            before=before if isinstance(before, CursorString) else None,
-        )
-        dataset_id = self.id_attr
-        version_id = (
-            from_global_id_with_expected_type(
-                global_id=dataset_version_id, expected_type_name=DatasetVersion.__name__
-            )
-            if dataset_version_id
-            else None
-        )
-        revision_ids = (
-            select(func.max(models.DatasetExampleRevision.id))
-            .join(models.DatasetExample)
-            .where(models.DatasetExample.dataset_id == dataset_id)
-            .group_by(models.DatasetExampleRevision.dataset_example_id)
-        )
-        if version_id:
-            version_id_subquery = (
-                select(models.DatasetVersion.id)
-                .where(models.DatasetVersion.dataset_id == dataset_id)
-                .where(models.DatasetVersion.id == version_id)
-                .scalar_subquery()
-            )
-            revision_ids = revision_ids.where(
-                models.DatasetExampleRevision.dataset_version_id <= version_id_subquery
-            )
-        query = (
-            select(models.DatasetExample)
-            .join(
-                models.DatasetExampleRevision,
-                onclause=models.DatasetExample.id
-                == models.DatasetExampleRevision.dataset_example_id,
-            )
-            .where(
-                and_(
-                    models.DatasetExampleRevision.id.in_(revision_ids),
-                    models.DatasetExampleRevision.revision_kind != "DELETE",
-                )
-            )
-            .order_by(models.DatasetExampleRevision.dataset_example_id.desc())
-        )
-        async with info.context.db() as session:
-            dataset_examples = [
-                DatasetExample(
-                    id_attr=example.id,
-                    version_id=version_id,
-                    created_at=example.created_at,
-                )
-                async for example in await session.stream_scalars(query)
-            ]
-        return connection_from_list(data=dataset_examples, args=args)
+@strawberry.type
+class Dataset:
+    start_time: datetime = strawberry.field(description="The start bookend of the data")
+    end_time: datetime = strawberry.field(description="The end bookend of the data")
+    record_count: int = strawberry.field(description="The record count of the data")
+    dataset: strawberry.Private[ms.Dataset]
+    dataset_role: strawberry.Private[Union[DatasetRole, AncillaryDatasetRole]]
+    model: strawberry.Private[ms.Model]
-    @strawberry.field(
-        description="Number of experiments for a specific version if version is specified, "
-        "or for all versions if version is not specified."
-    )  # type: ignore
-    async def experiment_count(
-        self,
-        info: Info[Context, None],
-        dataset_version_id: Optional[GlobalID] = UNSET,
-    ) -> int:
-        stmt = select(count(models.Experiment.id)).where(
-            models.Experiment.dataset_id == self.id_attr
-        )
-        version_id = (
-            from_global_id_with_expected_type(
-                global_id=dataset_version_id,
-                expected_type_name=DatasetVersion.__name__,
-            )
-            if dataset_version_id
-            else None
-        )
-        if version_id is not None:
-            stmt = stmt.where(models.Experiment.dataset_version_id == version_id)
-        async with info.context.db() as session:
-            return (await session.scalar(stmt)) or 0
+    # type ignored here to get around the following: https://github.com/strawberry-graphql/strawberry/issues/1929
+    @strawberry.field(description="Returns a human friendly name for the dataset.")  # type: ignore
+    def name(self) -> str:
+        return self.dataset.display_name
     @strawberry.field
-    async def experiments(
+    def events(
         self,
-        info: Info[Context, None],
-        first: Optional[int] = 50,
-        last: Optional[int] = UNSET,
-        after: Optional[CursorString] = UNSET,
-        before: Optional[CursorString] = UNSET,
-    ) -> Connection[Experiment]:
-        args = ConnectionArgs(
-            first=first,
-            after=after if isinstance(after, CursorString) else None,
-            last=last,
-            before=before if isinstance(before, CursorString) else None,
-        )
-        dataset_id = self.id_attr
-        row_number = func.row_number().over(order_by=models.Experiment.id).label("row_number")
-        query = (
-            select(models.Experiment, row_number)
-            .where(models.Experiment.dataset_id == dataset_id)
-            .order_by(models.Experiment.id.desc())
+        event_ids: List[ID],
+        dimensions: Optional[List[DimensionInput]] = UNSET,
+    ) -> List[Event]:
+        """
+        Returns events for specific event IDs and dimensions. If no input
+        dimensions are provided, returns all features and tags.
+        """
+        if not event_ids:
+            return []
+        row_ids = parse_event_ids_by_dataset_role(event_ids)
+        if len(row_ids) > 1 or self.dataset_role not in row_ids:
+            raise ValueError("eventIds contains IDs from incorrect dataset.")
+        events = self.dataset[row_ids[self.dataset_role]]
+        requested_gql_dimensions = _get_requested_features_and_tags(
+            core_dimensions=self.model.scalar_dimensions,
+            requested_dimension_names=set(dim.name for dim in dimensions)
+            if isinstance(dimensions, list)
+            else None,
         )
-        async with info.context.db() as session:
-            experiments = [
-                to_gql_experiment(experiment, sequence_number)
-                async for experiment, sequence_number in cast(
-                    AsyncIterable[Tuple[models.Experiment, int]],
-                    await session.stream(query),
-                )
-            ]
-        return connection_from_list(data=experiments, args=args)
-    @strawberry.field
-    async def experiment_annotation_summaries(
-        self, info: Info[Context, None]
-    ) -> List[ExperimentAnnotationSummary]:
-        dataset_id = self.id_attr
-        query = (
-            select(
-                models.ExperimentRunAnnotation.name,
-                func.min(models.ExperimentRunAnnotation.score),
-                func.max(models.ExperimentRunAnnotation.score),
-                func.avg(models.ExperimentRunAnnotation.score),
-                func.count(),
-                func.count(models.ExperimentRunAnnotation.error),
+        return [
+            create_event(
+                event_id=create_event_id(event.id.row_id, self.dataset_role),
+                event=event,
+                dimensions=requested_gql_dimensions,
+                is_document_record=self.dataset_role is AncillaryDatasetRole.corpus,
             )
-            .join(
-                models.ExperimentRun,
-                models.ExperimentRunAnnotation.experiment_run_id == models.ExperimentRun.id,
-            )
-            .join(
-                models.Experiment,
-                models.ExperimentRun.experiment_id == models.Experiment.id,
-            )
-            .where(models.Experiment.dataset_id == dataset_id)
-            .group_by(models.ExperimentRunAnnotation.name)
-            .order_by(models.ExperimentRunAnnotation.name)
-        )
-        async with info.context.db() as session:
-            return [
-                ExperimentAnnotationSummary(
-                    annotation_name=annotation_name,
-                    min_score=min_score,
-                    max_score=max_score,
-                    mean_score=mean_score,
-                    count=count_,
-                    error_count=error_count,
-                )
-                async for (
-                    annotation_name,
-                    min_score,
-                    max_score,
-                    mean_score,
-                    count_,
-                    error_count,
-                ) in await session.stream(query)
-            ]
+            for event in events
+        ]
-def to_gql_dataset(dataset: models.Dataset) -> Dataset:
+def _get_requested_features_and_tags(
+    core_dimensions: Iterable[ScalarDimension],
+    requested_dimension_names: Optional[Set[str]] = UNSET,
+) -> List[Dimension]:
     """
-    Converts an ORM dataset to a GraphQL dataset.
+    Returns requested features and tags as a list of strawberry Datasets. If no
+    dimensions are explicitly requested, returns all features and tags.
     """
-    return Dataset(
-        id_attr=dataset.id,
-        name=dataset.name,
-        description=dataset.description,
-        metadata=dataset.metadata_,
-        created_at=dataset.created_at,
-        updated_at=dataset.updated_at,
-    )
+    requested_features_and_tags: List[Dimension] = []
+    for id, dim in enumerate(core_dimensions):
+        is_requested = (
+            not isinstance(requested_dimension_names, Set)
+        ) or dim.name in requested_dimension_names
+        is_feature_or_tag = dim.role in (FEATURE, TAG)
+        if is_requested and is_feature_or_tag:
+            requested_features_and_tags.append(to_gql_dimension(id_attr=id, dimension=dim))
+    return requested_features_and_tags

phoenix/server/api/types/DatasetRole.py ADDED Viewed

@@ -0,0 +1,23 @@
+from enum import Enum
+from typing import Dict, Union
+import strawberry
+from phoenix.core.model_schema import PRIMARY, REFERENCE
+@strawberry.enum
+class DatasetRole(Enum):
+    primary = PRIMARY
+    reference = REFERENCE
+class AncillaryDatasetRole(Enum):
+    corpus = "DatasetRole.CORPUS"
+STR_TO_DATASET_ROLE: Dict[str, Union[DatasetRole, AncillaryDatasetRole]] = {
+    str(DatasetRole.primary.value): DatasetRole.primary,
+    str(DatasetRole.reference.value): DatasetRole.reference,
+    str(AncillaryDatasetRole.corpus.value): AncillaryDatasetRole.corpus,
+}

phoenix/server/api/types/Dimension.py CHANGED Viewed

@@ -4,7 +4,6 @@ from typing import Any, Dict, List, Optional
 import pandas as pd
 import strawberry
 from strawberry import UNSET
-from strawberry.relay import Node, NodeID
 from strawberry.types import Info
 from typing_extensions import Annotated
@@ -18,11 +17,12 @@ from ..context import Context
 from ..input_types.Granularity import Granularity
 from ..input_types.TimeRange import TimeRange
 from .DataQualityMetric import DataQualityMetric
+from .DatasetRole import DatasetRole
 from .DatasetValues import DatasetValues
 from .DimensionDataType import DimensionDataType
 from .DimensionShape import DimensionShape
 from .DimensionType import DimensionType
-from .InferencesRole import InferencesRole
+from .node import Node
 from .ScalarDriftMetricEnum import ScalarDriftMetric
 from .Segments import (
     GqlBinFactory,
@@ -40,7 +40,6 @@ from .TimeSeries import (
 @strawberry.type
 class Dimension(Node):
-    id_attr: NodeID[int]
     name: str = strawberry.field(description="The name of the dimension (a.k.a. the column name)")
     type: DimensionType = strawberry.field(
         description="Whether the dimension represents a feature, tag, prediction, or actual."
@@ -63,16 +62,16 @@ class Dimension(Node):
         """
         Computes a drift metric between all reference data and the primary data
         belonging to the input time range (inclusive of the time range start and
-        exclusive of the time range end). Returns None if no reference inferences
-        exist, if no primary data exists in the input time range, or if the
+        exclusive of the time range end). Returns None if no reference dataset
+        exists, if no primary data exists in the input time range, or if the
         input time range is invalid.
         """
         model = info.context.model
         if model[REFERENCE].empty:
             return None
-        inferences = model[PRIMARY]
+        dataset = model[PRIMARY]
         time_range, granularity = ensure_timeseries_parameters(
-            inferences,
+            dataset,
             time_range,
         )
         data = get_drift_timeseries_data(
@@ -93,18 +92,18 @@ class Dimension(Node):
         info: Info[Context, None],
         metric: DataQualityMetric,
         time_range: Optional[TimeRange] = UNSET,
-        inferences_role: Annotated[
-            Optional[InferencesRole],
+        dataset_role: Annotated[
+            Optional[DatasetRole],
             strawberry.argument(
-                description="The inferences (primary or reference) to query",
+                description="The dataset (primary or reference) to query",
             ),
-        ] = InferencesRole.primary,
+        ] = DatasetRole.primary,
     ) -> Optional[float]:
-        if not isinstance(inferences_role, InferencesRole):
-            inferences_role = InferencesRole.primary
-        inferences = info.context.model[inferences_role.value]
+        if not isinstance(dataset_role, DatasetRole):
+            dataset_role = DatasetRole.primary
+        dataset = info.context.model[dataset_role.value]
         time_range, granularity = ensure_timeseries_parameters(
-            inferences,
+            dataset,
             time_range,
         )
         data = get_data_quality_timeseries_data(
@@ -112,7 +111,7 @@ class Dimension(Node):
             metric,
             time_range,
             granularity,
-            inferences_role,
+            dataset_role,
         )
         return data[0].value if len(data) else None
@@ -140,18 +139,18 @@ class Dimension(Node):
         metric: DataQualityMetric,
         time_range: TimeRange,
         granularity: Granularity,
-        inferences_role: Annotated[
-            Optional[InferencesRole],
+        dataset_role: Annotated[
+            Optional[DatasetRole],
             strawberry.argument(
-                description="The inferences (primary or reference) to query",
+                description="The dataset (primary or reference) to query",
             ),
-        ] = InferencesRole.primary,
+        ] = DatasetRole.primary,
     ) -> DataQualityTimeSeries:
-        if not isinstance(inferences_role, InferencesRole):
-            inferences_role = InferencesRole.primary
-        inferences = info.context.model[inferences_role.value]
+        if not isinstance(dataset_role, DatasetRole):
+            dataset_role = DatasetRole.primary
+        dataset = info.context.model[dataset_role.value]
         time_range, granularity = ensure_timeseries_parameters(
-            inferences,
+            dataset,
             time_range,
             granularity,
         )
@@ -161,7 +160,7 @@ class Dimension(Node):
                 metric,
                 time_range,
                 granularity,
-                inferences_role,
+                dataset_role,
             )
         )
@@ -183,9 +182,9 @@ class Dimension(Node):
         model = info.context.model
         if model[REFERENCE].empty:
             return DriftTimeSeries(data=[])
-        inferences = model[PRIMARY]
+        dataset = model[PRIMARY]
         time_range, granularity = ensure_timeseries_parameters(
-            inferences,
+            dataset,
             time_range,
             granularity,
         )
@@ -203,7 +202,7 @@ class Dimension(Node):
         )
     @strawberry.field(
-        description="The segments across both inference sets and returns the counts per segment",
+        description="Returns the segments across both datasets and returns the counts per segment",
     )  # type: ignore
     def segments_comparison(
         self,
@@ -250,8 +249,8 @@ class Dimension(Node):
         if isinstance(binning_method, binning.IntervalBinning) and binning_method.bins is not None:
             all_bins = all_bins.union(binning_method.bins)
         for bin in all_bins:
-            values: Dict[ms.InferencesRole, Any] = defaultdict(lambda: None)
-            for role in ms.InferencesRole:
+            values: Dict[ms.DatasetRole, Any] = defaultdict(lambda: None)
+            for role in ms.DatasetRole:
                 if model[role].empty:
                     continue
                 try:

arize-phoenix 4.4.4rc6__py3-none-any.whl → 4.5.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 4.4.4rc6py3-none-any.whl → 4.5.0py3-none-any.whl