PyPI - arize-phoenix - Versions diffs - 11.37.0__py3-none-any.whl → 12.0.0__py3-none-any.whl - Mend

arize-phoenix 11.37.0py3-none-any.whl → 12.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (75) hide show

phoenix/server/api/mutations/chat_mutations.py CHANGED Viewed

@@ -26,7 +26,10 @@ from typing_extensions import assert_never
 from phoenix.config import PLAYGROUND_PROJECT_NAME
 from phoenix.datetime_utils import local_now, normalize_datetime
 from phoenix.db import models
-from phoenix.db.helpers import get_dataset_example_revisions
+from phoenix.db.helpers import (
+    get_dataset_example_revisions,
+    insert_experiment_with_examples_snapshot,
+)
 from phoenix.server.api.auth import IsLocked, IsNotReadOnly
 from phoenix.server.api.context import Context
 from phoenix.server.api.exceptions import BadRequest, CustomGraphQLError, NotFound
@@ -46,6 +49,7 @@ from phoenix.server.api.helpers.playground_spans import (
     llm_tools,
     prompt_metadata,
 )
+from phoenix.server.api.helpers.playground_users import get_user
 from phoenix.server.api.helpers.prompts.models import PromptTemplateFormat
 from phoenix.server.api.input_types.ChatCompletionInput import (
     ChatCompletionInput,
@@ -112,6 +116,7 @@ class ChatCompletionMutationError:
 @strawberry.type
 class ChatCompletionOverDatasetMutationExamplePayload:
     dataset_example_id: GlobalID
+    repetition_number: int
     experiment_run_id: GlobalID
     result: Union[ChatCompletionMutationPayload, ChatCompletionMutationError]
@@ -191,6 +196,7 @@ class ChatCompletionMutationMixin:
             ]
             if not revisions:
                 raise NotFound("No examples found for the given dataset and version")
+            user_id = get_user(info)
             experiment = models.Experiment(
                 dataset_id=from_global_id_with_expected_type(input.dataset_id, Dataset.__name__),
                 dataset_version_id=resolved_version_id,
@@ -200,14 +206,19 @@ class ChatCompletionMutationMixin:
                 repetitions=1,
                 metadata_=input.experiment_metadata or dict(),
                 project_name=project_name,
+                user_id=user_id,
             )
-            session.add(experiment)
-            await session.flush()
+            await insert_experiment_with_examples_snapshot(session, experiment)
         results: list[Union[ChatCompletionMutationPayload, BaseException]] = []
         batch_size = 3
         start_time = datetime.now(timezone.utc)
-        for batch in _get_batches(revisions, batch_size):
+        unbatched_items = [
+            (revision, repetition_number)
+            for revision in revisions
+            for repetition_number in range(1, input.repetitions + 1)
+        ]
+        for batch in _get_batches(unbatched_items, batch_size):
             batch_results = await asyncio.gather(
                 *(
                     cls._chat_completion(
@@ -224,10 +235,11 @@ class ChatCompletionMutationMixin:
                                 variables=revision.input,
                             ),
                             prompt_name=input.prompt_name,
+                            repetitions=repetition_number,
                         ),
                         project_name=project_name,
                     )
-                    for revision in batch
+                    for revision, repetition_number in batch
                 ),
                 return_exceptions=True,
             )
@@ -239,13 +251,13 @@ class ChatCompletionMutationMixin:
             experiment_id=GlobalID(models.Experiment.__name__, str(experiment.id)),
         )
         experiment_runs = []
-        for revision, result in zip(revisions, results):
+        for (revision, repetition_number), result in zip(unbatched_items, results):
             if isinstance(result, BaseException):
                 experiment_run = models.ExperimentRun(
                     experiment_id=experiment.id,
                     dataset_example_id=revision.dataset_example_id,
                     output={},
-                    repetition_number=1,
+                    repetition_number=repetition_number,
                     start_time=start_time,
                     end_time=start_time,
                     error=str(result),
@@ -261,7 +273,7 @@ class ChatCompletionMutationMixin:
                     ),
                     prompt_token_count=db_span.cumulative_llm_token_count_prompt,
                     completion_token_count=db_span.cumulative_llm_token_count_completion,
-                    repetition_number=1,
+                    repetition_number=repetition_number,
                     start_time=db_span.start_time,
                     end_time=db_span.end_time,
                     error=str(result.error_message) if result.error_message else None,
@@ -272,13 +284,16 @@ class ChatCompletionMutationMixin:
             session.add_all(experiment_runs)
             await session.flush()
-        for revision, experiment_run, result in zip(revisions, experiment_runs, results):
+        for (revision, repetition_number), experiment_run, result in zip(
+            unbatched_items, experiment_runs, results
+        ):
             dataset_example_id = GlobalID(
                 models.DatasetExample.__name__, str(revision.dataset_example_id)
             )
             experiment_run_id = GlobalID(models.ExperimentRun.__name__, str(experiment_run.id))
             example_payload = ChatCompletionOverDatasetMutationExamplePayload(
                 dataset_example_id=dataset_example_id,
+                repetition_number=repetition_number,
                 experiment_run_id=experiment_run_id,
                 result=result
                 if isinstance(result, ChatCompletionMutationPayload)

phoenix/server/api/mutations/dataset_mutations.py CHANGED Viewed

@@ -66,6 +66,7 @@ class DatasetMutationMixin:
                     name=name,
                     description=description,
                     metadata_=metadata,
+                    user_id=info.context.user_id,
                 )
                 .returning(models.Dataset)
             )
@@ -136,6 +137,7 @@ class DatasetMutationMixin:
                 dataset_id=dataset_rowid,
                 description=dataset_version_description,
                 metadata_=dataset_version_metadata or {},
+                user_id=info.context.user_id,
             )
             session.add(dataset_version)
             await session.flush()
@@ -254,6 +256,7 @@ class DatasetMutationMixin:
                     dataset_id=dataset_rowid,
                     description=dataset_version_description,
                     metadata_=dataset_version_metadata,
+                    user_id=info.context.user_id,
                 )
                 .returning(models.DatasetVersion.id)
             )
@@ -451,6 +454,7 @@ class DatasetMutationMixin:
                     dataset_id=dataset.id,
                     description=version_description,
                     metadata_=version_metadata,
+                    user_id=info.context.user_id,
                 )
             )
             assert version_id is not None
@@ -514,6 +518,7 @@ class DatasetMutationMixin:
                     dataset_id=dataset.id,
                     description=dataset_version_description,
                     metadata_=dataset_version_metadata,
+                    user_id=info.context.user_id,
                     created_at=timestamp,
                 )
                 .returning(models.DatasetVersion.id)

phoenix/server/api/mutations/dataset_split_mutations.py ADDED Viewed

@@ -0,0 +1,387 @@
+from typing import Optional
+import strawberry
+from sqlalchemy import delete, func, insert, select
+from sqlalchemy.exc import IntegrityError as PostgreSQLIntegrityError
+from sqlean.dbapi2 import IntegrityError as SQLiteIntegrityError  # type: ignore[import-untyped]
+from strawberry import UNSET
+from strawberry.relay import GlobalID
+from strawberry.scalars import JSON
+from strawberry.types import Info
+from phoenix.db import models
+from phoenix.server.api.auth import IsLocked, IsNotReadOnly
+from phoenix.server.api.context import Context
+from phoenix.server.api.exceptions import BadRequest, Conflict, NotFound
+from phoenix.server.api.helpers.playground_users import get_user
+from phoenix.server.api.queries import Query
+from phoenix.server.api.types.DatasetSplit import DatasetSplit, to_gql_dataset_split
+from phoenix.server.api.types.node import from_global_id_with_expected_type
+@strawberry.input
+class CreateDatasetSplitInput:
+    name: str
+    description: Optional[str] = UNSET
+    color: str
+    metadata: Optional[JSON] = UNSET
+@strawberry.input
+class PatchDatasetSplitInput:
+    dataset_split_id: GlobalID
+    name: Optional[str] = UNSET
+    description: Optional[str] = UNSET
+    color: Optional[str] = UNSET
+    metadata: Optional[JSON] = UNSET
+@strawberry.input
+class DeleteDatasetSplitInput:
+    dataset_split_ids: list[GlobalID]
+@strawberry.input
+class AddDatasetExamplesToDatasetSplitsInput:
+    dataset_split_ids: list[GlobalID]
+    example_ids: list[GlobalID]
+@strawberry.input
+class RemoveDatasetExamplesFromDatasetSplitsInput:
+    dataset_split_ids: list[GlobalID]
+    example_ids: list[GlobalID]
+@strawberry.input
+class CreateDatasetSplitWithExamplesInput:
+    name: str
+    description: Optional[str] = UNSET
+    color: str
+    metadata: Optional[JSON] = UNSET
+    example_ids: list[GlobalID]
+@strawberry.type
+class DatasetSplitMutationPayload:
+    dataset_split: DatasetSplit
+    query: "Query"
+@strawberry.type
+class DeleteDatasetSplitsMutationPayload:
+    dataset_splits: list[DatasetSplit]
+    query: "Query"
+@strawberry.type
+class AddDatasetExamplesToDatasetSplitsMutationPayload:
+    query: "Query"
+@strawberry.type
+class RemoveDatasetExamplesFromDatasetSplitsMutationPayload:
+    query: "Query"
+@strawberry.type
+class DatasetSplitMutationMixin:
+    @strawberry.mutation(permission_classes=[IsNotReadOnly, IsLocked])  # type: ignore
+    async def create_dataset_split(
+        self, info: Info[Context, None], input: CreateDatasetSplitInput
+    ) -> DatasetSplitMutationPayload:
+        user_id = get_user(info)
+        validated_name = _validated_name(input.name)
+        async with info.context.db() as session:
+            dataset_split_orm = models.DatasetSplit(
+                name=validated_name,
+                description=input.description,
+                color=input.color,
+                metadata_=input.metadata or {},
+                user_id=user_id,
+            )
+            session.add(dataset_split_orm)
+            try:
+                await session.commit()
+            except (PostgreSQLIntegrityError, SQLiteIntegrityError):
+                raise Conflict(f"A dataset split named '{input.name}' already exists.")
+        return DatasetSplitMutationPayload(
+            dataset_split=to_gql_dataset_split(dataset_split_orm), query=Query()
+        )
+    @strawberry.mutation(permission_classes=[IsNotReadOnly, IsLocked])  # type: ignore
+    async def patch_dataset_split(
+        self, info: Info[Context, None], input: PatchDatasetSplitInput
+    ) -> DatasetSplitMutationPayload:
+        validated_name = _validated_name(input.name) if input.name else None
+        async with info.context.db() as session:
+            dataset_split_id = from_global_id_with_expected_type(
+                input.dataset_split_id, DatasetSplit.__name__
+            )
+            dataset_split_orm = await session.get(models.DatasetSplit, dataset_split_id)
+            if not dataset_split_orm:
+                raise NotFound(f"Dataset split with ID {input.dataset_split_id} not found")
+            if validated_name:
+                dataset_split_orm.name = validated_name
+            if input.description:
+                dataset_split_orm.description = input.description
+            if input.color:
+                dataset_split_orm.color = input.color
+            if isinstance(input.metadata, dict):
+                dataset_split_orm.metadata_ = input.metadata
+            gql_dataset_split = to_gql_dataset_split(dataset_split_orm)
+            try:
+                await session.commit()
+            except (PostgreSQLIntegrityError, SQLiteIntegrityError):
+                raise Conflict("A dataset split with this name already exists")
+        return DatasetSplitMutationPayload(
+            dataset_split=gql_dataset_split,
+            query=Query(),
+        )
+    @strawberry.mutation(permission_classes=[IsNotReadOnly])  # type: ignore
+    async def delete_dataset_splits(
+        self, info: Info[Context, None], input: DeleteDatasetSplitInput
+    ) -> DeleteDatasetSplitsMutationPayload:
+        unique_dataset_split_rowids: dict[int, None] = {}  # use a dict to preserve ordering
+        for dataset_split_gid in input.dataset_split_ids:
+            try:
+                dataset_split_rowid = from_global_id_with_expected_type(
+                    dataset_split_gid, DatasetSplit.__name__
+                )
+            except ValueError:
+                raise BadRequest(f"Invalid dataset split ID: {dataset_split_gid}")
+            unique_dataset_split_rowids[dataset_split_rowid] = None
+        dataset_split_rowids = list(unique_dataset_split_rowids.keys())
+        async with info.context.db() as session:
+            deleted_splits_by_id = {
+                split.id: split
+                for split in (
+                    await session.scalars(
+                        delete(models.DatasetSplit)
+                        .where(models.DatasetSplit.id.in_(dataset_split_rowids))
+                        .returning(models.DatasetSplit)
+                    )
+                ).all()
+            }
+            if len(deleted_splits_by_id) < len(dataset_split_rowids):
+                await session.rollback()
+                raise NotFound("One or more dataset splits not found")
+            await session.commit()
+        return DeleteDatasetSplitsMutationPayload(
+            dataset_splits=[
+                to_gql_dataset_split(deleted_splits_by_id[dataset_split_rowid])
+                for dataset_split_rowid in dataset_split_rowids
+            ],
+            query=Query(),
+        )
+    @strawberry.mutation(permission_classes=[IsNotReadOnly, IsLocked])  # type: ignore
+    async def add_dataset_examples_to_dataset_splits(
+        self, info: Info[Context, None], input: AddDatasetExamplesToDatasetSplitsInput
+    ) -> AddDatasetExamplesToDatasetSplitsMutationPayload:
+        if not input.example_ids:
+            raise BadRequest("No examples provided.")
+        if not input.dataset_split_ids:
+            raise BadRequest("No dataset splits provided.")
+        unique_dataset_split_rowids: set[int] = set()
+        for dataset_split_gid in input.dataset_split_ids:
+            try:
+                dataset_split_rowid = from_global_id_with_expected_type(
+                    dataset_split_gid, DatasetSplit.__name__
+                )
+            except ValueError:
+                raise BadRequest(f"Invalid dataset split ID: {dataset_split_gid}")
+            unique_dataset_split_rowids.add(dataset_split_rowid)
+        dataset_split_rowids = list(unique_dataset_split_rowids)
+        unique_example_rowids: set[int] = set()
+        for example_gid in input.example_ids:
+            try:
+                example_rowid = from_global_id_with_expected_type(
+                    example_gid, models.DatasetExample.__name__
+                )
+            except ValueError:
+                raise BadRequest(f"Invalid example ID: {example_gid}")
+            unique_example_rowids.add(example_rowid)
+        example_rowids = list(unique_example_rowids)
+        async with info.context.db() as session:
+            existing_dataset_split_ids = (
+                await session.scalars(
+                    select(models.DatasetSplit.id).where(
+                        models.DatasetSplit.id.in_(dataset_split_rowids)
+                    )
+                )
+            ).all()
+            if len(existing_dataset_split_ids) != len(dataset_split_rowids):
+                raise NotFound("One or more dataset splits not found")
+            # Find existing (dataset_split_id, dataset_example_id) keys to avoid duplicates
+            # Users can submit multiple examples at once which can have
+            # indeterminate participation in multiple splits
+            existing_dataset_example_split_keys = await session.execute(
+                select(
+                    models.DatasetSplitDatasetExample.dataset_split_id,
+                    models.DatasetSplitDatasetExample.dataset_example_id,
+                ).where(
+                    models.DatasetSplitDatasetExample.dataset_split_id.in_(dataset_split_rowids)
+                    & models.DatasetSplitDatasetExample.dataset_example_id.in_(example_rowids)
+                )
+            )
+            unique_dataset_example_split_keys = set(existing_dataset_example_split_keys.all())
+            # Compute all desired pairs and insert only missing
+            values = []
+            for dataset_split_rowid in dataset_split_rowids:
+                for example_rowid in example_rowids:
+                    # if the keys already exists, skip
+                    if (dataset_split_rowid, example_rowid) in unique_dataset_example_split_keys:
+                        continue
+                    dataset_split_id_key = models.DatasetSplitDatasetExample.dataset_split_id.key
+                    dataset_example_id_key = (
+                        models.DatasetSplitDatasetExample.dataset_example_id.key
+                    )
+                    values.append(
+                        {
+                            dataset_split_id_key: dataset_split_rowid,
+                            dataset_example_id_key: example_rowid,
+                        }
+                    )
+            if values:
+                try:
+                    await session.execute(insert(models.DatasetSplitDatasetExample), values)
+                    await session.flush()
+                except (PostgreSQLIntegrityError, SQLiteIntegrityError) as e:
+                    raise Conflict("Failed to add examples to dataset splits.") from e
+        return AddDatasetExamplesToDatasetSplitsMutationPayload(
+            query=Query(),
+        )
+    @strawberry.mutation(permission_classes=[IsNotReadOnly])  # type: ignore
+    async def remove_dataset_examples_from_dataset_splits(
+        self, info: Info[Context, None], input: RemoveDatasetExamplesFromDatasetSplitsInput
+    ) -> RemoveDatasetExamplesFromDatasetSplitsMutationPayload:
+        if not input.dataset_split_ids:
+            raise BadRequest("No dataset splits provided.")
+        if not input.example_ids:
+            raise BadRequest("No examples provided.")
+        unique_dataset_split_rowids: set[int] = set()
+        for dataset_split_gid in input.dataset_split_ids:
+            try:
+                dataset_split_rowid = from_global_id_with_expected_type(
+                    dataset_split_gid, DatasetSplit.__name__
+                )
+            except ValueError:
+                raise BadRequest(f"Invalid dataset split ID: {dataset_split_gid}")
+            unique_dataset_split_rowids.add(dataset_split_rowid)
+        dataset_split_rowids = list(unique_dataset_split_rowids)
+        unique_example_rowids: set[int] = set()
+        for example_gid in input.example_ids:
+            try:
+                example_rowid = from_global_id_with_expected_type(
+                    example_gid, models.DatasetExample.__name__
+                )
+            except ValueError:
+                raise BadRequest(f"Invalid example ID: {example_gid}")
+            unique_example_rowids.add(example_rowid)
+        example_rowids = list(unique_example_rowids)
+        stmt = delete(models.DatasetSplitDatasetExample).where(
+            models.DatasetSplitDatasetExample.dataset_split_id.in_(dataset_split_rowids)
+            & models.DatasetSplitDatasetExample.dataset_example_id.in_(example_rowids)
+        )
+        async with info.context.db() as session:
+            existing_dataset_split_ids = (
+                await session.scalars(
+                    select(models.DatasetSplit.id).where(
+                        models.DatasetSplit.id.in_(dataset_split_rowids)
+                    )
+                )
+            ).all()
+            if len(existing_dataset_split_ids) != len(dataset_split_rowids):
+                raise NotFound("One or more dataset splits not found")
+            await session.execute(stmt)
+        return RemoveDatasetExamplesFromDatasetSplitsMutationPayload(
+            query=Query(),
+        )
+    @strawberry.mutation(permission_classes=[IsNotReadOnly, IsLocked])  # type: ignore
+    async def create_dataset_split_with_examples(
+        self, info: Info[Context, None], input: CreateDatasetSplitWithExamplesInput
+    ) -> DatasetSplitMutationPayload:
+        user_id = get_user(info)
+        validated_name = _validated_name(input.name)
+        unique_example_rowids: set[int] = set()
+        for example_gid in input.example_ids:
+            try:
+                example_rowid = from_global_id_with_expected_type(
+                    example_gid, models.DatasetExample.__name__
+                )
+                unique_example_rowids.add(example_rowid)
+            except ValueError:
+                raise BadRequest(f"Invalid example ID: {example_gid}")
+        example_rowids = list(unique_example_rowids)
+        async with info.context.db() as session:
+            if example_rowids:
+                found_count = await session.scalar(
+                    select(func.count(models.DatasetExample.id)).where(
+                        models.DatasetExample.id.in_(example_rowids)
+                    )
+                )
+                if found_count is None or found_count < len(example_rowids):
+                    raise NotFound("One or more dataset examples were not found.")
+            dataset_split_orm = models.DatasetSplit(
+                name=validated_name,
+                description=input.description or None,
+                color=input.color,
+                metadata_=input.metadata or {},
+                user_id=user_id,
+            )
+            session.add(dataset_split_orm)
+            try:
+                await session.flush()
+            except (PostgreSQLIntegrityError, SQLiteIntegrityError):
+                raise Conflict(f"A dataset split named '{validated_name}' already exists.")
+            if example_rowids:
+                values = [
+                    {
+                        models.DatasetSplitDatasetExample.dataset_split_id.key: dataset_split_orm.id,  # noqa: E501
+                        models.DatasetSplitDatasetExample.dataset_example_id.key: example_id,
+                    }
+                    for example_id in example_rowids
+                ]
+                try:
+                    await session.execute(insert(models.DatasetSplitDatasetExample), values)
+                except (PostgreSQLIntegrityError, SQLiteIntegrityError) as e:
+                    # Roll back the transaction on association failure
+                    await session.rollback()
+                    raise Conflict(
+                        "Failed to associate examples with the new dataset split."
+                    ) from e
+        return DatasetSplitMutationPayload(
+            dataset_split=to_gql_dataset_split(dataset_split_orm),
+            query=Query(),
+        )
+def _validated_name(name: str) -> str:
+    validated_name = name.strip()
+    if not validated_name:
+        raise BadRequest("Name cannot be empty")
+    return validated_name

arize-phoenix 11.37.0__py3-none-any.whl → 12.0.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 11.37.0py3-none-any.whl → 12.0.0py3-none-any.whl