PyPI - arize-phoenix - Versions diffs - 3.25.0__py3-none-any.whl → 4.0.0__py3-none-any.whl - Mend

arize-phoenix 3.25.0py3-none-any.whl → 4.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (113) hide show

{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.0.dist-info}/METADATA +26 -4
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.0.dist-info}/RECORD +80 -75
phoenix/__init__.py +9 -5
phoenix/config.py +109 -53
phoenix/datetime_utils.py +18 -1
phoenix/db/README.md +25 -0
phoenix/db/__init__.py +4 -0
phoenix/db/alembic.ini +119 -0
phoenix/db/bulk_inserter.py +206 -0
phoenix/db/engines.py +152 -0
phoenix/db/helpers.py +47 -0
phoenix/db/insertion/evaluation.py +209 -0
phoenix/db/insertion/helpers.py +54 -0
phoenix/db/insertion/span.py +142 -0
phoenix/db/migrate.py +71 -0
phoenix/db/migrations/env.py +121 -0
phoenix/db/migrations/script.py.mako +26 -0
phoenix/db/migrations/versions/cf03bd6bae1d_init.py +280 -0
phoenix/db/models.py +371 -0
phoenix/exceptions.py +5 -1
phoenix/server/api/context.py +40 -3
phoenix/server/api/dataloaders/__init__.py +97 -0
phoenix/server/api/dataloaders/cache/__init__.py +3 -0
phoenix/server/api/dataloaders/cache/two_tier_cache.py +67 -0
phoenix/server/api/dataloaders/document_evaluation_summaries.py +152 -0
phoenix/server/api/dataloaders/document_evaluations.py +37 -0
phoenix/server/api/dataloaders/document_retrieval_metrics.py +98 -0
phoenix/server/api/dataloaders/evaluation_summaries.py +151 -0
phoenix/server/api/dataloaders/latency_ms_quantile.py +198 -0
phoenix/server/api/dataloaders/min_start_or_max_end_times.py +93 -0
phoenix/server/api/dataloaders/record_counts.py +125 -0
phoenix/server/api/dataloaders/span_descendants.py +64 -0
phoenix/server/api/dataloaders/span_evaluations.py +37 -0
phoenix/server/api/dataloaders/token_counts.py +138 -0
phoenix/server/api/dataloaders/trace_evaluations.py +37 -0
phoenix/server/api/input_types/SpanSort.py +138 -68
phoenix/server/api/routers/v1/__init__.py +11 -0
phoenix/server/api/routers/v1/evaluations.py +275 -0
phoenix/server/api/routers/v1/spans.py +126 -0
phoenix/server/api/routers/v1/traces.py +82 -0
phoenix/server/api/schema.py +112 -48
phoenix/server/api/types/DocumentEvaluationSummary.py +1 -1
phoenix/server/api/types/Evaluation.py +29 -12
phoenix/server/api/types/EvaluationSummary.py +29 -44
phoenix/server/api/types/MimeType.py +2 -2
phoenix/server/api/types/Model.py +9 -9
phoenix/server/api/types/Project.py +240 -171
phoenix/server/api/types/Span.py +87 -131
phoenix/server/api/types/Trace.py +29 -20
phoenix/server/api/types/pagination.py +151 -10
phoenix/server/app.py +263 -35
phoenix/server/grpc_server.py +93 -0
phoenix/server/main.py +75 -60
phoenix/server/openapi/docs.py +218 -0
phoenix/server/prometheus.py +23 -7
phoenix/server/static/index.js +662 -643
phoenix/server/telemetry.py +68 -0
phoenix/services.py +4 -0
phoenix/session/client.py +34 -30
phoenix/session/data_extractor.py +8 -3
phoenix/session/session.py +176 -155
phoenix/settings.py +13 -0
phoenix/trace/attributes.py +349 -0
phoenix/trace/dsl/README.md +116 -0
phoenix/trace/dsl/filter.py +660 -192
phoenix/trace/dsl/helpers.py +24 -5
phoenix/trace/dsl/query.py +562 -185
phoenix/trace/fixtures.py +69 -7
phoenix/trace/otel.py +33 -199
phoenix/trace/schemas.py +14 -8
phoenix/trace/span_evaluations.py +5 -2
phoenix/utilities/__init__.py +0 -26
phoenix/utilities/span_store.py +0 -23
phoenix/version.py +1 -1
phoenix/core/project.py +0 -773
phoenix/core/traces.py +0 -96
phoenix/datasets/dataset.py +0 -214
phoenix/datasets/fixtures.py +0 -24
phoenix/datasets/schema.py +0 -31
phoenix/experimental/evals/__init__.py +0 -73
phoenix/experimental/evals/evaluators.py +0 -413
phoenix/experimental/evals/functions/__init__.py +0 -4
phoenix/experimental/evals/functions/classify.py +0 -453
phoenix/experimental/evals/functions/executor.py +0 -353
phoenix/experimental/evals/functions/generate.py +0 -138
phoenix/experimental/evals/functions/processing.py +0 -76
phoenix/experimental/evals/models/__init__.py +0 -14
phoenix/experimental/evals/models/anthropic.py +0 -175
phoenix/experimental/evals/models/base.py +0 -170
phoenix/experimental/evals/models/bedrock.py +0 -221
phoenix/experimental/evals/models/litellm.py +0 -134
phoenix/experimental/evals/models/openai.py +0 -453
phoenix/experimental/evals/models/rate_limiters.py +0 -246
phoenix/experimental/evals/models/vertex.py +0 -173
phoenix/experimental/evals/models/vertexai.py +0 -186
phoenix/experimental/evals/retrievals.py +0 -96
phoenix/experimental/evals/templates/__init__.py +0 -50
phoenix/experimental/evals/templates/default_templates.py +0 -472
phoenix/experimental/evals/templates/template.py +0 -195
phoenix/experimental/evals/utils/__init__.py +0 -172
phoenix/experimental/evals/utils/threads.py +0 -27
phoenix/server/api/routers/evaluation_handler.py +0 -110
phoenix/server/api/routers/span_handler.py +0 -70
phoenix/server/api/routers/trace_handler.py +0 -60
phoenix/storage/span_store/__init__.py +0 -23
phoenix/storage/span_store/text_file.py +0 -85
phoenix/trace/dsl/missing.py +0 -60
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.0.dist-info}/WHEEL +0 -0
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.0.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-3.25.0.dist-info → arize_phoenix-4.0.0.dist-info}/licenses/LICENSE +0 -0
/phoenix/{datasets → db/insertion}/__init__.py +0 -0
/phoenix/{experimental → db/migrations}/__init__.py +0 -0
/phoenix/{storage → server/openapi}/__init__.py +0 -0

phoenix/core/traces.py DELETED Viewed

@@ -1,96 +0,0 @@
-import weakref
-from collections import defaultdict
-from queue import SimpleQueue
-from threading import RLock, Thread
-from types import MethodType
-from typing import DefaultDict, Iterator, Optional, Tuple, Union
-from typing_extensions import assert_never
-import phoenix.trace.v1 as pb
-from phoenix.config import DEFAULT_PROJECT_NAME
-from phoenix.core.project import (
-    END_OF_QUEUE,
-    Project,
-    _ProjectName,
-)
-from phoenix.trace.schemas import Span
-_SpanItem = Tuple[Span, _ProjectName]
-_EvalItem = Tuple[pb.Evaluation, _ProjectName]
-class Traces:
-    def __init__(self) -> None:
-        self._span_queue: "SimpleQueue[Optional[_SpanItem]]" = SimpleQueue()
-        self._eval_queue: "SimpleQueue[Optional[_EvalItem]]" = SimpleQueue()
-        # Putting `None` as the sentinel value for queue termination.
-        weakref.finalize(self, self._span_queue.put, END_OF_QUEUE)
-        weakref.finalize(self, self._eval_queue.put, END_OF_QUEUE)
-        self._lock = RLock()
-        self._projects: DefaultDict[_ProjectName, "Project"] = defaultdict(
-            Project,
-            {DEFAULT_PROJECT_NAME: Project()},
-        )
-        self._start_consumers()
-    def get_project(self, project_name: str) -> Optional["Project"]:
-        with self._lock:
-            return self._projects.get(project_name)
-    def get_projects(self) -> Iterator[Tuple[int, str, "Project"]]:
-        with self._lock:
-            for project_id, (project_name, project) in enumerate(self._projects.items()):
-                if project.is_archived:
-                    continue
-                yield project_id, project_name, project
-    def archive_project(self, id: int) -> Optional["Project"]:
-        if id == 0:
-            raise ValueError("Cannot archive the default project")
-        with self._lock:
-            for project_id, _, project in self.get_projects():
-                if id == project_id:
-                    project.archive()
-                    return project
-        return None
-    def put(
-        self,
-        item: Union[Span, pb.Evaluation],
-        project_name: Optional[str] = None,
-    ) -> None:
-        if not project_name:
-            project_name = DEFAULT_PROJECT_NAME
-        if isinstance(item, Span):
-            self._span_queue.put((item, project_name))
-        elif isinstance(item, pb.Evaluation):
-            self._eval_queue.put((item, project_name))
-        else:
-            assert_never(item)
-    def _start_consumers(self) -> None:
-        Thread(
-            target=MethodType(self.__class__._consume_spans, weakref.proxy(self)),
-            args=(self._span_queue,),
-            daemon=True,
-        ).start()
-        Thread(
-            target=MethodType(self.__class__._consume_evals, weakref.proxy(self)),
-            args=(self._eval_queue,),
-            daemon=True,
-        ).start()
-    def _consume_spans(self, queue: "SimpleQueue[Optional[_SpanItem]]") -> None:
-        while (item := queue.get()) is not END_OF_QUEUE:
-            span, project_name = item
-            with self._lock:
-                project = self._projects[project_name]
-            project.add_span(span)
-    def _consume_evals(self, queue: "SimpleQueue[Optional[_EvalItem]]") -> None:
-        while (item := queue.get()) is not END_OF_QUEUE:
-            pb_eval, project_name = item
-            with self._lock:
-                project = self._projects[project_name]
-            project.add_eval(pb_eval)

phoenix/datasets/dataset.py DELETED Viewed

@@ -1,214 +0,0 @@
-import re
-from dataclasses import dataclass, replace
-from enum import Enum
-from itertools import groupby
-from typing import Dict
-from pandas import DataFrame
-from phoenix.inferences.inferences import Inferences
-from phoenix.inferences.schema import EmbeddingColumnNames, RetrievalEmbeddingColumnNames, Schema
-from phoenix.utilities.deprecation import deprecated, deprecated_class
-@deprecated_class("phoenix.Dataset is deprecated, use phoenix.Inference instead.")
-class Dataset(Inferences):
-    @classmethod
-    @deprecated("Dataset.from_open_inference is deprecated and will be removed.")
-    def from_open_inference(cls, dataframe: DataFrame) -> "Dataset":
-        schema = Schema()
-        column_renaming: Dict[str, str] = {}
-        for group_name, group in groupby(
-            sorted(
-                map(_parse_open_inference_column_name, dataframe.columns),
-                key=lambda column: column.name,
-            ),
-            key=lambda column: column.name,
-        ):
-            open_inference_columns = list(group)
-            if group_name == "":
-                column_names_by_category = {
-                    column.category: column.full_name for column in open_inference_columns
-                }
-                schema = replace(
-                    schema,
-                    prediction_id_column_name=column_names_by_category.get(
-                        OpenInferenceCategory.id
-                    ),
-                    timestamp_column_name=column_names_by_category.get(
-                        OpenInferenceCategory.timestamp
-                    ),
-                )
-                continue
-            column_names_by_specifier = {
-                column.specifier: column.full_name for column in open_inference_columns
-            }
-            if group_name == "response":
-                response_vector_column_name = column_names_by_specifier.get(
-                    OpenInferenceSpecifier.embedding
-                )
-                if response_vector_column_name is not None:
-                    column_renaming[response_vector_column_name] = "response"
-                    schema = replace(
-                        schema,
-                        response_column_names=EmbeddingColumnNames(
-                            vector_column_name=column_renaming[response_vector_column_name],
-                            raw_data_column_name=column_names_by_specifier.get(
-                                OpenInferenceSpecifier.default
-                            ),
-                        ),
-                    )
-                else:
-                    response_text_column_name = column_names_by_specifier.get(
-                        OpenInferenceSpecifier.default
-                    )
-                    if response_text_column_name is None:
-                        raise ValueError(
-                            "invalid OpenInference format: missing text column for response"
-                        )
-                    column_renaming[response_text_column_name] = "response"
-                    schema = replace(
-                        schema,
-                        response_column_names=column_renaming[response_text_column_name],
-                    )
-            elif group_name == "prompt":
-                prompt_vector_column_name = column_names_by_specifier.get(
-                    OpenInferenceSpecifier.embedding
-                )
-                if prompt_vector_column_name is None:
-                    raise ValueError(
-                        "invalid OpenInference format: missing embedding vector column for prompt"
-                    )
-                column_renaming[prompt_vector_column_name] = "prompt"
-                schema = replace(
-                    schema,
-                    prompt_column_names=RetrievalEmbeddingColumnNames(
-                        vector_column_name=column_renaming[prompt_vector_column_name],
-                        raw_data_column_name=column_names_by_specifier.get(
-                            OpenInferenceSpecifier.default
-                        ),
-                        context_retrieval_ids_column_name=column_names_by_specifier.get(
-                            OpenInferenceSpecifier.retrieved_document_ids
-                        ),
-                        context_retrieval_scores_column_name=column_names_by_specifier.get(
-                            OpenInferenceSpecifier.retrieved_document_scores
-                        ),
-                    ),
-                )
-            elif OpenInferenceSpecifier.embedding in column_names_by_specifier:
-                vector_column_name = column_names_by_specifier[OpenInferenceSpecifier.embedding]
-                column_renaming[vector_column_name] = group_name
-                embedding_feature_column_names = schema.embedding_feature_column_names or {}
-                embedding_feature_column_names.update(
-                    {
-                        group_name: EmbeddingColumnNames(
-                            vector_column_name=column_renaming[vector_column_name],
-                            raw_data_column_name=column_names_by_specifier.get(
-                                OpenInferenceSpecifier.raw_data
-                            ),
-                            link_to_data_column_name=column_names_by_specifier.get(
-                                OpenInferenceSpecifier.link_to_data
-                            ),
-                        )
-                    }
-                )
-                schema = replace(
-                    schema,
-                    embedding_feature_column_names=embedding_feature_column_names,
-                )
-            elif len(open_inference_columns) == 1:
-                open_inference_column = open_inference_columns[0]
-                raw_column_name = open_inference_column.full_name
-                column_renaming[raw_column_name] = open_inference_column.name
-                if open_inference_column.category is OpenInferenceCategory.feature:
-                    schema = replace(
-                        schema,
-                        feature_column_names=(
-                            (schema.feature_column_names or []) + [column_renaming[raw_column_name]]
-                        ),
-                    )
-                elif open_inference_column.category is OpenInferenceCategory.tag:
-                    schema = replace(
-                        schema,
-                        tag_column_names=(
-                            (schema.tag_column_names or []) + [column_renaming[raw_column_name]]
-                        ),
-                    )
-                elif open_inference_column.category is OpenInferenceCategory.prediction:
-                    if open_inference_column.specifier is OpenInferenceSpecifier.score:
-                        schema = replace(
-                            schema,
-                            prediction_score_column_name=column_renaming[raw_column_name],
-                        )
-                    if open_inference_column.specifier is OpenInferenceSpecifier.label:
-                        schema = replace(
-                            schema,
-                            prediction_label_column_name=column_renaming[raw_column_name],
-                        )
-                elif open_inference_column.category is OpenInferenceCategory.actual:
-                    if open_inference_column.specifier is OpenInferenceSpecifier.score:
-                        schema = replace(
-                            schema,
-                            actual_score_column_name=column_renaming[raw_column_name],
-                        )
-                    if open_inference_column.specifier is OpenInferenceSpecifier.label:
-                        schema = replace(
-                            schema,
-                            actual_label_column_name=column_renaming[raw_column_name],
-                        )
-            else:
-                raise ValueError(f"invalid OpenInference format: duplicated name `{group_name}`")
-        return cls(
-            dataframe.rename(
-                column_renaming,
-                axis=1,
-                copy=False,
-            ),
-            schema,
-        )
-class OpenInferenceCategory(Enum):
-    id = "id"
-    timestamp = "timestamp"
-    feature = "feature"
-    tag = "tag"
-    prediction = "prediction"
-    actual = "actual"
-class OpenInferenceSpecifier(Enum):
-    default = ""
-    score = "score"
-    label = "label"
-    embedding = "embedding"
-    raw_data = "raw_data"
-    link_to_data = "link_to_data"
-    retrieved_document_ids = "retrieved_document_ids"
-    retrieved_document_scores = "retrieved_document_scores"
-@dataclass(frozen=True)
-class _OpenInferenceColumnName:
-    full_name: str
-    category: OpenInferenceCategory
-    data_type: str
-    specifier: OpenInferenceSpecifier = OpenInferenceSpecifier.default
-    name: str = ""
-def _parse_open_inference_column_name(column_name: str) -> _OpenInferenceColumnName:
-    pattern = (
-        r"^:(?P<category>\w+)\.(?P<data_type>\[\w+\]|\w+)(\.(?P<specifier>\w+))?:(?P<name>.*)?$"
-    )
-    if match := re.match(pattern, column_name):
-        extract = match.groupdict(default="")
-        return _OpenInferenceColumnName(
-            full_name=column_name,
-            category=OpenInferenceCategory(extract.get("category", "").lower()),
-            data_type=extract.get("data_type", "").lower(),
-            specifier=OpenInferenceSpecifier(extract.get("specifier", "").lower()),
-            name=extract.get("name", ""),
-        )
-    raise ValueError(f"Invalid format for column name: {column_name}")

phoenix/datasets/fixtures.py DELETED Viewed

@@ -1,24 +0,0 @@
-from phoenix.inferences.fixtures import (
-    ExampleInferences as _ExampleInferences,
-)
-from phoenix.inferences.fixtures import (
-    load_example as _load_example,
-)
-from phoenix.utilities.deprecation import deprecated, deprecated_class
-@deprecated_class(
-    (
-        "The phoenix.datasets.fixtures.ExampleDatasets is deprecated, "
-        "use phoenix.inferences.fixtures.ExampleInferences instead."
-    )
-)
-class ExampleDatasets(_ExampleInferences):
-    pass
-@deprecated(
-    "The phoenix.datasets.fixtures module is deprecated, use phoenix.inferences.fixtures instead."
-)
-def load_example(use_case: str) -> None:
-    _load_example(use_case)

phoenix/datasets/schema.py DELETED Viewed

@@ -1,31 +0,0 @@
-from phoenix.inferences.schema import (
-    EmbeddingColumnNames as _EmbeddingColumnNames,
-)
-from phoenix.inferences.schema import (
-    RetrievalEmbeddingColumnNames as _RetrievalEmbeddingColumnNames,
-)
-from phoenix.inferences.schema import (
-    Schema as _Schema,
-)
-from phoenix.utilities.deprecation import deprecated_class
-@deprecated_class(
-    "The phoenix.datasets.fixtures module is deprecated, use phoenix.inferences.fixtures instead."
-)
-class EmbeddingColumnNames(_EmbeddingColumnNames):
-    pass
-@deprecated_class(
-    "The phoenix.datasets.fixtures module is deprecated, use phoenix.inferences.fixtures instead."
-)
-class RetrievalEmbeddingColumnNames(_RetrievalEmbeddingColumnNames):
-    pass
-@deprecated_class(
-    "The phoenix.datasets.fixtures module is deprecated, use phoenix.inferences.fixtures instead."
-)
-class Schema(_Schema):
-    pass

phoenix/experimental/evals/__init__.py DELETED Viewed

@@ -1,73 +0,0 @@
-import logging
-from .evaluators import (
-    HallucinationEvaluator,
-    LLMEvaluator,
-    QAEvaluator,
-    RelevanceEvaluator,
-    SummarizationEvaluator,
-    ToxicityEvaluator,
-)
-from .functions import llm_classify, llm_generate, run_evals, run_relevance_eval
-from .models import BedrockModel, LiteLLMModel, OpenAIModel, VertexAIModel
-from .retrievals import compute_precisions_at_k
-from .templates import (
-    CODE_READABILITY_PROMPT_RAILS_MAP,
-    CODE_READABILITY_PROMPT_TEMPLATE,
-    HALLUCINATION_PROMPT_RAILS_MAP,
-    HALLUCINATION_PROMPT_TEMPLATE,
-    HUMAN_VS_AI_PROMPT_RAILS_MAP,
-    HUMAN_VS_AI_PROMPT_TEMPLATE,
-    QA_PROMPT_RAILS_MAP,
-    QA_PROMPT_TEMPLATE,
-    RAG_RELEVANCY_PROMPT_RAILS_MAP,
-    RAG_RELEVANCY_PROMPT_TEMPLATE,
-    TOXICITY_PROMPT_RAILS_MAP,
-    TOXICITY_PROMPT_TEMPLATE,
-    ClassificationTemplate,
-    PromptTemplate,
-)
-from .utils import NOT_PARSABLE, download_benchmark_dataset
-logger = logging.getLogger(__name__)
-__all__ = [
-    "compute_precisions_at_k",
-    "download_benchmark_dataset",
-    "llm_classify",
-    "llm_generate",
-    "OpenAIModel",
-    "VertexAIModel",
-    "BedrockModel",
-    "LiteLLMModel",
-    "PromptTemplate",
-    "ClassificationTemplate",
-    "CODE_READABILITY_PROMPT_RAILS_MAP",
-    "CODE_READABILITY_PROMPT_TEMPLATE",
-    "HALLUCINATION_PROMPT_RAILS_MAP",
-    "HALLUCINATION_PROMPT_TEMPLATE",
-    "RAG_RELEVANCY_PROMPT_RAILS_MAP",
-    "RAG_RELEVANCY_PROMPT_TEMPLATE",
-    "TOXICITY_PROMPT_RAILS_MAP",
-    "TOXICITY_PROMPT_TEMPLATE",
-    "HUMAN_VS_AI_PROMPT_RAILS_MAP",
-    "HUMAN_VS_AI_PROMPT_TEMPLATE",
-    "QA_PROMPT_RAILS_MAP",
-    "QA_PROMPT_TEMPLATE",
-    "NOT_PARSABLE",
-    "run_relevance_eval",
-    "run_evals",
-    "LLMEvaluator",
-    "HallucinationEvaluator",
-    "QAEvaluator",
-    "RelevanceEvaluator",
-    "SummarizationEvaluator",
-    "ToxicityEvaluator",
-]
-logger.warning(
-    "Evals are moving out of experimental. "
-    "Install the evals extra with `pip install arize-phoenix[evals]` and import `phoenix.evals`. "
-    "For more info, see the [migration guide](https://github.com/Arize-ai/phoenix/blob/main/MIGRATION.md)."
-)

arize-phoenix 3.25.0__py3-none-any.whl → 4.0.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 3.25.0py3-none-any.whl → 4.0.0py3-none-any.whl