PyPI - arize-phoenix - Versions diffs - 3.16.0__py3-none-any.whl → 7.7.0__py3-none-any.whl - Mend

arize-phoenix 3.16.0py3-none-any.whl → 7.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (338) hide show

arize_phoenix-7.7.0.dist-info/METADATA +261 -0
arize_phoenix-7.7.0.dist-info/RECORD +345 -0
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/WHEEL +1 -1
arize_phoenix-7.7.0.dist-info/entry_points.txt +3 -0
phoenix/__init__.py +86 -14
phoenix/auth.py +309 -0
phoenix/config.py +675 -45
phoenix/core/model.py +32 -30
phoenix/core/model_schema.py +102 -109
phoenix/core/model_schema_adapter.py +48 -45
phoenix/datetime_utils.py +24 -3
phoenix/db/README.md +54 -0
phoenix/db/__init__.py +4 -0
phoenix/db/alembic.ini +85 -0
phoenix/db/bulk_inserter.py +294 -0
phoenix/db/engines.py +208 -0
phoenix/db/enums.py +20 -0
phoenix/db/facilitator.py +113 -0
phoenix/db/helpers.py +159 -0
phoenix/db/insertion/constants.py +2 -0
phoenix/db/insertion/dataset.py +227 -0
phoenix/db/insertion/document_annotation.py +171 -0
phoenix/db/insertion/evaluation.py +191 -0
phoenix/db/insertion/helpers.py +98 -0
phoenix/db/insertion/span.py +193 -0
phoenix/db/insertion/span_annotation.py +158 -0
phoenix/db/insertion/trace_annotation.py +158 -0
phoenix/db/insertion/types.py +256 -0
phoenix/db/migrate.py +86 -0
phoenix/db/migrations/data_migration_scripts/populate_project_sessions.py +199 -0
phoenix/db/migrations/env.py +114 -0
phoenix/db/migrations/script.py.mako +26 -0
phoenix/db/migrations/versions/10460e46d750_datasets.py +317 -0
phoenix/db/migrations/versions/3be8647b87d8_add_token_columns_to_spans_table.py +126 -0
phoenix/db/migrations/versions/4ded9e43755f_create_project_sessions_table.py +66 -0
phoenix/db/migrations/versions/cd164e83824f_users_and_tokens.py +157 -0
phoenix/db/migrations/versions/cf03bd6bae1d_init.py +280 -0
phoenix/db/models.py +807 -0
phoenix/exceptions.py +5 -1
phoenix/experiments/__init__.py +6 -0
phoenix/experiments/evaluators/__init__.py +29 -0
phoenix/experiments/evaluators/base.py +158 -0
phoenix/experiments/evaluators/code_evaluators.py +184 -0
phoenix/experiments/evaluators/llm_evaluators.py +473 -0
phoenix/experiments/evaluators/utils.py +236 -0
phoenix/experiments/functions.py +772 -0
phoenix/experiments/tracing.py +86 -0
phoenix/experiments/types.py +726 -0
phoenix/experiments/utils.py +25 -0
phoenix/inferences/__init__.py +0 -0
phoenix/{datasets → inferences}/errors.py +6 -5
phoenix/{datasets → inferences}/fixtures.py +49 -42
phoenix/{datasets/dataset.py → inferences/inferences.py} +121 -105
phoenix/{datasets → inferences}/schema.py +11 -11
phoenix/{datasets → inferences}/validation.py +13 -14
phoenix/logging/__init__.py +3 -0
phoenix/logging/_config.py +90 -0
phoenix/logging/_filter.py +6 -0
phoenix/logging/_formatter.py +69 -0
phoenix/metrics/__init__.py +5 -4
phoenix/metrics/binning.py +4 -3
phoenix/metrics/metrics.py +2 -1
phoenix/metrics/mixins.py +7 -6
phoenix/metrics/retrieval_metrics.py +2 -1
phoenix/metrics/timeseries.py +5 -4
phoenix/metrics/wrappers.py +9 -3
phoenix/pointcloud/clustering.py +5 -5
phoenix/pointcloud/pointcloud.py +7 -5
phoenix/pointcloud/projectors.py +5 -6
phoenix/pointcloud/umap_parameters.py +53 -52
phoenix/server/api/README.md +28 -0
phoenix/server/api/auth.py +44 -0
phoenix/server/api/context.py +152 -9
phoenix/server/api/dataloaders/__init__.py +91 -0
phoenix/server/api/dataloaders/annotation_summaries.py +139 -0
phoenix/server/api/dataloaders/average_experiment_run_latency.py +54 -0
phoenix/server/api/dataloaders/cache/__init__.py +3 -0
phoenix/server/api/dataloaders/cache/two_tier_cache.py +68 -0
phoenix/server/api/dataloaders/dataset_example_revisions.py +131 -0
phoenix/server/api/dataloaders/dataset_example_spans.py +38 -0
phoenix/server/api/dataloaders/document_evaluation_summaries.py +144 -0
phoenix/server/api/dataloaders/document_evaluations.py +31 -0
phoenix/server/api/dataloaders/document_retrieval_metrics.py +89 -0
phoenix/server/api/dataloaders/experiment_annotation_summaries.py +79 -0
phoenix/server/api/dataloaders/experiment_error_rates.py +58 -0
phoenix/server/api/dataloaders/experiment_run_annotations.py +36 -0
phoenix/server/api/dataloaders/experiment_run_counts.py +49 -0
phoenix/server/api/dataloaders/experiment_sequence_number.py +44 -0
phoenix/server/api/dataloaders/latency_ms_quantile.py +188 -0
phoenix/server/api/dataloaders/min_start_or_max_end_times.py +85 -0
phoenix/server/api/dataloaders/project_by_name.py +31 -0
phoenix/server/api/dataloaders/record_counts.py +116 -0
phoenix/server/api/dataloaders/session_io.py +79 -0
phoenix/server/api/dataloaders/session_num_traces.py +30 -0
phoenix/server/api/dataloaders/session_num_traces_with_error.py +32 -0
phoenix/server/api/dataloaders/session_token_usages.py +41 -0
phoenix/server/api/dataloaders/session_trace_latency_ms_quantile.py +55 -0
phoenix/server/api/dataloaders/span_annotations.py +26 -0
phoenix/server/api/dataloaders/span_dataset_examples.py +31 -0
phoenix/server/api/dataloaders/span_descendants.py +57 -0
phoenix/server/api/dataloaders/span_projects.py +33 -0
phoenix/server/api/dataloaders/token_counts.py +124 -0
phoenix/server/api/dataloaders/trace_by_trace_ids.py +25 -0
phoenix/server/api/dataloaders/trace_root_spans.py +32 -0
phoenix/server/api/dataloaders/user_roles.py +30 -0
phoenix/server/api/dataloaders/users.py +33 -0
phoenix/server/api/exceptions.py +48 -0
phoenix/server/api/helpers/__init__.py +12 -0
phoenix/server/api/helpers/dataset_helpers.py +217 -0
phoenix/server/api/helpers/experiment_run_filters.py +763 -0
phoenix/server/api/helpers/playground_clients.py +948 -0
phoenix/server/api/helpers/playground_registry.py +70 -0
phoenix/server/api/helpers/playground_spans.py +455 -0
phoenix/server/api/input_types/AddExamplesToDatasetInput.py +16 -0
phoenix/server/api/input_types/AddSpansToDatasetInput.py +14 -0
phoenix/server/api/input_types/ChatCompletionInput.py +38 -0
phoenix/server/api/input_types/ChatCompletionMessageInput.py +24 -0
phoenix/server/api/input_types/ClearProjectInput.py +15 -0
phoenix/server/api/input_types/ClusterInput.py +2 -2
phoenix/server/api/input_types/CreateDatasetInput.py +12 -0
phoenix/server/api/input_types/CreateSpanAnnotationInput.py +18 -0
phoenix/server/api/input_types/CreateTraceAnnotationInput.py +18 -0
phoenix/server/api/input_types/DataQualityMetricInput.py +5 -2
phoenix/server/api/input_types/DatasetExampleInput.py +14 -0
phoenix/server/api/input_types/DatasetSort.py +17 -0
phoenix/server/api/input_types/DatasetVersionSort.py +16 -0
phoenix/server/api/input_types/DeleteAnnotationsInput.py +7 -0
phoenix/server/api/input_types/DeleteDatasetExamplesInput.py +13 -0
phoenix/server/api/input_types/DeleteDatasetInput.py +7 -0
phoenix/server/api/input_types/DeleteExperimentsInput.py +7 -0
phoenix/server/api/input_types/DimensionFilter.py +4 -4
phoenix/server/api/input_types/GenerativeModelInput.py +17 -0
phoenix/server/api/input_types/Granularity.py +1 -1
phoenix/server/api/input_types/InvocationParameters.py +162 -0
phoenix/server/api/input_types/PatchAnnotationInput.py +19 -0
phoenix/server/api/input_types/PatchDatasetExamplesInput.py +35 -0
phoenix/server/api/input_types/PatchDatasetInput.py +14 -0
phoenix/server/api/input_types/PerformanceMetricInput.py +5 -2
phoenix/server/api/input_types/ProjectSessionSort.py +29 -0
phoenix/server/api/input_types/SpanAnnotationSort.py +17 -0
phoenix/server/api/input_types/SpanSort.py +134 -69
phoenix/server/api/input_types/TemplateOptions.py +10 -0
phoenix/server/api/input_types/TraceAnnotationSort.py +17 -0
phoenix/server/api/input_types/UserRoleInput.py +9 -0
phoenix/server/api/mutations/__init__.py +28 -0
phoenix/server/api/mutations/api_key_mutations.py +167 -0
phoenix/server/api/mutations/chat_mutations.py +593 -0
phoenix/server/api/mutations/dataset_mutations.py +591 -0
phoenix/server/api/mutations/experiment_mutations.py +75 -0
phoenix/server/api/{types/ExportEventsMutation.py → mutations/export_events_mutations.py} +21 -18
phoenix/server/api/mutations/project_mutations.py +57 -0
phoenix/server/api/mutations/span_annotations_mutations.py +128 -0
phoenix/server/api/mutations/trace_annotations_mutations.py +127 -0
phoenix/server/api/mutations/user_mutations.py +329 -0
phoenix/server/api/openapi/__init__.py +0 -0
phoenix/server/api/openapi/main.py +17 -0
phoenix/server/api/openapi/schema.py +16 -0
phoenix/server/api/queries.py +738 -0
phoenix/server/api/routers/__init__.py +11 -0
phoenix/server/api/routers/auth.py +284 -0
phoenix/server/api/routers/embeddings.py +26 -0
phoenix/server/api/routers/oauth2.py +488 -0
phoenix/server/api/routers/v1/__init__.py +64 -0
phoenix/server/api/routers/v1/datasets.py +1017 -0
phoenix/server/api/routers/v1/evaluations.py +362 -0
phoenix/server/api/routers/v1/experiment_evaluations.py +115 -0
phoenix/server/api/routers/v1/experiment_runs.py +167 -0
phoenix/server/api/routers/v1/experiments.py +308 -0
phoenix/server/api/routers/v1/pydantic_compat.py +78 -0
phoenix/server/api/routers/v1/spans.py +267 -0
phoenix/server/api/routers/v1/traces.py +208 -0
phoenix/server/api/routers/v1/utils.py +95 -0
phoenix/server/api/schema.py +44 -247
phoenix/server/api/subscriptions.py +597 -0
phoenix/server/api/types/Annotation.py +21 -0
phoenix/server/api/types/AnnotationSummary.py +55 -0
phoenix/server/api/types/AnnotatorKind.py +16 -0
phoenix/server/api/types/ApiKey.py +27 -0
phoenix/server/api/types/AuthMethod.py +9 -0
phoenix/server/api/types/ChatCompletionMessageRole.py +11 -0
phoenix/server/api/types/ChatCompletionSubscriptionPayload.py +46 -0
phoenix/server/api/types/Cluster.py +25 -24
phoenix/server/api/types/CreateDatasetPayload.py +8 -0
phoenix/server/api/types/DataQualityMetric.py +31 -13
phoenix/server/api/types/Dataset.py +288 -63
phoenix/server/api/types/DatasetExample.py +85 -0
phoenix/server/api/types/DatasetExampleRevision.py +34 -0
phoenix/server/api/types/DatasetVersion.py +14 -0
phoenix/server/api/types/Dimension.py +32 -31
phoenix/server/api/types/DocumentEvaluationSummary.py +9 -8
phoenix/server/api/types/EmbeddingDimension.py +56 -49
phoenix/server/api/types/Evaluation.py +25 -31
phoenix/server/api/types/EvaluationSummary.py +30 -50
phoenix/server/api/types/Event.py +20 -20
phoenix/server/api/types/ExampleRevisionInterface.py +14 -0
phoenix/server/api/types/Experiment.py +152 -0
phoenix/server/api/types/ExperimentAnnotationSummary.py +13 -0
phoenix/server/api/types/ExperimentComparison.py +17 -0
phoenix/server/api/types/ExperimentRun.py +119 -0
phoenix/server/api/types/ExperimentRunAnnotation.py +56 -0
phoenix/server/api/types/GenerativeModel.py +9 -0
phoenix/server/api/types/GenerativeProvider.py +85 -0
phoenix/server/api/types/Inferences.py +80 -0
phoenix/server/api/types/InferencesRole.py +23 -0
phoenix/server/api/types/LabelFraction.py +7 -0
phoenix/server/api/types/MimeType.py +2 -2
phoenix/server/api/types/Model.py +54 -54
phoenix/server/api/types/PerformanceMetric.py +8 -5
phoenix/server/api/types/Project.py +407 -142
phoenix/server/api/types/ProjectSession.py +139 -0
phoenix/server/api/types/Segments.py +4 -4
phoenix/server/api/types/Span.py +221 -176
phoenix/server/api/types/SpanAnnotation.py +43 -0
phoenix/server/api/types/SpanIOValue.py +15 -0
phoenix/server/api/types/SystemApiKey.py +9 -0
phoenix/server/api/types/TemplateLanguage.py +10 -0
phoenix/server/api/types/TimeSeries.py +19 -15
phoenix/server/api/types/TokenUsage.py +11 -0
phoenix/server/api/types/Trace.py +154 -0
phoenix/server/api/types/TraceAnnotation.py +45 -0
phoenix/server/api/types/UMAPPoints.py +7 -7
phoenix/server/api/types/User.py +60 -0
phoenix/server/api/types/UserApiKey.py +45 -0
phoenix/server/api/types/UserRole.py +15 -0
phoenix/server/api/types/node.py +13 -107
phoenix/server/api/types/pagination.py +156 -57
phoenix/server/api/utils.py +34 -0
phoenix/server/app.py +864 -115
phoenix/server/bearer_auth.py +163 -0
phoenix/server/dml_event.py +136 -0
phoenix/server/dml_event_handler.py +256 -0
phoenix/server/email/__init__.py +0 -0
phoenix/server/email/sender.py +97 -0
phoenix/server/email/templates/__init__.py +0 -0
phoenix/server/email/templates/password_reset.html +19 -0
phoenix/server/email/types.py +11 -0
phoenix/server/grpc_server.py +102 -0
phoenix/server/jwt_store.py +505 -0
phoenix/server/main.py +305 -116
phoenix/server/oauth2.py +52 -0
phoenix/server/openapi/__init__.py +0 -0
phoenix/server/prometheus.py +111 -0
phoenix/server/rate_limiters.py +188 -0
phoenix/server/static/.vite/manifest.json +87 -0
phoenix/server/static/assets/components-Cy9nwIvF.js +2125 -0
phoenix/server/static/assets/index-BKvHIxkk.js +113 -0
phoenix/server/static/assets/pages-CUi2xCVQ.js +4449 -0
phoenix/server/static/assets/vendor-DvC8cT4X.js +894 -0
phoenix/server/static/assets/vendor-DxkFTwjz.css +1 -0
phoenix/server/static/assets/vendor-arizeai-Do1793cv.js +662 -0
phoenix/server/static/assets/vendor-codemirror-BzwZPyJM.js +24 -0
phoenix/server/static/assets/vendor-recharts-_Jb7JjhG.js +59 -0
phoenix/server/static/assets/vendor-shiki-Cl9QBraO.js +5 -0
phoenix/server/static/assets/vendor-three-DwGkEfCM.js +2998 -0
phoenix/server/telemetry.py +68 -0
phoenix/server/templates/index.html +82 -23
phoenix/server/thread_server.py +3 -3
phoenix/server/types.py +275 -0
phoenix/services.py +27 -18
phoenix/session/client.py +743 -68
phoenix/session/data_extractor.py +31 -7
phoenix/session/evaluation.py +3 -9
phoenix/session/session.py +263 -219
phoenix/settings.py +22 -0
phoenix/trace/__init__.py +2 -22
phoenix/trace/attributes.py +338 -0
phoenix/trace/dsl/README.md +116 -0
phoenix/trace/dsl/filter.py +663 -213
phoenix/trace/dsl/helpers.py +73 -21
phoenix/trace/dsl/query.py +574 -201
phoenix/trace/exporter.py +24 -19
phoenix/trace/fixtures.py +368 -32
phoenix/trace/otel.py +71 -219
phoenix/trace/projects.py +3 -2
phoenix/trace/schemas.py +33 -11
phoenix/trace/span_evaluations.py +21 -16
phoenix/trace/span_json_decoder.py +6 -4
phoenix/trace/span_json_encoder.py +2 -2
phoenix/trace/trace_dataset.py +47 -32
phoenix/trace/utils.py +21 -4
phoenix/utilities/__init__.py +0 -26
phoenix/utilities/client.py +132 -0
phoenix/utilities/deprecation.py +31 -0
phoenix/utilities/error_handling.py +3 -2
phoenix/utilities/json.py +109 -0
phoenix/utilities/logging.py +8 -0
phoenix/utilities/project.py +2 -2
phoenix/utilities/re.py +49 -0
phoenix/utilities/span_store.py +0 -23
phoenix/utilities/template_formatters.py +99 -0
phoenix/version.py +1 -1
arize_phoenix-3.16.0.dist-info/METADATA +0 -495
arize_phoenix-3.16.0.dist-info/RECORD +0 -178
phoenix/core/project.py +0 -617
phoenix/core/traces.py +0 -100
phoenix/experimental/evals/__init__.py +0 -73
phoenix/experimental/evals/evaluators.py +0 -413
phoenix/experimental/evals/functions/__init__.py +0 -4
phoenix/experimental/evals/functions/classify.py +0 -453
phoenix/experimental/evals/functions/executor.py +0 -353
phoenix/experimental/evals/functions/generate.py +0 -138
phoenix/experimental/evals/functions/processing.py +0 -76
phoenix/experimental/evals/models/__init__.py +0 -14
phoenix/experimental/evals/models/anthropic.py +0 -175
phoenix/experimental/evals/models/base.py +0 -170
phoenix/experimental/evals/models/bedrock.py +0 -221
phoenix/experimental/evals/models/litellm.py +0 -134
phoenix/experimental/evals/models/openai.py +0 -448
phoenix/experimental/evals/models/rate_limiters.py +0 -246
phoenix/experimental/evals/models/vertex.py +0 -173
phoenix/experimental/evals/models/vertexai.py +0 -186
phoenix/experimental/evals/retrievals.py +0 -96
phoenix/experimental/evals/templates/__init__.py +0 -50
phoenix/experimental/evals/templates/default_templates.py +0 -472
phoenix/experimental/evals/templates/template.py +0 -195
phoenix/experimental/evals/utils/__init__.py +0 -172
phoenix/experimental/evals/utils/threads.py +0 -27
phoenix/server/api/helpers.py +0 -11
phoenix/server/api/routers/evaluation_handler.py +0 -109
phoenix/server/api/routers/span_handler.py +0 -70
phoenix/server/api/routers/trace_handler.py +0 -60
phoenix/server/api/types/DatasetRole.py +0 -23
phoenix/server/static/index.css +0 -6
phoenix/server/static/index.js +0 -7447
phoenix/storage/span_store/__init__.py +0 -23
phoenix/storage/span_store/text_file.py +0 -85
phoenix/trace/dsl/missing.py +0 -60
phoenix/trace/langchain/__init__.py +0 -3
phoenix/trace/langchain/instrumentor.py +0 -35
phoenix/trace/llama_index/__init__.py +0 -3
phoenix/trace/llama_index/callback.py +0 -102
phoenix/trace/openai/__init__.py +0 -3
phoenix/trace/openai/instrumentor.py +0 -30
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/licenses/LICENSE +0 -0
/phoenix/{datasets → db/insertion}/__init__.py +0 -0
/phoenix/{experimental → db/migrations}/__init__.py +0 -0
/phoenix/{storage → db/migrations/data_migration_scripts}/__init__.py +0 -0

phoenix/{datasets → inferences}/schema.py RENAMED Viewed

@@ -1,13 +1,14 @@
 import json
+from collections.abc import Mapping
 from dataclasses import asdict, dataclass, replace
-from typing import Any, Dict, List, Mapping, Optional, Tuple, Union
+from typing import Any, Optional, Union
-EmbeddingFeatures = Dict[str, "EmbeddingColumnNames"]
+EmbeddingFeatures = dict[str, "EmbeddingColumnNames"]
 SchemaFieldName = str
-SchemaFieldValue = Union[Optional[str], Optional[List[str]], Optional[EmbeddingFeatures]]
+SchemaFieldValue = Union[Optional[str], Optional[list[str]], Optional[EmbeddingFeatures]]
-MULTI_COLUMN_SCHEMA_FIELD_NAMES: Tuple[str, ...] = ("feature_column_names", "tag_column_names")
-SINGLE_COLUMN_SCHEMA_FIELD_NAMES: Tuple[str, ...] = (
+MULTI_COLUMN_SCHEMA_FIELD_NAMES: tuple[str, ...] = ("feature_column_names", "tag_column_names")
+SINGLE_COLUMN_SCHEMA_FIELD_NAMES: tuple[str, ...] = (
     "prediction_id_column_name",
     "timestamp_column_name",
     "prediction_label_column_name",
@@ -19,7 +20,7 @@ LLM_SCHEMA_FIELD_NAMES = ["prompt_column_names", "response_column_names"]
 @dataclass(frozen=True)
-class EmbeddingColumnNames(Dict[str, Any]):
+class EmbeddingColumnNames(dict[str, Any]):
     """
     A dataclass to hold the column names for the embedding features.
     An embedding feature is a feature that is represented by a vector.
@@ -34,7 +35,6 @@ class EmbeddingColumnNames(Dict[str, Any]):
 @dataclass(frozen=True)
 class RetrievalEmbeddingColumnNames(EmbeddingColumnNames):
     """
-    *** Experimental ***
     A relationship is a column that maps a prediction to another record.
     Example
@@ -81,8 +81,8 @@ class Schema:
     prediction_id_column_name: Optional[str] = None
     id_column_name: Optional[str] = None  # Syntax sugar for prediction_id_column_name
     timestamp_column_name: Optional[str] = None
-    feature_column_names: Optional[List[str]] = None
-    tag_column_names: Optional[List[str]] = None
+    feature_column_names: Optional[list[str]] = None
+    tag_column_names: Optional[list[str]] = None
     prediction_label_column_name: Optional[str] = None
     prediction_score_column_name: Optional[str] = None
     actual_label_column_name: Optional[str] = None
@@ -92,7 +92,7 @@ class Schema:
     # document_column_names is used explicitly when the schema is used to capture a corpus
     document_column_names: Optional[EmbeddingColumnNames] = None
     embedding_feature_column_names: Optional[EmbeddingFeatures] = None
-    excluded_column_names: Optional[List[str]] = None
+    excluded_column_names: Optional[list[str]] = None
     def __post_init__(self) -> None:
         # re-map document_column_names to be in the prompt_column_names position
@@ -108,7 +108,7 @@ class Schema:
     def replace(self, **changes: Any) -> "Schema":
         return replace(self, **changes)
-    def asdict(self) -> Dict[str, str]:
+    def asdict(self) -> dict[str, str]:
         return asdict(self)
     def to_json(self) -> str:

phoenix/{datasets → inferences}/validation.py RENAMED Viewed

@@ -1,5 +1,4 @@
 import math
-from typing import List
 import numpy as np
 from pandas import DataFrame, Series
@@ -11,8 +10,8 @@ from .schema import EmbeddingColumnNames, Schema
 RESERVED_EMBEDDING_NAMES = ("prompt", "response")
-def _check_valid_schema(schema: Schema) -> List[err.ValidationError]:
-    errs: List[str] = []
+def _check_valid_schema(schema: Schema) -> list[err.ValidationError]:
+    errs: list[str] = []
     if schema.excluded_column_names is None:
         return []
@@ -34,7 +33,7 @@ def _check_valid_schema(schema: Schema) -> List[err.ValidationError]:
     return []
-def validate_dataset_inputs(dataframe: DataFrame, schema: Schema) -> List[err.ValidationError]:
+def validate_inferences_inputs(dataframe: DataFrame, schema: Schema) -> list[err.ValidationError]:
     errors = _check_missing_columns(dataframe, schema)
     if errors:
         return errors
@@ -53,12 +52,12 @@ def validate_dataset_inputs(dataframe: DataFrame, schema: Schema) -> List[err.Va
     return []
-def _check_valid_embedding_data(dataframe: DataFrame, schema: Schema) -> List[err.ValidationError]:
+def _check_valid_embedding_data(dataframe: DataFrame, schema: Schema) -> list[err.ValidationError]:
     embedding_col_names = schema.embedding_feature_column_names
     if embedding_col_names is None:
         return []
-    embedding_errors: List[err.ValidationError] = []
+    embedding_errors: list[err.ValidationError] = []
     for embedding_name, column_names in embedding_col_names.items():
         if embedding_name in RESERVED_EMBEDDING_NAMES:
             embedding_errors += _validate_reserved_embedding_name(embedding_name, schema)
@@ -71,8 +70,8 @@ def _check_valid_embedding_data(dataframe: DataFrame, schema: Schema) -> List[er
 def _check_valid_prompt_response_data(
     dataframe: DataFrame, schema: Schema
-) -> List[err.ValidationError]:
-    prompt_response_errors: List[err.ValidationError] = []
+) -> list[err.ValidationError]:
+    prompt_response_errors: list[err.ValidationError] = []
     prompt_response_column_names = {
         "prompt": schema.prompt_column_names,
@@ -89,7 +88,7 @@ def _check_valid_prompt_response_data(
 def _validate_reserved_embedding_name(
     embedding_name: str, schema: Schema
-) -> List[err.ValidationError]:
+) -> list[err.ValidationError]:
     if embedding_name == "prompt" and schema.prompt_column_names is not None:
         return [err.InvalidEmbeddingReservedName(embedding_name, "schema.prompt_column_names")]
     elif embedding_name == "response" and schema.response_column_names is not None:
@@ -99,9 +98,9 @@ def _validate_reserved_embedding_name(
 def _validate_embedding_vector(
     dataframe: DataFrame, name: str, vector_column_name: str
-) -> List[err.ValidationError]:
+) -> list[err.ValidationError]:
     vector_column = dataframe[vector_column_name]
-    errors: List[err.ValidationError] = []
+    errors: list[err.ValidationError] = []
     vector_length = None
     for vector in vector_column:
@@ -156,8 +155,8 @@ def _validate_embedding_vector(
     return errors
-def _check_column_types(dataframe: DataFrame, schema: Schema) -> List[err.ValidationError]:
-    wrong_type_cols: List[str] = []
+def _check_column_types(dataframe: DataFrame, schema: Schema) -> list[err.ValidationError]:
+    wrong_type_cols: list[str] = []
     if schema.prediction_id_column_name is not None:
         if not (
             is_numeric_dtype(dataframe.dtypes[schema.prediction_id_column_name])
@@ -172,7 +171,7 @@ def _check_column_types(dataframe: DataFrame, schema: Schema) -> List[err.Valida
     return []
-def _check_missing_columns(dataframe: DataFrame, schema: Schema) -> List[err.ValidationError]:
+def _check_missing_columns(dataframe: DataFrame, schema: Schema) -> list[err.ValidationError]:
     # converting to a set first makes the checks run a lot faster
     existing_columns = set(dataframe.columns)
     missing_columns = []

phoenix/logging/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from ._config import setup_logging
+__all__ = ["setup_logging"]

phoenix/logging/_config.py ADDED Viewed

@@ -0,0 +1,90 @@
+import atexit
+import logging
+import logging.config
+import logging.handlers
+import queue
+from sys import stderr, stdout
+from typing_extensions import assert_never
+from phoenix.config import LoggingMode
+from phoenix.logging._filter import NonErrorFilter
+from phoenix.settings import Settings
+from ._formatter import PhoenixJSONFormatter
+def setup_logging() -> None:
+    """
+    Configures logging for the specified logging mode.
+    """
+    logging_mode = Settings.logging_mode
+    if logging_mode is LoggingMode.DEFAULT:
+        _setup_library_logging()
+    elif logging_mode is LoggingMode.STRUCTURED:
+        _setup_application_logging()
+    else:
+        assert_never(logging_mode)
+def _setup_library_logging() -> None:
+    """
+    Configures logging if Phoenix is used as a library
+    """
+    logger = logging.getLogger("phoenix")
+    logger.setLevel(Settings.logging_level)
+    db_logger = logging.getLogger("sqlalchemy")
+    db_logger.setLevel(Settings.db_logging_level)
+    logger.info("Default logging ready")
+def _setup_application_logging() -> None:
+    """
+    Configures logging if Phoenix is used as an application
+    """
+    sql_engine_logger = logging.getLogger("sqlalchemy.engine.Engine")
+    # Remove all existing handlers
+    for handler in sql_engine_logger.handlers[:]:
+        sql_engine_logger.removeHandler(handler)
+        handler.close()
+    phoenix_logger = logging.getLogger("phoenix")
+    phoenix_logger.setLevel(Settings.logging_level)
+    phoenix_logger.propagate = False  # Do not pass records to the root logger
+    sql_logger = logging.getLogger("sqlalchemy")
+    sql_logger.setLevel(Settings.db_logging_level)
+    sql_logger.propagate = False  # Do not pass records to the root logger
+    log_queue = queue.Queue()  # type:ignore
+    queue_handler = logging.handlers.QueueHandler(log_queue)
+    phoenix_logger.addHandler(queue_handler)
+    sql_logger.addHandler(queue_handler)
+    fmt_keys = {
+        "level": "levelname",
+        "message": "message",
+        "timestamp": "timestamp",
+        "logger": "name",
+        "module": "module",
+        "function": "funcName",
+        "line": "lineno",
+        "thread_name": "threadName",
+    }
+    formatter = PhoenixJSONFormatter(fmt_keys=fmt_keys)
+    # stdout handler
+    stdout_handler = logging.StreamHandler(stdout)
+    stdout_handler.setFormatter(formatter)
+    stdout_handler.setLevel(Settings.logging_level)
+    stdout_handler.addFilter(NonErrorFilter())
+    # stderr handler
+    stderr_handler = logging.StreamHandler(stderr)
+    stderr_handler.setFormatter(formatter)
+    stderr_handler.setLevel(logging.WARNING)
+    queue_listener = logging.handlers.QueueListener(log_queue, stdout_handler, stderr_handler)
+    if queue_listener is not None:
+        queue_listener.start()
+        atexit.register(queue_listener.stop)
+    phoenix_logger.info("Structured logging ready")

phoenix/logging/_filter.py ADDED Viewed

@@ -0,0 +1,6 @@
+import logging
+class NonErrorFilter(logging.Filter):
+    def filter(self, record: logging.LogRecord) -> bool:
+        return record.levelno <= logging.INFO

phoenix/logging/_formatter.py ADDED Viewed

@@ -0,0 +1,69 @@
+import datetime as dt
+import json
+import logging
+from typing import Optional
+LOG_RECORD_BUILTIN_ATTRS = {
+    "args",
+    "asctime",
+    "created",
+    "exc_info",
+    "exc_text",
+    "filename",
+    "funcName",
+    "levelname",
+    "levelno",
+    "lineno",
+    "module",
+    "msecs",
+    "message",
+    "msg",
+    "name",
+    "pathname",
+    "process",
+    "processName",
+    "relativeCreated",
+    "stack_info",
+    "thread",
+    "threadName",
+    "taskName",
+}
+class PhoenixJSONFormatter(logging.Formatter):
+    def __init__(
+        self,
+        *,
+        fmt_keys: Optional[dict[str, str]] = None,
+    ):
+        super().__init__()
+        self.fmt_keys = fmt_keys if fmt_keys is not None else {}
+    def format(self, record: logging.LogRecord) -> str:
+        message = self._prepare_log_dict(record)
+        return json.dumps(message, default=str)
+    def _prepare_log_dict(self, record: logging.LogRecord) -> dict[str, str]:
+        always_fields = {
+            "message": record.getMessage(),
+            "timestamp": dt.datetime.fromtimestamp(record.created, tz=dt.timezone.utc).isoformat(),
+        }
+        if record.exc_info is not None:
+            always_fields["exc_info"] = self.formatException(record.exc_info)
+        if record.stack_info is not None:
+            always_fields["stack_info"] = self.formatStack(record.stack_info)
+        message = {
+            key: msg_val
+            if (msg_val := always_fields.pop(val, None)) is not None
+            else getattr(record, val)
+            for key, val in self.fmt_keys.items()
+        }
+        message.update(always_fields)
+        for key, val in record.__dict__.items():
+            if key not in LOG_RECORD_BUILTIN_ATTRS:
+                message[key] = val
+        return message

phoenix/metrics/__init__.py CHANGED Viewed

@@ -1,8 +1,9 @@
 import logging
 import warnings
 from abc import ABC, abstractmethod
+from collections.abc import Iterable, Mapping
 from dataclasses import dataclass
-from typing import Any, Iterable, List, Mapping, Optional, Union
+from typing import Any, Optional, Union
 import numpy as np
 import pandas as pd
@@ -36,13 +37,13 @@ class Metric(ABC):
     def calc(self, dataframe: pd.DataFrame) -> Any: ...
     @abstractmethod
-    def operands(self) -> List[Column]: ...
+    def operands(self) -> list[Column]: ...
     def __call__(
         self,
         df: pd.DataFrame,
         /,
-        subset_rows: Optional[Union[slice, List[int]]] = None,
+        subset_rows: Optional[Union[slice, list[int]]] = None,
     ) -> Any:
         """
         Computes the metric on a dataframe.
@@ -51,7 +52,7 @@ class Metric(ABC):
         ----------
         df: pandas DataFrame
             The dataframe input to the metric.
-        subset_rows: Optional[Union[slice, List[int]]] = None
+        subset_rows: Optional[Union[slice, list[int]]] = None
             Optionally specifying a subset of rows for the computation.
             Can be a list or slice (e.g. `slice(100, 200)`) of integers.
         """

phoenix/metrics/binning.py CHANGED Viewed

@@ -1,8 +1,9 @@
 import warnings
 from abc import ABC, abstractmethod
+from collections.abc import Iterable, Sequence
 from dataclasses import dataclass
 from functools import partial
-from typing import Any, Iterable, Optional, Sequence, cast
+from typing import Any, Optional, cast
 import numpy as np
 import pandas as pd
@@ -78,7 +79,7 @@ class IntervalBinning(BinningMethod):
             else pd.IntervalIndex(
                 (
                     pd.Interval(
-                        np.NINF,
+                        -np.inf,
                         np.inf,
                         closed="neither",
                     ),
@@ -208,7 +209,7 @@ class QuantileBinning(IntervalBinning):
         # Extend min and max to infinities, unless len(breaks) < 3,
         # in which case the min is kept and two bins are created.
         breaks = breaks[1:-1] if len(breaks) > 2 else breaks[:1]
-        breaks = [np.NINF] + breaks + [np.inf]
+        breaks = [-np.inf] + breaks + [np.inf]
         return pd.IntervalIndex.from_breaks(
             breaks,
             closed="left",

phoenix/metrics/metrics.py CHANGED Viewed

@@ -1,8 +1,9 @@
 import math
 import warnings
+from collections.abc import Callable
 from dataclasses import dataclass, field
 from functools import cached_property
-from typing import Callable, Union, cast
+from typing import Union, cast
 import numpy as np
 import numpy.typing as npt

phoenix/metrics/mixins.py CHANGED Viewed

@@ -7,10 +7,11 @@ on cooperative multiple inheritance and method resolution order in Python.
 import collections
 import inspect
 from abc import ABC, abstractmethod
+from collections.abc import Callable
 from dataclasses import dataclass, field, fields, replace
 from functools import cached_property
 from itertools import repeat
-from typing import TYPE_CHECKING, Any, Callable, Dict, Iterator, List, Mapping, Optional
+from typing import TYPE_CHECKING, Any, Iterator, Mapping, Optional
 import numpy as np
 import pandas as pd
@@ -42,7 +43,7 @@ class VectorOperator(ABC):
 @dataclass(frozen=True)
 class NullaryOperator(Metric, ABC):
-    def operands(self) -> List[Column]:
+    def operands(self) -> list[Column]:
         return []
@@ -55,7 +56,7 @@ class UnaryOperator(Metric, ABC):
     operand: Column = Column()
-    def operands(self) -> List[Column]:
+    def operands(self) -> list[Column]:
         return [self.operand]
@@ -98,10 +99,10 @@ class EvaluationMetricKeywordParameters(_BaseMapping):
         return sum(1 for _ in self)
     @property
-    def columns(self) -> List[Column]:
+    def columns(self) -> list[Column]:
         return [v for v in self.values() if isinstance(v, Column)]
-    def __call__(self, df: pd.DataFrame) -> Dict[str, Any]:
+    def __call__(self, df: pd.DataFrame) -> dict[str, Any]:
         return {k: v(df) if isinstance(v, Column) else v for k, v in self.items()}
@@ -142,7 +143,7 @@ class EvaluationMetric(Metric, ABC):
                 ),
             )
-    def operands(self) -> List[Column]:
+    def operands(self) -> list[Column]:
         return [self.actual, self.predicted] + self.parameters.columns
     def calc(self, df: pd.DataFrame) -> float:

phoenix/metrics/retrieval_metrics.py CHANGED Viewed

@@ -1,5 +1,6 @@
+from collections.abc import Iterable
 from dataclasses import dataclass, field
-from typing import Iterable, Optional, cast
+from typing import Optional, cast
 import numpy as np
 import pandas as pd

phoenix/metrics/timeseries.py CHANGED Viewed

@@ -1,7 +1,8 @@
+from collections.abc import Callable, Iterable, Iterator
 from datetime import datetime, timedelta, timezone
 from functools import partial
 from itertools import accumulate, repeat
-from typing import Callable, Iterable, Iterator, Tuple, cast
+from typing import cast
 import pandas as pd
 from typing_extensions import TypeAlias
@@ -41,12 +42,12 @@ def row_interval_from_sorted_time_index(
     time_index: pd.DatetimeIndex,
     time_start: datetime,
     time_stop: datetime,
-) -> Tuple[StartIndex, StopIndex]:
+) -> tuple[StartIndex, StopIndex]:
     """
     Returns end exclusive time slice from sorted index.
     """
     return cast(
-        Tuple[StartIndex, StopIndex],
+        tuple[StartIndex, StopIndex],
         time_index.searchsorted((time_start, time_stop)),
     )
@@ -86,7 +87,7 @@ def _groupers(
     end_time: datetime,
     evaluation_window: timedelta,
     sampling_interval: timedelta,
-) -> Iterator[Tuple[StartTime, EndTime, pd.Grouper]]:
+) -> Iterator[tuple[StartTime, EndTime, pd.Grouper]]:
     """
     Yields pandas.Groupers from time series parameters.
     """

phoenix/metrics/wrappers.py CHANGED Viewed

@@ -18,7 +18,7 @@ from abc import ABC
 from enum import Enum
 from inspect import Signature
 from itertools import chain, islice
-from typing import Any, Dict, List, Tuple, cast
+from typing import Any, cast
 import numpy as np
 import pandas as pd
@@ -27,6 +27,8 @@ from sklearn import metrics as sk
 from sklearn.utils.multiclass import check_classification_targets
 from wrapt import PartialCallableObjectProxy
+from phoenix.config import SKLEARN_VERSION
 class Eval(PartialCallableObjectProxy, ABC):  # type: ignore
     def __call__(
@@ -157,7 +159,7 @@ def _coerce_dtype_if_necessary(
 def _eliminate_missing_values_from_all_series(
     *args: Any,
     **kwargs: Any,
-) -> Tuple[List[Any], Dict[str, Any]]:
+) -> tuple[list[Any], dict[str, Any]]:
     positional_arguments = list(args)
     keyword_arguments = dict(kwargs)
     all_series = [
@@ -232,5 +234,9 @@ class SkEval(Enum):
     r2_score = RegressionEval(sk.r2_score)
     recall_score = ClassificationEval(sk.recall_score)
     roc_auc_score = ScoredClassificationEval(sk.roc_auc_score)
-    root_mean_squared_error = RegressionEval(sk.mean_squared_error, squared=False)
+    root_mean_squared_error = (
+        RegressionEval(sk.mean_squared_error, squared=False)
+        if SKLEARN_VERSION < (1, 6)
+        else RegressionEval(sk.root_mean_squared_error)
+    )
     zero_one_loss = ClassificationEval(sk.zero_one_loss)

phoenix/pointcloud/clustering.py CHANGED Viewed

@@ -1,13 +1,11 @@
 from dataclasses import asdict, dataclass
-from typing import List, Set
 import numpy as np
 import numpy.typing as npt
-from hdbscan import HDBSCAN
 from typing_extensions import TypeAlias
 RowIndex: TypeAlias = int
-RawCluster: TypeAlias = Set[RowIndex]
+RawCluster: TypeAlias = set[RowIndex]
 Matrix: TypeAlias = npt.NDArray[np.float64]
@@ -17,9 +15,11 @@ class Hdbscan:
     min_samples: float = 1
     cluster_selection_epsilon: float = 0.0
-    def find_clusters(self, mat: Matrix) -> List[RawCluster]:
+    def find_clusters(self, mat: Matrix) -> list[RawCluster]:
+        from fast_hdbscan import HDBSCAN
         cluster_ids: npt.NDArray[np.int_] = HDBSCAN(**asdict(self)).fit_predict(mat)
-        ans: List[RawCluster] = [set() for _ in range(np.max(cluster_ids) + 1)]
+        ans: list[RawCluster] = [set() for _ in range(np.max(cluster_ids) + 1)]
         for row_idx, cluster_id in enumerate(cluster_ids):
             if cluster_id > -1:
                 ans[cluster_id].add(row_idx)

phoenix/pointcloud/pointcloud.py CHANGED Viewed

@@ -1,9 +1,9 @@
+from collections.abc import Hashable, Mapping
 from dataclasses import dataclass
-from typing import Dict, List, Mapping, Protocol, Set, Tuple
+from typing import Protocol, TypeVar
 import numpy as np
 import numpy.typing as npt
-from strawberry import ID
 from typing_extensions import TypeAlias
 from phoenix.pointcloud.clustering import RawCluster
@@ -12,13 +12,15 @@ Vector: TypeAlias = npt.NDArray[np.float64]
 Matrix: TypeAlias = npt.NDArray[np.float64]
 RowIndex: TypeAlias = int
+_IdType = TypeVar("_IdType", bound=Hashable)
 class DimensionalityReducer(Protocol):
     def project(self, mat: Matrix, n_components: int) -> Matrix: ...
 class ClustersFinder(Protocol):
-    def find_clusters(self, mat: Matrix) -> List[RawCluster]: ...
+    def find_clusters(self, mat: Matrix) -> list[RawCluster]: ...
 @dataclass(frozen=True)
@@ -28,9 +30,9 @@ class PointCloud:
     def generate(
         self,
-        data: Mapping[ID, Vector],
+        data: Mapping[_IdType, Vector],
         n_components: int = 3,
-    ) -> Tuple[Dict[ID, Vector], Dict[str, Set[ID]]]:
+    ) -> tuple[dict[_IdType, Vector], dict[str, set[_IdType]]]:
         """
         Given a set of vectors, projects them onto lower dimensions, and
         finds clusters among the projections.

phoenix/pointcloud/projectors.py CHANGED Viewed

@@ -6,12 +6,6 @@ import numpy as np
 import numpy.typing as npt
 from typing_extensions import TypeAlias
-with warnings.catch_warnings():
-    from numba.core.errors import NumbaWarning
-    warnings.simplefilter("ignore", category=NumbaWarning)
-    from umap import UMAP
 Matrix: TypeAlias = npt.NDArray[np.float64]
@@ -25,6 +19,11 @@ class Umap:
     min_dist: float = 0.1
     def project(self, mat: Matrix, n_components: int) -> Matrix:
+        with warnings.catch_warnings():
+            from numba.core.errors import NumbaWarning
+            warnings.simplefilter("ignore", category=NumbaWarning)
+            from umap import UMAP
         config = asdict(self)
         config["n_components"] = n_components
         if len(mat) <= n_components:

arize-phoenix 3.16.0__py3-none-any.whl → 7.7.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 3.16.0py3-none-any.whl → 7.7.0py3-none-any.whl