PyPI - arize-phoenix - Versions diffs - 3.16.0__py3-none-any.whl → 7.7.0__py3-none-any.whl - Mend

arize-phoenix 3.16.0py3-none-any.whl → 7.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (338) hide show

arize_phoenix-7.7.0.dist-info/METADATA +261 -0
arize_phoenix-7.7.0.dist-info/RECORD +345 -0
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/WHEEL +1 -1
arize_phoenix-7.7.0.dist-info/entry_points.txt +3 -0
phoenix/__init__.py +86 -14
phoenix/auth.py +309 -0
phoenix/config.py +675 -45
phoenix/core/model.py +32 -30
phoenix/core/model_schema.py +102 -109
phoenix/core/model_schema_adapter.py +48 -45
phoenix/datetime_utils.py +24 -3
phoenix/db/README.md +54 -0
phoenix/db/__init__.py +4 -0
phoenix/db/alembic.ini +85 -0
phoenix/db/bulk_inserter.py +294 -0
phoenix/db/engines.py +208 -0
phoenix/db/enums.py +20 -0
phoenix/db/facilitator.py +113 -0
phoenix/db/helpers.py +159 -0
phoenix/db/insertion/constants.py +2 -0
phoenix/db/insertion/dataset.py +227 -0
phoenix/db/insertion/document_annotation.py +171 -0
phoenix/db/insertion/evaluation.py +191 -0
phoenix/db/insertion/helpers.py +98 -0
phoenix/db/insertion/span.py +193 -0
phoenix/db/insertion/span_annotation.py +158 -0
phoenix/db/insertion/trace_annotation.py +158 -0
phoenix/db/insertion/types.py +256 -0
phoenix/db/migrate.py +86 -0
phoenix/db/migrations/data_migration_scripts/populate_project_sessions.py +199 -0
phoenix/db/migrations/env.py +114 -0
phoenix/db/migrations/script.py.mako +26 -0
phoenix/db/migrations/versions/10460e46d750_datasets.py +317 -0
phoenix/db/migrations/versions/3be8647b87d8_add_token_columns_to_spans_table.py +126 -0
phoenix/db/migrations/versions/4ded9e43755f_create_project_sessions_table.py +66 -0
phoenix/db/migrations/versions/cd164e83824f_users_and_tokens.py +157 -0
phoenix/db/migrations/versions/cf03bd6bae1d_init.py +280 -0
phoenix/db/models.py +807 -0
phoenix/exceptions.py +5 -1
phoenix/experiments/__init__.py +6 -0
phoenix/experiments/evaluators/__init__.py +29 -0
phoenix/experiments/evaluators/base.py +158 -0
phoenix/experiments/evaluators/code_evaluators.py +184 -0
phoenix/experiments/evaluators/llm_evaluators.py +473 -0
phoenix/experiments/evaluators/utils.py +236 -0
phoenix/experiments/functions.py +772 -0
phoenix/experiments/tracing.py +86 -0
phoenix/experiments/types.py +726 -0
phoenix/experiments/utils.py +25 -0
phoenix/inferences/__init__.py +0 -0
phoenix/{datasets → inferences}/errors.py +6 -5
phoenix/{datasets → inferences}/fixtures.py +49 -42
phoenix/{datasets/dataset.py → inferences/inferences.py} +121 -105
phoenix/{datasets → inferences}/schema.py +11 -11
phoenix/{datasets → inferences}/validation.py +13 -14
phoenix/logging/__init__.py +3 -0
phoenix/logging/_config.py +90 -0
phoenix/logging/_filter.py +6 -0
phoenix/logging/_formatter.py +69 -0
phoenix/metrics/__init__.py +5 -4
phoenix/metrics/binning.py +4 -3
phoenix/metrics/metrics.py +2 -1
phoenix/metrics/mixins.py +7 -6
phoenix/metrics/retrieval_metrics.py +2 -1
phoenix/metrics/timeseries.py +5 -4
phoenix/metrics/wrappers.py +9 -3
phoenix/pointcloud/clustering.py +5 -5
phoenix/pointcloud/pointcloud.py +7 -5
phoenix/pointcloud/projectors.py +5 -6
phoenix/pointcloud/umap_parameters.py +53 -52
phoenix/server/api/README.md +28 -0
phoenix/server/api/auth.py +44 -0
phoenix/server/api/context.py +152 -9
phoenix/server/api/dataloaders/__init__.py +91 -0
phoenix/server/api/dataloaders/annotation_summaries.py +139 -0
phoenix/server/api/dataloaders/average_experiment_run_latency.py +54 -0
phoenix/server/api/dataloaders/cache/__init__.py +3 -0
phoenix/server/api/dataloaders/cache/two_tier_cache.py +68 -0
phoenix/server/api/dataloaders/dataset_example_revisions.py +131 -0
phoenix/server/api/dataloaders/dataset_example_spans.py +38 -0
phoenix/server/api/dataloaders/document_evaluation_summaries.py +144 -0
phoenix/server/api/dataloaders/document_evaluations.py +31 -0
phoenix/server/api/dataloaders/document_retrieval_metrics.py +89 -0
phoenix/server/api/dataloaders/experiment_annotation_summaries.py +79 -0
phoenix/server/api/dataloaders/experiment_error_rates.py +58 -0
phoenix/server/api/dataloaders/experiment_run_annotations.py +36 -0
phoenix/server/api/dataloaders/experiment_run_counts.py +49 -0
phoenix/server/api/dataloaders/experiment_sequence_number.py +44 -0
phoenix/server/api/dataloaders/latency_ms_quantile.py +188 -0
phoenix/server/api/dataloaders/min_start_or_max_end_times.py +85 -0
phoenix/server/api/dataloaders/project_by_name.py +31 -0
phoenix/server/api/dataloaders/record_counts.py +116 -0
phoenix/server/api/dataloaders/session_io.py +79 -0
phoenix/server/api/dataloaders/session_num_traces.py +30 -0
phoenix/server/api/dataloaders/session_num_traces_with_error.py +32 -0
phoenix/server/api/dataloaders/session_token_usages.py +41 -0
phoenix/server/api/dataloaders/session_trace_latency_ms_quantile.py +55 -0
phoenix/server/api/dataloaders/span_annotations.py +26 -0
phoenix/server/api/dataloaders/span_dataset_examples.py +31 -0
phoenix/server/api/dataloaders/span_descendants.py +57 -0
phoenix/server/api/dataloaders/span_projects.py +33 -0
phoenix/server/api/dataloaders/token_counts.py +124 -0
phoenix/server/api/dataloaders/trace_by_trace_ids.py +25 -0
phoenix/server/api/dataloaders/trace_root_spans.py +32 -0
phoenix/server/api/dataloaders/user_roles.py +30 -0
phoenix/server/api/dataloaders/users.py +33 -0
phoenix/server/api/exceptions.py +48 -0
phoenix/server/api/helpers/__init__.py +12 -0
phoenix/server/api/helpers/dataset_helpers.py +217 -0
phoenix/server/api/helpers/experiment_run_filters.py +763 -0
phoenix/server/api/helpers/playground_clients.py +948 -0
phoenix/server/api/helpers/playground_registry.py +70 -0
phoenix/server/api/helpers/playground_spans.py +455 -0
phoenix/server/api/input_types/AddExamplesToDatasetInput.py +16 -0
phoenix/server/api/input_types/AddSpansToDatasetInput.py +14 -0
phoenix/server/api/input_types/ChatCompletionInput.py +38 -0
phoenix/server/api/input_types/ChatCompletionMessageInput.py +24 -0
phoenix/server/api/input_types/ClearProjectInput.py +15 -0
phoenix/server/api/input_types/ClusterInput.py +2 -2
phoenix/server/api/input_types/CreateDatasetInput.py +12 -0
phoenix/server/api/input_types/CreateSpanAnnotationInput.py +18 -0
phoenix/server/api/input_types/CreateTraceAnnotationInput.py +18 -0
phoenix/server/api/input_types/DataQualityMetricInput.py +5 -2
phoenix/server/api/input_types/DatasetExampleInput.py +14 -0
phoenix/server/api/input_types/DatasetSort.py +17 -0
phoenix/server/api/input_types/DatasetVersionSort.py +16 -0
phoenix/server/api/input_types/DeleteAnnotationsInput.py +7 -0
phoenix/server/api/input_types/DeleteDatasetExamplesInput.py +13 -0
phoenix/server/api/input_types/DeleteDatasetInput.py +7 -0
phoenix/server/api/input_types/DeleteExperimentsInput.py +7 -0
phoenix/server/api/input_types/DimensionFilter.py +4 -4
phoenix/server/api/input_types/GenerativeModelInput.py +17 -0
phoenix/server/api/input_types/Granularity.py +1 -1
phoenix/server/api/input_types/InvocationParameters.py +162 -0
phoenix/server/api/input_types/PatchAnnotationInput.py +19 -0
phoenix/server/api/input_types/PatchDatasetExamplesInput.py +35 -0
phoenix/server/api/input_types/PatchDatasetInput.py +14 -0
phoenix/server/api/input_types/PerformanceMetricInput.py +5 -2
phoenix/server/api/input_types/ProjectSessionSort.py +29 -0
phoenix/server/api/input_types/SpanAnnotationSort.py +17 -0
phoenix/server/api/input_types/SpanSort.py +134 -69
phoenix/server/api/input_types/TemplateOptions.py +10 -0
phoenix/server/api/input_types/TraceAnnotationSort.py +17 -0
phoenix/server/api/input_types/UserRoleInput.py +9 -0
phoenix/server/api/mutations/__init__.py +28 -0
phoenix/server/api/mutations/api_key_mutations.py +167 -0
phoenix/server/api/mutations/chat_mutations.py +593 -0
phoenix/server/api/mutations/dataset_mutations.py +591 -0
phoenix/server/api/mutations/experiment_mutations.py +75 -0
phoenix/server/api/{types/ExportEventsMutation.py → mutations/export_events_mutations.py} +21 -18
phoenix/server/api/mutations/project_mutations.py +57 -0
phoenix/server/api/mutations/span_annotations_mutations.py +128 -0
phoenix/server/api/mutations/trace_annotations_mutations.py +127 -0
phoenix/server/api/mutations/user_mutations.py +329 -0
phoenix/server/api/openapi/__init__.py +0 -0
phoenix/server/api/openapi/main.py +17 -0
phoenix/server/api/openapi/schema.py +16 -0
phoenix/server/api/queries.py +738 -0
phoenix/server/api/routers/__init__.py +11 -0
phoenix/server/api/routers/auth.py +284 -0
phoenix/server/api/routers/embeddings.py +26 -0
phoenix/server/api/routers/oauth2.py +488 -0
phoenix/server/api/routers/v1/__init__.py +64 -0
phoenix/server/api/routers/v1/datasets.py +1017 -0
phoenix/server/api/routers/v1/evaluations.py +362 -0
phoenix/server/api/routers/v1/experiment_evaluations.py +115 -0
phoenix/server/api/routers/v1/experiment_runs.py +167 -0
phoenix/server/api/routers/v1/experiments.py +308 -0
phoenix/server/api/routers/v1/pydantic_compat.py +78 -0
phoenix/server/api/routers/v1/spans.py +267 -0
phoenix/server/api/routers/v1/traces.py +208 -0
phoenix/server/api/routers/v1/utils.py +95 -0
phoenix/server/api/schema.py +44 -247
phoenix/server/api/subscriptions.py +597 -0
phoenix/server/api/types/Annotation.py +21 -0
phoenix/server/api/types/AnnotationSummary.py +55 -0
phoenix/server/api/types/AnnotatorKind.py +16 -0
phoenix/server/api/types/ApiKey.py +27 -0
phoenix/server/api/types/AuthMethod.py +9 -0
phoenix/server/api/types/ChatCompletionMessageRole.py +11 -0
phoenix/server/api/types/ChatCompletionSubscriptionPayload.py +46 -0
phoenix/server/api/types/Cluster.py +25 -24
phoenix/server/api/types/CreateDatasetPayload.py +8 -0
phoenix/server/api/types/DataQualityMetric.py +31 -13
phoenix/server/api/types/Dataset.py +288 -63
phoenix/server/api/types/DatasetExample.py +85 -0
phoenix/server/api/types/DatasetExampleRevision.py +34 -0
phoenix/server/api/types/DatasetVersion.py +14 -0
phoenix/server/api/types/Dimension.py +32 -31
phoenix/server/api/types/DocumentEvaluationSummary.py +9 -8
phoenix/server/api/types/EmbeddingDimension.py +56 -49
phoenix/server/api/types/Evaluation.py +25 -31
phoenix/server/api/types/EvaluationSummary.py +30 -50
phoenix/server/api/types/Event.py +20 -20
phoenix/server/api/types/ExampleRevisionInterface.py +14 -0
phoenix/server/api/types/Experiment.py +152 -0
phoenix/server/api/types/ExperimentAnnotationSummary.py +13 -0
phoenix/server/api/types/ExperimentComparison.py +17 -0
phoenix/server/api/types/ExperimentRun.py +119 -0
phoenix/server/api/types/ExperimentRunAnnotation.py +56 -0
phoenix/server/api/types/GenerativeModel.py +9 -0
phoenix/server/api/types/GenerativeProvider.py +85 -0
phoenix/server/api/types/Inferences.py +80 -0
phoenix/server/api/types/InferencesRole.py +23 -0
phoenix/server/api/types/LabelFraction.py +7 -0
phoenix/server/api/types/MimeType.py +2 -2
phoenix/server/api/types/Model.py +54 -54
phoenix/server/api/types/PerformanceMetric.py +8 -5
phoenix/server/api/types/Project.py +407 -142
phoenix/server/api/types/ProjectSession.py +139 -0
phoenix/server/api/types/Segments.py +4 -4
phoenix/server/api/types/Span.py +221 -176
phoenix/server/api/types/SpanAnnotation.py +43 -0
phoenix/server/api/types/SpanIOValue.py +15 -0
phoenix/server/api/types/SystemApiKey.py +9 -0
phoenix/server/api/types/TemplateLanguage.py +10 -0
phoenix/server/api/types/TimeSeries.py +19 -15
phoenix/server/api/types/TokenUsage.py +11 -0
phoenix/server/api/types/Trace.py +154 -0
phoenix/server/api/types/TraceAnnotation.py +45 -0
phoenix/server/api/types/UMAPPoints.py +7 -7
phoenix/server/api/types/User.py +60 -0
phoenix/server/api/types/UserApiKey.py +45 -0
phoenix/server/api/types/UserRole.py +15 -0
phoenix/server/api/types/node.py +13 -107
phoenix/server/api/types/pagination.py +156 -57
phoenix/server/api/utils.py +34 -0
phoenix/server/app.py +864 -115
phoenix/server/bearer_auth.py +163 -0
phoenix/server/dml_event.py +136 -0
phoenix/server/dml_event_handler.py +256 -0
phoenix/server/email/__init__.py +0 -0
phoenix/server/email/sender.py +97 -0
phoenix/server/email/templates/__init__.py +0 -0
phoenix/server/email/templates/password_reset.html +19 -0
phoenix/server/email/types.py +11 -0
phoenix/server/grpc_server.py +102 -0
phoenix/server/jwt_store.py +505 -0
phoenix/server/main.py +305 -116
phoenix/server/oauth2.py +52 -0
phoenix/server/openapi/__init__.py +0 -0
phoenix/server/prometheus.py +111 -0
phoenix/server/rate_limiters.py +188 -0
phoenix/server/static/.vite/manifest.json +87 -0
phoenix/server/static/assets/components-Cy9nwIvF.js +2125 -0
phoenix/server/static/assets/index-BKvHIxkk.js +113 -0
phoenix/server/static/assets/pages-CUi2xCVQ.js +4449 -0
phoenix/server/static/assets/vendor-DvC8cT4X.js +894 -0
phoenix/server/static/assets/vendor-DxkFTwjz.css +1 -0
phoenix/server/static/assets/vendor-arizeai-Do1793cv.js +662 -0
phoenix/server/static/assets/vendor-codemirror-BzwZPyJM.js +24 -0
phoenix/server/static/assets/vendor-recharts-_Jb7JjhG.js +59 -0
phoenix/server/static/assets/vendor-shiki-Cl9QBraO.js +5 -0
phoenix/server/static/assets/vendor-three-DwGkEfCM.js +2998 -0
phoenix/server/telemetry.py +68 -0
phoenix/server/templates/index.html +82 -23
phoenix/server/thread_server.py +3 -3
phoenix/server/types.py +275 -0
phoenix/services.py +27 -18
phoenix/session/client.py +743 -68
phoenix/session/data_extractor.py +31 -7
phoenix/session/evaluation.py +3 -9
phoenix/session/session.py +263 -219
phoenix/settings.py +22 -0
phoenix/trace/__init__.py +2 -22
phoenix/trace/attributes.py +338 -0
phoenix/trace/dsl/README.md +116 -0
phoenix/trace/dsl/filter.py +663 -213
phoenix/trace/dsl/helpers.py +73 -21
phoenix/trace/dsl/query.py +574 -201
phoenix/trace/exporter.py +24 -19
phoenix/trace/fixtures.py +368 -32
phoenix/trace/otel.py +71 -219
phoenix/trace/projects.py +3 -2
phoenix/trace/schemas.py +33 -11
phoenix/trace/span_evaluations.py +21 -16
phoenix/trace/span_json_decoder.py +6 -4
phoenix/trace/span_json_encoder.py +2 -2
phoenix/trace/trace_dataset.py +47 -32
phoenix/trace/utils.py +21 -4
phoenix/utilities/__init__.py +0 -26
phoenix/utilities/client.py +132 -0
phoenix/utilities/deprecation.py +31 -0
phoenix/utilities/error_handling.py +3 -2
phoenix/utilities/json.py +109 -0
phoenix/utilities/logging.py +8 -0
phoenix/utilities/project.py +2 -2
phoenix/utilities/re.py +49 -0
phoenix/utilities/span_store.py +0 -23
phoenix/utilities/template_formatters.py +99 -0
phoenix/version.py +1 -1
arize_phoenix-3.16.0.dist-info/METADATA +0 -495
arize_phoenix-3.16.0.dist-info/RECORD +0 -178
phoenix/core/project.py +0 -617
phoenix/core/traces.py +0 -100
phoenix/experimental/evals/__init__.py +0 -73
phoenix/experimental/evals/evaluators.py +0 -413
phoenix/experimental/evals/functions/__init__.py +0 -4
phoenix/experimental/evals/functions/classify.py +0 -453
phoenix/experimental/evals/functions/executor.py +0 -353
phoenix/experimental/evals/functions/generate.py +0 -138
phoenix/experimental/evals/functions/processing.py +0 -76
phoenix/experimental/evals/models/__init__.py +0 -14
phoenix/experimental/evals/models/anthropic.py +0 -175
phoenix/experimental/evals/models/base.py +0 -170
phoenix/experimental/evals/models/bedrock.py +0 -221
phoenix/experimental/evals/models/litellm.py +0 -134
phoenix/experimental/evals/models/openai.py +0 -448
phoenix/experimental/evals/models/rate_limiters.py +0 -246
phoenix/experimental/evals/models/vertex.py +0 -173
phoenix/experimental/evals/models/vertexai.py +0 -186
phoenix/experimental/evals/retrievals.py +0 -96
phoenix/experimental/evals/templates/__init__.py +0 -50
phoenix/experimental/evals/templates/default_templates.py +0 -472
phoenix/experimental/evals/templates/template.py +0 -195
phoenix/experimental/evals/utils/__init__.py +0 -172
phoenix/experimental/evals/utils/threads.py +0 -27
phoenix/server/api/helpers.py +0 -11
phoenix/server/api/routers/evaluation_handler.py +0 -109
phoenix/server/api/routers/span_handler.py +0 -70
phoenix/server/api/routers/trace_handler.py +0 -60
phoenix/server/api/types/DatasetRole.py +0 -23
phoenix/server/static/index.css +0 -6
phoenix/server/static/index.js +0 -7447
phoenix/storage/span_store/__init__.py +0 -23
phoenix/storage/span_store/text_file.py +0 -85
phoenix/trace/dsl/missing.py +0 -60
phoenix/trace/langchain/__init__.py +0 -3
phoenix/trace/langchain/instrumentor.py +0 -35
phoenix/trace/llama_index/__init__.py +0 -3
phoenix/trace/llama_index/callback.py +0 -102
phoenix/trace/openai/__init__.py +0 -3
phoenix/trace/openai/instrumentor.py +0 -30
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-3.16.0.dist-info → arize_phoenix-7.7.0.dist-info}/licenses/LICENSE +0 -0
/phoenix/{datasets → db/insertion}/__init__.py +0 -0
/phoenix/{experimental → db/migrations}/__init__.py +0 -0
/phoenix/{storage → db/migrations/data_migration_scripts}/__init__.py +0 -0

phoenix/experimental/evals/models/litellm.py DELETED Viewed

@@ -1,134 +0,0 @@
-import logging
-import warnings
-from dataclasses import dataclass, field
-from typing import TYPE_CHECKING, Any, Dict, List, Optional
-from phoenix.experimental.evals.models.base import BaseEvalModel
-if TYPE_CHECKING:
-    from tiktoken import Encoding
-logger = logging.getLogger(__name__)
-@dataclass
-class LiteLLMModel(BaseEvalModel):
-    model: str = "gpt-3.5-turbo"
-    """The model name to use."""
-    temperature: float = 0.0
-    """What sampling temperature to use."""
-    max_tokens: int = 256
-    """The maximum number of tokens to generate in the completion."""
-    top_p: float = 1
-    """Total probability mass of tokens to consider at each step."""
-    num_retries: int = 6
-    """Maximum number to retry a model if an RateLimitError, OpenAIError, or
-    ServiceUnavailableError occurs."""
-    request_timeout: int = 60
-    """Maximum number of seconds to wait when retrying."""
-    model_kwargs: Dict[str, Any] = field(default_factory=dict)
-    """Model specific params"""
-    # non-LiteLLM params
-    retry_min_seconds: int = 10
-    """Minimum number of seconds to wait when retrying."""
-    max_content_size: Optional[int] = None
-    """If you're using a fine-tuned model, set this to the maximum content size"""
-    # Deprecated fields
-    model_name: Optional[str] = None
-    """
-    .. deprecated:: 3.0.0
-       use `model` instead. This will be removed in a future release.
-    """
-    def __post_init__(self) -> None:
-        self._migrate_model_name()
-        self._init_environment()
-        self._init_model_encoding()
-    def _migrate_model_name(self) -> None:
-        if self.model_name is not None:
-            warning_message = "The `model_name` field is deprecated. Use `model` instead. \
-                This will be removed in a future release."
-            warnings.warn(
-                warning_message,
-                DeprecationWarning,
-            )
-            print(warning_message)
-            self.model = self.model_name
-            self.model_name = None
-    def _init_environment(self) -> None:
-        try:
-            import litellm
-            from litellm import validate_environment
-            self._litellm = litellm
-            env_info = validate_environment(self._litellm.utils.get_llm_provider(self.model))
-            if not env_info["keys_in_environment"] and env_info["missing_keys"]:
-                raise RuntimeError(
-                    f"Missing environment variable(s): '{str(env_info['missing_keys'])}', for "
-                    f"model: {self.model}. \nFor additional information about the right "
-                    "environment variables for specific model providers:\n"
-                    "https://docs.litellm.ai/docs/completion/input#provider-specific-params."
-                )
-        except ImportError:
-            self._raise_import_error(
-                package_display_name="LiteLLM",
-                package_name="litellm",
-            )
-    def _init_model_encoding(self) -> None:
-        from litellm import decode, encode
-        self._encoding = encode
-        self._decoding = decode
-    @property
-    def max_context_size(self) -> int:
-        context_size = self.max_content_size or self._litellm.get_max_tokens(self.model).get(
-            "max_tokens", None
-        )
-        if context_size is None:
-            raise ValueError(
-                "Can't determine maximum context size. An unknown model was "
-                + f"used: {self.model}."
-            )
-        return context_size
-    @property
-    def encoder(self) -> "Encoding":
-        raise NotImplementedError
-    def get_tokens_from_text(self, text: str) -> List[int]:
-        result: List[int] = self._encoding(model=self.model, text=text)
-        return result
-    def get_text_from_tokens(self, tokens: List[int]) -> str:
-        return str(self._decoding(model=self.model, tokens=tokens))
-    async def _async_generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
-        return self._generate(prompt, **kwargs)
-    def _generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
-        messages = self._get_messages_from_prompt(prompt)
-        response = self._litellm.completion(
-            model=self.model,
-            messages=messages,
-            temperature=self.temperature,
-            max_tokens=self.max_tokens,
-            top_p=self.top_p,
-            num_retries=self.num_retries,
-            request_timeout=self.request_timeout,
-            **self.model_kwargs,
-        )
-        return str(response.choices[0].message.content)
-    def _get_messages_from_prompt(self, prompt: str) -> List[Dict[str, str]]:
-        # LiteLLM requires prompts in the format of messages
-        # messages=[{"content": "ABC?","role": "user"}]
-        return [{"content": prompt, "role": "user"}]

phoenix/experimental/evals/models/openai.py DELETED Viewed

@@ -1,448 +0,0 @@
-import logging
-import os
-import warnings
-from dataclasses import dataclass, field, fields
-from typing import (
-    TYPE_CHECKING,
-    Any,
-    Callable,
-    Dict,
-    List,
-    Optional,
-    Tuple,
-    Union,
-    get_args,
-    get_origin,
-)
-from phoenix.exceptions import PhoenixContextLimitExceeded
-from phoenix.experimental.evals.models.base import BaseEvalModel
-from phoenix.experimental.evals.models.rate_limiters import RateLimiter
-if TYPE_CHECKING:
-    from tiktoken import Encoding
-OPENAI_API_KEY_ENVVAR_NAME = "OPENAI_API_KEY"
-MINIMUM_OPENAI_VERSION = "1.0.0"
-MODEL_TOKEN_LIMIT_MAPPING = {
-    "gpt-3.5-turbo-instruct": 4096,
-    "gpt-3.5-turbo-0301": 4096,
-    "gpt-3.5-turbo-0613": 4096,  # Current gpt-3.5-turbo default
-    "gpt-3.5-turbo-16k-0613": 16385,
-    "gpt-4-0314": 8192,
-    "gpt-4-0613": 8192,  # Current gpt-4 default
-    "gpt-4-32k-0314": 32768,
-    "gpt-4-32k-0613": 32768,
-    "gpt-4-1106-preview": 128000,
-    "gpt-4-0125-preview": 128000,
-    "gpt-4-turbo-preview": 128000,
-    "gpt-4-vision-preview": 128000,
-}
-LEGACY_COMPLETION_API_MODELS = ("gpt-3.5-turbo-instruct",)
-logger = logging.getLogger(__name__)
-@dataclass
-class AzureOptions:
-    api_version: str
-    azure_endpoint: str
-    azure_deployment: Optional[str]
-    azure_ad_token: Optional[str]
-    azure_ad_token_provider: Optional[Callable[[], str]]
-@dataclass
-class OpenAIModel(BaseEvalModel):
-    api_key: Optional[str] = field(repr=False, default=None)
-    """Your OpenAI key. If not provided, will be read from the environment variable"""
-    organization: Optional[str] = field(repr=False, default=None)
-    """
-    The organization to use for the OpenAI API. If not provided, will default
-    to what's configured in OpenAI
-    """
-    base_url: Optional[str] = field(repr=False, default=None)
-    """
-    An optional base URL to use for the OpenAI API. If not provided, will default
-    to what's configured in OpenAI
-    """
-    model: str = "gpt-4"
-    """
-    Model name to use. In of azure, this is the deployment name such as gpt-35-instant
-    """
-    temperature: float = 0.0
-    """What sampling temperature to use."""
-    max_tokens: int = 256
-    """The maximum number of tokens to generate in the completion.
-    -1 returns as many tokens as possible given the prompt and
-    the models maximal context size."""
-    top_p: float = 1
-    """Total probability mass of tokens to consider at each step."""
-    frequency_penalty: float = 0
-    """Penalizes repeated tokens according to frequency."""
-    presence_penalty: float = 0
-    """Penalizes repeated tokens."""
-    n: int = 1
-    """How many completions to generate for each prompt."""
-    model_kwargs: Dict[str, Any] = field(default_factory=dict)
-    """Holds any model parameters valid for `create` call not explicitly specified."""
-    batch_size: int = 20
-    # TODO: IMPLEMENT BATCHING
-    """Batch size to use when passing multiple documents to generate."""
-    request_timeout: Optional[Union[float, Tuple[float, float]]] = None
-    """Timeout for requests to OpenAI completion API. Default is 600 seconds."""
-    max_retries: int = 20
-    """Maximum number of retries to make when generating."""
-    retry_min_seconds: int = 10
-    """Minimum number of seconds to wait when retrying."""
-    retry_max_seconds: int = 60
-    """Maximum number of seconds to wait when retrying."""
-    # Azure options
-    api_version: Optional[str] = field(default=None)
-    """https://learn.microsoft.com/en-us/azure/ai-services/openai/reference#rest-api-versioning"""
-    azure_endpoint: Optional[str] = field(default=None)
-    """
-    The endpoint to use for azure openai. Available in the azure portal.
-    https://learn.microsoft.com/en-us/azure/cognitive-services/openai/how-to/create-resource?pivots=web-portal#create-a-resource
-    """
-    azure_deployment: Optional[str] = field(default=None)
-    azure_ad_token: Optional[str] = field(default=None)
-    azure_ad_token_provider: Optional[Callable[[], str]] = field(default=None)
-    # Deprecated fields
-    model_name: Optional[str] = field(default=None)
-    """
-    .. deprecated:: 3.0.0
-       use `model` instead. This will be removed
-    """
-    def __post_init__(self) -> None:
-        self._migrate_model_name()
-        self._init_environment()
-        self._init_open_ai()
-        self._init_tiktoken()
-        self._init_rate_limiter()
-    def reload_client(self) -> None:
-        self._init_open_ai()
-    def _migrate_model_name(self) -> None:
-        if self.model_name:
-            warning_message = "The `model_name` field is deprecated. Use `model` instead. \
-                This will be removed in a future release."
-            print(
-                warning_message,
-            )
-            warnings.warn(warning_message, DeprecationWarning)
-            self.model = self.model_name
-            self.model_name = None
-    def _init_environment(self) -> None:
-        try:
-            import openai
-            import openai._utils as openai_util
-            self._openai = openai
-            self._openai_util = openai_util
-        except ImportError:
-            self._raise_import_error(
-                package_display_name="OpenAI",
-                package_name="openai",
-                package_min_version=MINIMUM_OPENAI_VERSION,
-            )
-        try:
-            import tiktoken
-            self._tiktoken = tiktoken
-        except ImportError:
-            self._raise_import_error(
-                package_name="tiktoken",
-            )
-    def _init_open_ai(self) -> None:
-        # For Azure, you need to provide the endpoint and the endpoint
-        self._is_azure = bool(self.azure_endpoint)
-        self._model_uses_legacy_completion_api = self.model.startswith(LEGACY_COMPLETION_API_MODELS)
-        if self.api_key is None:
-            api_key = os.getenv(OPENAI_API_KEY_ENVVAR_NAME)
-            if api_key is None:
-                # TODO: Create custom AuthenticationError
-                raise RuntimeError(
-                    "OpenAI's API key not provided. Pass it as an argument to 'api_key' "
-                    "or set it in your environment: 'export OPENAI_API_KEY=sk-****'"
-                )
-            self.api_key = api_key
-        # Set the version, organization, and base_url - default to openAI
-        self.api_version = self.api_version or self._openai.api_version
-        self.organization = self.organization or self._openai.organization
-        # Initialize specific clients depending on the API backend
-        # Set the type first
-        self._client: Union[self._openai.OpenAI, self._openai.AzureOpenAI]  # type: ignore
-        self._async_client: Union[self._openai.AsyncOpenAI, self._openai.AsyncAzureOpenAI]  # type: ignore
-        if self._is_azure:
-            # Validate the azure options and construct a client
-            azure_options = self._get_azure_options()
-            self._client = self._openai.AzureOpenAI(
-                azure_endpoint=azure_options.azure_endpoint,
-                azure_deployment=azure_options.azure_deployment,
-                api_version=azure_options.api_version,
-                azure_ad_token=azure_options.azure_ad_token,
-                azure_ad_token_provider=azure_options.azure_ad_token_provider,
-                api_key=self.api_key,
-                organization=self.organization,
-            )
-            self._async_client = self._openai.AsyncAzureOpenAI(
-                azure_endpoint=azure_options.azure_endpoint,
-                azure_deployment=azure_options.azure_deployment,
-                api_version=azure_options.api_version,
-                azure_ad_token=azure_options.azure_ad_token,
-                azure_ad_token_provider=azure_options.azure_ad_token_provider,
-                api_key=self.api_key,
-                organization=self.organization,
-            )
-            # return early since we don't need to check the model
-            return
-        # The client is not azure, so it must be openai
-        self._client = self._openai.OpenAI(
-            api_key=self.api_key,
-            organization=self.organization,
-            base_url=(self.base_url or self._openai.base_url),
-        )
-        # The client is not azure, so it must be openai
-        self._async_client = self._openai.AsyncOpenAI(
-            api_key=self.api_key,
-            organization=self.organization,
-            base_url=(self.base_url or self._openai.base_url),
-            max_retries=0,
-        )
-    def _init_tiktoken(self) -> None:
-        try:
-            encoding = self._tiktoken.encoding_for_model(self.model)
-        except KeyError:
-            encoding = self._tiktoken.get_encoding("cl100k_base")
-        self._tiktoken_encoding = encoding
-    def _get_azure_options(self) -> AzureOptions:
-        options = {}
-        for option in fields(AzureOptions):
-            if (value := getattr(self, option.name)) is not None:
-                options[option.name] = value
-            else:
-                # raise ValueError if field is not optional
-                # See if the field is optional - e.g. get_origin(Optional[T])  = typing.Union
-                option_is_optional = get_origin(option.type) is Union and type(None) in get_args(
-                    option.type
-                )
-                if not option_is_optional:
-                    raise ValueError(
-                        f"Option '{option.name}' must be set when using Azure OpenAI API"
-                    )
-                options[option.name] = None
-        return AzureOptions(**options)
-    def _init_rate_limiter(self) -> None:
-        self._rate_limiter = RateLimiter(
-            rate_limit_error=self._openai.RateLimitError,
-            max_rate_limit_retries=10,
-            initial_per_second_request_rate=5,
-            maximum_per_second_request_rate=20,
-            enforcement_window_minutes=1,
-        )
-    @staticmethod
-    def _build_messages(
-        prompt: str, system_instruction: Optional[str] = None
-    ) -> List[Dict[str, str]]:
-        messages = [{"role": "user", "content": prompt}]
-        if system_instruction:
-            messages.insert(0, {"role": "system", "content": str(system_instruction)})
-        return messages
-    def verbose_generation_info(self) -> str:
-        return f"OpenAI invocation parameters: {self.public_invocation_params}"
-    async def _async_generate(self, prompt: str, **kwargs: Any) -> str:
-        invoke_params = self.invocation_params
-        messages = self._build_messages(prompt, kwargs.get("instruction"))
-        if functions := kwargs.get("functions"):
-            invoke_params["functions"] = functions
-        if function_call := kwargs.get("function_call"):
-            invoke_params["function_call"] = function_call
-        response = await self._async_rate_limited_completion(
-            messages=messages,
-            **invoke_params,
-        )
-        choice = response["choices"][0]
-        if self._model_uses_legacy_completion_api:
-            return str(choice["text"])
-        message = choice["message"]
-        if function_call := message.get("function_call"):
-            return str(function_call.get("arguments") or "")
-        return str(message["content"])
-    def _generate(self, prompt: str, **kwargs: Any) -> str:
-        invoke_params = self.invocation_params
-        messages = self._build_messages(prompt, kwargs.get("instruction"))
-        if functions := kwargs.get("functions"):
-            invoke_params["functions"] = functions
-        if function_call := kwargs.get("function_call"):
-            invoke_params["function_call"] = function_call
-        response = self._rate_limited_completion(
-            messages=messages,
-            **invoke_params,
-        )
-        choice = response["choices"][0]
-        if self._model_uses_legacy_completion_api:
-            return str(choice["text"])
-        message = choice["message"]
-        if function_call := message.get("function_call"):
-            return str(function_call.get("arguments") or "")
-        return str(message["content"])
-    async def _async_rate_limited_completion(self, **kwargs: Any) -> Any:
-        @self._rate_limiter.alimit
-        async def _async_completion(**kwargs: Any) -> Any:
-            try:
-                if self._model_uses_legacy_completion_api:
-                    if "prompt" not in kwargs:
-                        kwargs["prompt"] = "\n\n".join(
-                            (message.get("content") or "")
-                            for message in (kwargs.pop("messages", None) or ())
-                        )
-                    # OpenAI 1.0.0 API responses are pydantic objects, not dicts
-                    # We must dump the model to get the dict
-                    res = await self._async_client.completions.create(**kwargs)
-                else:
-                    res = await self._async_client.chat.completions.create(**kwargs)
-                return res.model_dump()
-            except self._openai._exceptions.BadRequestError as e:
-                exception_message = e.args[0]
-                if exception_message and "maximum context length" in exception_message:
-                    raise PhoenixContextLimitExceeded(exception_message) from e
-                raise e
-        return await _async_completion(**kwargs)
-    def _rate_limited_completion(self, **kwargs: Any) -> Any:
-        @self._rate_limiter.limit
-        def _completion(**kwargs: Any) -> Any:
-            try:
-                if self._model_uses_legacy_completion_api:
-                    if "prompt" not in kwargs:
-                        kwargs["prompt"] = "\n\n".join(
-                            (message.get("content") or "")
-                            for message in (kwargs.pop("messages", None) or ())
-                        )
-                    # OpenAI 1.0.0 API responses are pydantic objects, not dicts
-                    # We must dump the model to get the dict
-                    return self._client.completions.create(**kwargs).model_dump()
-                return self._client.chat.completions.create(**kwargs).model_dump()
-            except self._openai._exceptions.BadRequestError as e:
-                exception_message = e.args[0]
-                if exception_message and "maximum context length" in exception_message:
-                    raise PhoenixContextLimitExceeded(exception_message) from e
-                raise e
-        return _completion(**kwargs)
-    @property
-    def max_context_size(self) -> int:
-        model = self.model
-        # handling finetuned models
-        if "ft-" in model:
-            model = self.model.split(":")[0]
-        if model == "gpt-4":
-            # Map gpt-4 to the current default
-            model = "gpt-4-0613"
-        context_size = MODEL_TOKEN_LIMIT_MAPPING.get(model, None)
-        if context_size is None:
-            raise ValueError(
-                "Can't determine maximum context size. An unknown model name was "
-                f"used: {model}. Please provide a valid OpenAI model name. "
-                "Known models are: " + ", ".join(MODEL_TOKEN_LIMIT_MAPPING.keys())
-            )
-        return context_size
-    @property
-    def public_invocation_params(self) -> Dict[str, Any]:
-        return {
-            **({"model": self.model}),
-            **self._default_params,
-            **self.model_kwargs,
-        }
-    @property
-    def invocation_params(self) -> Dict[str, Any]:
-        return {
-            **self.public_invocation_params,
-        }
-    @property
-    def _default_params(self) -> Dict[str, Any]:
-        """Get the default parameters for calling OpenAI API."""
-        return {
-            "temperature": self.temperature,
-            "max_tokens": self.max_tokens,
-            "frequency_penalty": self.frequency_penalty,
-            "presence_penalty": self.presence_penalty,
-            "top_p": self.top_p,
-            "n": self.n,
-            "timeout": self.request_timeout,
-        }
-    @property
-    def encoder(self) -> "Encoding":
-        return self._tiktoken_encoding
-    def get_token_count_from_messages(self, messages: List[Dict[str, str]]) -> int:
-        """Return the number of tokens used by a list of messages.
-        Official documentation: https://github.com/openai/openai-cookbook/blob/main/examples/How_to_format_inputs_to_ChatGPT_models.ipynb
-        """  # noqa
-        model = self.model
-        if model == "gpt-3.5-turbo-0301":
-            tokens_per_message = 4  # every message follows <|start|>{role/name}\n{content}<|end|>\n
-            tokens_per_name = -1  # if there's a name, the role is omitted
-        else:
-            tokens_per_message = 3
-            tokens_per_name = 1
-        token_count = 0
-        for message in messages:
-            token_count += tokens_per_message
-            for key, text in message.items():
-                token_count += len(self.get_tokens_from_text(text))
-                if key == "name":
-                    token_count += tokens_per_name
-        # every reply is primed with <|start|>assistant<|message|>
-        token_count += 3
-        return token_count
-    def get_tokens_from_text(self, text: str) -> List[int]:
-        return self.encoder.encode(text)
-    def get_text_from_tokens(self, tokens: List[int]) -> str:
-        return self.encoder.decode(tokens)
-    @property
-    def supports_function_calling(self) -> bool:
-        if (
-            self._is_azure
-            and self.api_version
-            # The first api version supporting function calling is 2023-07-01-preview.
-            # See https://github.com/Azure/azure-rest-api-specs/blob/58e92dd03733bc175e6a9540f4bc53703b57fcc9/specification/cognitiveservices/data-plane/AzureOpenAI/inference/preview/2023-07-01-preview/inference.json#L895 # noqa E501
-            and self.api_version[:10] < "2023-07-01"
-        ):
-            return False
-        if self._model_uses_legacy_completion_api:
-            return False
-        return True

arize-phoenix 3.16.0__py3-none-any.whl → 7.7.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 3.16.0py3-none-any.whl → 7.7.0py3-none-any.whl