PyPI - arize-phoenix - Versions diffs - 10.14.0__py3-none-any.whl → 11.0.0__py3-none-any.whl - Mend

arize-phoenix 10.14.0py3-none-any.whl → 11.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of arize-phoenix might be problematic. Click here for more details.

Files changed (84) hide show

{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/METADATA +3 -2
{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/RECORD +82 -50
phoenix/config.py +5 -2
phoenix/datetime_utils.py +8 -1
phoenix/db/bulk_inserter.py +40 -1
phoenix/db/facilitator.py +263 -4
phoenix/db/insertion/helpers.py +15 -0
phoenix/db/insertion/span.py +3 -1
phoenix/db/migrations/versions/a20694b15f82_cost.py +196 -0
phoenix/db/models.py +267 -9
phoenix/db/types/model_provider.py +1 -0
phoenix/db/types/token_price_customization.py +29 -0
phoenix/server/api/context.py +38 -4
phoenix/server/api/dataloaders/__init__.py +41 -5
phoenix/server/api/dataloaders/last_used_times_by_generative_model_id.py +35 -0
phoenix/server/api/dataloaders/span_cost_by_span.py +24 -0
phoenix/server/api/dataloaders/span_cost_detail_summary_entries_by_generative_model.py +56 -0
phoenix/server/api/dataloaders/span_cost_detail_summary_entries_by_project_session.py +57 -0
phoenix/server/api/dataloaders/span_cost_detail_summary_entries_by_span.py +43 -0
phoenix/server/api/dataloaders/span_cost_detail_summary_entries_by_trace.py +56 -0
phoenix/server/api/dataloaders/span_cost_details_by_span_cost.py +27 -0
phoenix/server/api/dataloaders/span_cost_summary_by_experiment.py +58 -0
phoenix/server/api/dataloaders/span_cost_summary_by_experiment_run.py +58 -0
phoenix/server/api/dataloaders/span_cost_summary_by_generative_model.py +55 -0
phoenix/server/api/dataloaders/span_cost_summary_by_project.py +140 -0
phoenix/server/api/dataloaders/span_cost_summary_by_project_session.py +56 -0
phoenix/server/api/dataloaders/span_cost_summary_by_trace.py +55 -0
phoenix/server/api/dataloaders/span_costs.py +35 -0
phoenix/server/api/dataloaders/types.py +29 -0
phoenix/server/api/helpers/playground_clients.py +562 -12
phoenix/server/api/helpers/prompts/conversions/aws.py +83 -0
phoenix/server/api/helpers/prompts/models.py +67 -0
phoenix/server/api/input_types/GenerativeModelInput.py +2 -0
phoenix/server/api/input_types/ProjectSessionSort.py +3 -0
phoenix/server/api/input_types/SpanSort.py +17 -0
phoenix/server/api/mutations/__init__.py +2 -0
phoenix/server/api/mutations/chat_mutations.py +17 -0
phoenix/server/api/mutations/model_mutations.py +208 -0
phoenix/server/api/queries.py +82 -41
phoenix/server/api/routers/v1/traces.py +11 -4
phoenix/server/api/subscriptions.py +36 -2
phoenix/server/api/types/CostBreakdown.py +15 -0
phoenix/server/api/types/Experiment.py +59 -1
phoenix/server/api/types/ExperimentRun.py +58 -4
phoenix/server/api/types/GenerativeModel.py +143 -2
phoenix/server/api/types/GenerativeProvider.py +33 -20
phoenix/server/api/types/{Model.py → InferenceModel.py} +1 -1
phoenix/server/api/types/ModelInterface.py +11 -0
phoenix/server/api/types/PlaygroundModel.py +10 -0
phoenix/server/api/types/Project.py +42 -0
phoenix/server/api/types/ProjectSession.py +44 -0
phoenix/server/api/types/Span.py +137 -0
phoenix/server/api/types/SpanCostDetailSummaryEntry.py +10 -0
phoenix/server/api/types/SpanCostSummary.py +10 -0
phoenix/server/api/types/TokenPrice.py +16 -0
phoenix/server/api/types/TokenUsage.py +3 -3
phoenix/server/api/types/Trace.py +41 -0
phoenix/server/app.py +59 -0
phoenix/server/cost_tracking/cost_details_calculator.py +190 -0
phoenix/server/cost_tracking/cost_model_lookup.py +151 -0
phoenix/server/cost_tracking/helpers.py +68 -0
phoenix/server/cost_tracking/model_cost_manifest.json +59 -329
phoenix/server/cost_tracking/regex_specificity.py +397 -0
phoenix/server/cost_tracking/token_cost_calculator.py +57 -0
phoenix/server/daemons/__init__.py +0 -0
phoenix/server/daemons/generative_model_store.py +51 -0
phoenix/server/daemons/span_cost_calculator.py +103 -0
phoenix/server/dml_event_handler.py +1 -0
phoenix/server/static/.vite/manifest.json +36 -36
phoenix/server/static/assets/components-BnK9kodr.js +5055 -0
phoenix/server/static/assets/{index-qiubV_74.js → index-S3YKLmbo.js} +13 -13
phoenix/server/static/assets/{pages-C4V07ozl.js → pages-BW6PBHZb.js} +809 -417
phoenix/server/static/assets/{vendor-Bfsiga8H.js → vendor-DqQvHbPa.js} +147 -147
phoenix/server/static/assets/{vendor-arizeai-CQOWsrzm.js → vendor-arizeai-CLX44PFA.js} +1 -1
phoenix/server/static/assets/{vendor-codemirror-CrcGVhB2.js → vendor-codemirror-Du3XyJnB.js} +1 -1
phoenix/server/static/assets/{vendor-recharts-Yyg3G-Rq.js → vendor-recharts-B2PJDrnX.js} +25 -25
phoenix/server/static/assets/{vendor-shiki-OPjag7Hm.js → vendor-shiki-CNbrFjf9.js} +1 -1
phoenix/version.py +1 -1
phoenix/server/cost_tracking/cost_lookup.py +0 -255
phoenix/server/static/assets/components-CUUWyAMo.js +0 -4509
{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/WHEEL +0 -0
{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/entry_points.txt +0 -0
{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/licenses/IP_NOTICE +0 -0
{arize_phoenix-10.14.0.dist-info → arize_phoenix-11.0.0.dist-info}/licenses/LICENSE +0 -0

phoenix/server/api/types/GenerativeModel.py CHANGED Viewed

@@ -1,9 +1,150 @@
+from datetime import datetime
+from enum import Enum
+from typing import Optional
 import strawberry
+from openinference.semconv.trace import OpenInferenceLLMProviderValues
+from sqlalchemy import inspect
+from strawberry.relay import Node, NodeID
+from strawberry.types import Info
+from typing_extensions import assert_never
+from phoenix.db import models
+from phoenix.server.api.context import Context
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
 from phoenix.server.api.types.GenerativeProvider import GenerativeProviderKey
+from phoenix.server.api.types.ModelInterface import ModelInterface
+from phoenix.server.api.types.SpanCostDetailSummaryEntry import SpanCostDetailSummaryEntry
+from phoenix.server.api.types.SpanCostSummary import SpanCostSummary
+from phoenix.server.api.types.TokenPrice import TokenKind, TokenPrice
+@strawberry.enum
+class GenerativeModelKind(Enum):
+    CUSTOM = "CUSTOM"
+    BUILT_IN = "BUILT_IN"
 @strawberry.type
-class GenerativeModel:
+class GenerativeModel(Node, ModelInterface):
+    id_attr: NodeID[int]
     name: str
-    provider_key: GenerativeProviderKey
+    provider: Optional[str]
+    name_pattern: str
+    kind: GenerativeModelKind
+    created_at: datetime
+    updated_at: datetime
+    provider_key: Optional[GenerativeProviderKey]
+    costs: strawberry.Private[Optional[list[models.TokenPrice]]] = None
+    start_time: Optional[datetime] = None
+    @strawberry.field
+    async def token_prices(self) -> list[TokenPrice]:
+        if self.costs is None:
+            raise NotImplementedError
+        token_prices: list[TokenPrice] = list()
+        for cost in self.costs:
+            token_prices.append(
+                TokenPrice(
+                    token_type=cost.token_type,
+                    kind=TokenKind.PROMPT if cost.is_prompt else TokenKind.COMPLETION,
+                    cost_per_million_tokens=cost.base_rate * 1_000_000,
+                    cost_per_token=cost.base_rate,
+                )
+            )
+        return token_prices
+    @strawberry.field
+    async def cost_summary(self, info: Info[Context, None]) -> SpanCostSummary:
+        loader = info.context.data_loaders.span_cost_summary_by_generative_model
+        summary = await loader.load(self.id_attr)
+        return SpanCostSummary(
+            prompt=CostBreakdown(
+                tokens=summary.prompt.tokens,
+                cost=summary.prompt.cost,
+            ),
+            completion=CostBreakdown(
+                tokens=summary.completion.tokens,
+                cost=summary.completion.cost,
+            ),
+            total=CostBreakdown(
+                tokens=summary.total.tokens,
+                cost=summary.total.cost,
+            ),
+        )
+    @strawberry.field
+    async def cost_detail_summary_entries(
+        self,
+        info: Info[Context, None],
+    ) -> list[SpanCostDetailSummaryEntry]:
+        loader = info.context.data_loaders.span_cost_detail_summary_entries_by_generative_model
+        summary = await loader.load(self.id_attr)
+        return [
+            SpanCostDetailSummaryEntry(
+                token_type=entry.token_type,
+                is_prompt=entry.is_prompt,
+                value=CostBreakdown(
+                    tokens=entry.value.tokens,
+                    cost=entry.value.cost,
+                ),
+            )
+            for entry in summary
+        ]
+    @strawberry.field
+    async def last_used_at(self, info: Info[Context, None]) -> Optional[datetime]:
+        model_id = self.id_attr
+        return await info.context.data_loaders.last_used_times_by_generative_model_id.load(model_id)
+def to_gql_generative_model(model: models.GenerativeModel) -> GenerativeModel:
+    costs_are_loaded = isinstance(inspect(model).attrs.token_prices.loaded_value, list)
+    name_pattern = model.name_pattern.pattern
+    assert isinstance(name_pattern, str)
+    return GenerativeModel(
+        id_attr=model.id,
+        name=model.name,
+        provider=model.provider or None,
+        name_pattern=name_pattern,
+        kind=GenerativeModelKind.BUILT_IN if model.is_built_in else GenerativeModelKind.CUSTOM,
+        created_at=model.created_at,
+        updated_at=model.updated_at,
+        start_time=model.start_time,
+        provider_key=_semconv_provider_to_gql_generative_provider_key(model.provider)
+        if model.provider
+        else None,
+        costs=model.token_prices if costs_are_loaded else None,
+    )
+def _semconv_provider_to_gql_generative_provider_key(
+    semconv_provider_str: str,
+) -> Optional[GenerativeProviderKey]:
+    """
+    Translates a semconv provider string to a GQL GenerativeProviderKey.
+    """
+    try:
+        semconv_provider = OpenInferenceLLMProviderValues(semconv_provider_str)
+    except Exception:
+        return None
+    if semconv_provider == OpenInferenceLLMProviderValues.OPENAI:
+        return GenerativeProviderKey.OPENAI
+    if semconv_provider == OpenInferenceLLMProviderValues.ANTHROPIC:
+        return GenerativeProviderKey.ANTHROPIC
+    if semconv_provider == OpenInferenceLLMProviderValues.AZURE:
+        return GenerativeProviderKey.AZURE_OPENAI
+    if semconv_provider == OpenInferenceLLMProviderValues.GOOGLE:
+        return GenerativeProviderKey.GOOGLE
+    if semconv_provider == OpenInferenceLLMProviderValues.DEEPSEEK:
+        return GenerativeProviderKey.DEEPSEEK
+    if semconv_provider == OpenInferenceLLMProviderValues.XAI:
+        return GenerativeProviderKey.XAI
+    if semconv_provider == OpenInferenceLLMProviderValues.AWS:
+        raise NotImplementedError("AWS models are not yet supported")
+    if semconv_provider == OpenInferenceLLMProviderValues.COHERE:
+        raise NotImplementedError("Cohere models are not yet supported")
+    if semconv_provider == OpenInferenceLLMProviderValues.MISTRALAI:
+        raise NotImplementedError("Mistral AI models are not yet supported")
+    assert_never(semconv_provider)

phoenix/server/api/types/GenerativeProvider.py CHANGED Viewed

@@ -17,6 +17,7 @@ class GenerativeProviderKey(Enum):
     DEEPSEEK = "DeepSeek"
     XAI = "xAI"
     OLLAMA = "Ollama"
+    AWS = "AWS Bedrock"
 @strawberry.type
@@ -38,6 +39,7 @@ class GenerativeProvider:
         GenerativeProviderKey.DEEPSEEK: ["deepseek"],
         GenerativeProviderKey.XAI: ["grok"],
         GenerativeProviderKey.OLLAMA: ["llama", "mistral", "codellama", "phi", "qwen", "gemma"],
+        GenerativeProviderKey.AWS: ["nova", "titan"],
     }
     attribute_provider_to_generative_provider_map: ClassVar[dict[str, GenerativeProviderKey]] = {
@@ -45,6 +47,7 @@ class GenerativeProvider:
         OpenInferenceLLMProviderValues.ANTHROPIC.value: GenerativeProviderKey.ANTHROPIC,
         OpenInferenceLLMProviderValues.AZURE.value: GenerativeProviderKey.AZURE_OPENAI,
         OpenInferenceLLMProviderValues.GOOGLE.value: GenerativeProviderKey.GOOGLE,
+        OpenInferenceLLMProviderValues.AWS.value: GenerativeProviderKey.AWS,
         # Note: DeepSeek uses OpenAI compatibility but we can't duplicate the key in the dict
         # The provider will be determined through model name prefix matching instead
         # Note: xAI uses OpenAI compatibility but we can't duplicate the key in the dict
@@ -58,26 +61,36 @@ class GenerativeProvider:
     E.x. OpenAI requires a single API key
     """
     model_provider_to_credential_requirements_map: ClassVar[
-        dict[GenerativeProviderKey, GenerativeProviderCredentialConfig]
+        dict[GenerativeProviderKey, list[GenerativeProviderCredentialConfig]]
     ] = {
-        GenerativeProviderKey.AZURE_OPENAI: GenerativeProviderCredentialConfig(
-            env_var_name="AZURE_OPENAI_API_KEY", is_required=True
-        ),
-        GenerativeProviderKey.ANTHROPIC: GenerativeProviderCredentialConfig(
-            env_var_name="ANTHROPIC_API_KEY", is_required=True
-        ),
-        GenerativeProviderKey.OPENAI: GenerativeProviderCredentialConfig(
-            env_var_name="OPENAI_API_KEY", is_required=True
-        ),
-        GenerativeProviderKey.GOOGLE: GenerativeProviderCredentialConfig(
-            env_var_name="GEMINI_API_KEY", is_required=True
-        ),
-        GenerativeProviderKey.DEEPSEEK: GenerativeProviderCredentialConfig(
-            env_var_name="DEEPSEEK_API_KEY", is_required=True
-        ),
-        GenerativeProviderKey.XAI: GenerativeProviderCredentialConfig(
-            env_var_name="XAI_API_KEY", is_required=True
-        ),
+        GenerativeProviderKey.AZURE_OPENAI: [
+            GenerativeProviderCredentialConfig(
+                env_var_name="AZURE_OPENAI_API_KEY", is_required=True
+            )
+        ],
+        GenerativeProviderKey.ANTHROPIC: [
+            GenerativeProviderCredentialConfig(env_var_name="ANTHROPIC_API_KEY", is_required=True)
+        ],
+        GenerativeProviderKey.OPENAI: [
+            GenerativeProviderCredentialConfig(env_var_name="OPENAI_API_KEY", is_required=True)
+        ],
+        GenerativeProviderKey.GOOGLE: [
+            GenerativeProviderCredentialConfig(env_var_name="GEMINI_API_KEY", is_required=True)
+        ],
+        GenerativeProviderKey.DEEPSEEK: [
+            GenerativeProviderCredentialConfig(env_var_name="DEEPSEEK_API_KEY", is_required=True)
+        ],
+        GenerativeProviderKey.XAI: [
+            GenerativeProviderCredentialConfig(env_var_name="XAI_API_KEY", is_required=True)
+        ],
+        GenerativeProviderKey.OLLAMA: [],
+        GenerativeProviderKey.AWS: [
+            GenerativeProviderCredentialConfig(env_var_name="AWS_ACCESS_KEY_ID", is_required=True),
+            GenerativeProviderCredentialConfig(
+                env_var_name="AWS_SECRET_ACCESS_KEY", is_required=True
+            ),
+            GenerativeProviderCredentialConfig(env_var_name="AWS_SESSION_TOKEN", is_required=False),
+        ],
     }
     @strawberry.field
@@ -110,7 +123,7 @@ class GenerativeProvider:
         credential_requirements = self.model_provider_to_credential_requirements_map.get(self.key)
         if credential_requirements is None:
             return []
-        return [credential_requirements]
+        return self.model_provider_to_credential_requirements_map[self.key]
     @strawberry.field(description="Whether the credentials are set on the server for the provider")  # type: ignore
     async def credentials_set(self) -> bool:

phoenix/server/api/types/{Model.py → InferenceModel.py} RENAMED Viewed

@@ -28,7 +28,7 @@ from .TimeSeries import (
 @strawberry.type
-class Model:
+class InferenceModel:
     @strawberry.field
     def dimensions(
         self,

phoenix/server/api/types/ModelInterface.py ADDED Viewed

@@ -0,0 +1,11 @@
+from typing import Optional
+import strawberry
+from phoenix.server.api.types.GenerativeProvider import GenerativeProviderKey
+@strawberry.interface
+class ModelInterface:
+    name: str
+    provider_key: Optional[GenerativeProviderKey]

phoenix/server/api/types/PlaygroundModel.py ADDED Viewed

@@ -0,0 +1,10 @@
+import strawberry
+from phoenix.server.api.types.GenerativeProvider import GenerativeProviderKey
+from phoenix.server.api.types.ModelInterface import ModelInterface
+@strawberry.type
+class PlaygroundModel(ModelInterface):
+    name: str
+    provider_key: GenerativeProviderKey  # PlaygroundModel always has a provider_key

phoenix/server/api/types/Project.py CHANGED Viewed

@@ -28,6 +28,7 @@ from phoenix.server.api.input_types.SpanSort import SpanSort, SpanSortConfig
 from phoenix.server.api.input_types.TimeRange import TimeRange
 from phoenix.server.api.types.AnnotationConfig import AnnotationConfig, to_gql_annotation_config
 from phoenix.server.api.types.AnnotationSummary import AnnotationSummary
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
 from phoenix.server.api.types.DocumentEvaluationSummary import DocumentEvaluationSummary
 from phoenix.server.api.types.pagination import (
     ConnectionArgs,
@@ -40,6 +41,7 @@ from phoenix.server.api.types.pagination import (
 from phoenix.server.api.types.ProjectSession import ProjectSession, to_gql_project_session
 from phoenix.server.api.types.SortDir import SortDir
 from phoenix.server.api.types.Span import Span
+from phoenix.server.api.types.SpanCostSummary import SpanCostSummary
 from phoenix.server.api.types.TimeSeries import TimeSeries, TimeSeriesDataPoint
 from phoenix.server.api.types.Trace import Trace
 from phoenix.server.api.types.ValidationResult import ValidationResult
@@ -175,6 +177,30 @@ class Project(Node):
             ("completion", self.project_rowid, time_range, filter_condition),
         )
+    @strawberry.field
+    async def cost_summary(
+        self,
+        info: Info[Context, None],
+        time_range: Optional[TimeRange] = UNSET,
+        filter_condition: Optional[str] = UNSET,
+    ) -> SpanCostSummary:
+        loader = info.context.data_loaders.span_cost_summary_by_project
+        summary = await loader.load((self.project_rowid, time_range, filter_condition))
+        return SpanCostSummary(
+            prompt=CostBreakdown(
+                tokens=summary.prompt.tokens,
+                cost=summary.prompt.cost,
+            ),
+            completion=CostBreakdown(
+                tokens=summary.completion.tokens,
+                cost=summary.completion.cost,
+            ),
+            total=CostBreakdown(
+                tokens=summary.total.tokens,
+                cost=summary.total.cost,
+            ),
+        )
     @strawberry.field
     async def latency_ms_quantile(
         self,
@@ -238,6 +264,7 @@ class Project(Node):
     ) -> Connection[Span]:
         stmt = (
             select(models.Span.id)
+            .select_from(models.Span)
             .join(models.Trace)
             .where(models.Trace.project_rowid == self.project_rowid)
         )
@@ -410,6 +437,21 @@ class Project(Node):
                     assert_never(sort.col)
                 key = sort_subq.c.key
                 stmt = stmt.join(sort_subq, table.id == sort_subq.c.id)
+            elif sort.col is ProjectSessionColumn.costTotal:
+                sort_subq = (
+                    select(
+                        models.Trace.project_session_rowid.label("id"),
+                        func.sum(models.SpanCost.total_cost).label("key"),
+                    )
+                    .join_from(
+                        models.Trace,
+                        models.SpanCost,
+                        models.Trace.id == models.SpanCost.trace_rowid,
+                    )
+                    .group_by(models.Trace.project_session_rowid)
+                ).subquery()
+                key = sort_subq.c.key
+                stmt = stmt.join(sort_subq, table.id == sort_subq.c.id)
             else:
                 assert_never(sort.col)
             stmt = stmt.add_columns(key)

phoenix/server/api/types/ProjectSession.py CHANGED Viewed

@@ -9,8 +9,11 @@ from strawberry.relay import Connection, GlobalID, Node, NodeID
 from phoenix.db import models
 from phoenix.server.api.context import Context
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
 from phoenix.server.api.types.MimeType import MimeType
 from phoenix.server.api.types.pagination import ConnectionArgs, CursorString, connection_from_list
+from phoenix.server.api.types.SpanCostDetailSummaryEntry import SpanCostDetailSummaryEntry
+from phoenix.server.api.types.SpanCostSummary import SpanCostSummary
 from phoenix.server.api.types.SpanIOValue import SpanIOValue
 from phoenix.server.api.types.TokenUsage import TokenUsage
@@ -122,6 +125,47 @@ class ProjectSession(Node):
             (self.id_attr, probability)
         )
+    @strawberry.field
+    async def cost_summary(
+        self,
+        info: Info[Context, None],
+    ) -> SpanCostSummary:
+        loader = info.context.data_loaders.span_cost_summary_by_project_session
+        summary = await loader.load(self.id_attr)
+        return SpanCostSummary(
+            prompt=CostBreakdown(
+                tokens=summary.prompt.tokens,
+                cost=summary.prompt.cost,
+            ),
+            completion=CostBreakdown(
+                tokens=summary.completion.tokens,
+                cost=summary.completion.cost,
+            ),
+            total=CostBreakdown(
+                tokens=summary.total.tokens,
+                cost=summary.total.cost,
+            ),
+        )
+    @strawberry.field
+    async def cost_detail_summary_entries(
+        self,
+        info: Info[Context, None],
+    ) -> list[SpanCostDetailSummaryEntry]:
+        loader = info.context.data_loaders.span_cost_detail_summary_entries_by_project_session
+        summary = await loader.load(self.id_attr)
+        return [
+            SpanCostDetailSummaryEntry(
+                token_type=entry.token_type,
+                is_prompt=entry.is_prompt,
+                value=CostBreakdown(
+                    tokens=entry.value.tokens,
+                    cost=entry.value.cost,
+                ),
+            )
+            for entry in summary
+        ]
 def to_gql_project_session(project_session: models.ProjectSession) -> ProjectSession:
     return ProjectSession(

phoenix/server/api/types/Span.py CHANGED Viewed

@@ -19,6 +19,7 @@ from typing_extensions import Annotated, TypeAlias
 import phoenix.trace.schemas as trace_schema
 from phoenix.db import models
 from phoenix.server.api.context import Context
+from phoenix.server.api.dataloaders import types as dataloader_types
 from phoenix.server.api.helpers.dataset_helpers import (
     get_dataset_example_input,
     get_dataset_example_output,
@@ -33,6 +34,7 @@ from phoenix.server.api.input_types.SpanAnnotationSort import (
     SpanAnnotationSort,
 )
 from phoenix.server.api.types.AnnotationSummary import AnnotationSummary
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
 from phoenix.server.api.types.DocumentRetrievalMetrics import DocumentRetrievalMetrics
 from phoenix.server.api.types.Evaluation import DocumentEvaluation
 from phoenix.server.api.types.ExampleRevisionInterface import ExampleRevision
@@ -41,6 +43,8 @@ from phoenix.server.api.types.MimeType import MimeType
 from phoenix.server.api.types.pagination import ConnectionArgs, CursorString, connection_from_list
 from phoenix.server.api.types.SortDir import SortDir
 from phoenix.server.api.types.SpanAnnotation import SpanAnnotation, to_gql_span_annotation
+from phoenix.server.api.types.SpanCostDetailSummaryEntry import SpanCostDetailSummaryEntry
+from phoenix.server.api.types.SpanCostSummary import SpanCostSummary
 from phoenix.server.api.types.SpanIOValue import SpanIOValue, truncate_value
 from phoenix.trace.attributes import get_attribute_value
@@ -790,6 +794,139 @@ class Span(Node):
             )
         ]
+    @strawberry.field
+    async def cost_summary(self, info: Info[Context, None]) -> Optional[SpanCostSummary]:
+        span_cost = await info.context.data_loaders.span_cost_by_span.load(self.span_rowid)
+        if span_cost is None:
+            return None
+        return SpanCostSummary(
+            prompt=CostBreakdown(
+                tokens=span_cost.prompt_tokens,
+                cost=span_cost.prompt_cost,
+            ),
+            completion=CostBreakdown(
+                tokens=span_cost.completion_tokens,
+                cost=span_cost.completion_cost,
+            ),
+            total=CostBreakdown(
+                tokens=span_cost.total_tokens,
+                cost=span_cost.total_cost,
+            ),
+        )
+    @strawberry.field
+    async def cost_detail_summary_entries(
+        self, info: Info[Context, None]
+    ) -> list[SpanCostDetailSummaryEntry]:
+        loader = info.context.data_loaders.span_cost_detail_summary_entries_by_span
+        entries = await loader.load(self.span_rowid)
+        return [
+            SpanCostDetailSummaryEntry(
+                token_type=entry.token_type,
+                is_prompt=entry.is_prompt,
+                value=CostBreakdown(tokens=entry.value.tokens, cost=entry.value.cost),
+            )
+            for entry in entries
+        ]
+    @strawberry.field
+    async def cumulative_cost_summary(self, info: Info[Context, None]) -> Optional[SpanCostSummary]:
+        max_depth = 0
+        descendant_rowids = await info.context.data_loaders.span_descendants.load(
+            (self.span_rowid, max_depth)
+        )
+        span_costs = await info.context.data_loaders.span_cost_by_span.load_many(
+            (self.span_rowid, *descendant_rowids)
+        )
+        total_cost: Optional[float] = None
+        total_tokens: Optional[float] = None
+        prompt_cost: Optional[float] = None
+        prompt_tokens: Optional[float] = None
+        completion_cost: Optional[float] = None
+        completion_tokens: Optional[float] = None
+        for span_cost in span_costs:
+            if span_cost is None:
+                continue
+            if span_cost.total_cost is not None:
+                total_cost = (total_cost or 0) + span_cost.total_cost
+            if span_cost.total_tokens is not None:
+                total_tokens = (total_tokens or 0) + span_cost.total_tokens
+            if span_cost.prompt_cost is not None:
+                prompt_cost = (prompt_cost or 0) + span_cost.prompt_cost
+            if span_cost.prompt_tokens is not None:
+                prompt_tokens = (prompt_tokens or 0) + span_cost.prompt_tokens
+            if span_cost.completion_cost is not None:
+                completion_cost = (completion_cost or 0) + span_cost.completion_cost
+            if span_cost.completion_tokens is not None:
+                completion_tokens = (completion_tokens or 0) + span_cost.completion_tokens
+        return SpanCostSummary(
+            prompt=CostBreakdown(
+                tokens=prompt_tokens,
+                cost=prompt_cost,
+            ),
+            completion=CostBreakdown(
+                tokens=completion_tokens,
+                cost=completion_cost,
+            ),
+            total=CostBreakdown(
+                tokens=total_tokens,
+                cost=total_cost,
+            ),
+        )
+    @strawberry.field
+    async def cumulative_cost_detail_summary_entries(
+        self, info: Info[Context, None]
+    ) -> list[SpanCostDetailSummaryEntry]:
+        max_depth = 0
+        descendant_rowids = await info.context.data_loaders.span_descendants.load(
+            (self.span_rowid, max_depth)
+        )
+        entry_lists = (
+            await info.context.data_loaders.span_cost_detail_summary_entries_by_span.load_many(
+                (self.span_rowid, *descendant_rowids)
+            )
+        )
+        TokenType: TypeAlias = str
+        IsPrompt: TypeAlias = bool
+        grouped_entries: dict[
+            IsPrompt, dict[TokenType, list[dataloader_types.SpanCostDetailSummaryEntry]]
+        ] = {}
+        for entries in entry_lists:
+            for entry in entries:
+                is_prompt = entry.is_prompt
+                token_type = entry.token_type
+                if is_prompt not in grouped_entries:
+                    grouped_entries[is_prompt] = {}
+                if token_type not in grouped_entries[is_prompt]:
+                    grouped_entries[is_prompt][token_type] = []
+                grouped_entries[is_prompt][token_type].append(entry)
+        result: list[SpanCostDetailSummaryEntry] = []
+        for is_prompt in (True, False):
+            entries_by_token_type = grouped_entries[is_prompt]
+            for token_type, entries in sorted(entries_by_token_type.items()):
+                cost: Optional[float] = None
+                tokens: Optional[float] = None
+                for entry in entries:
+                    if entry.value.cost is not None:
+                        cost = (cost or 0) + entry.value.cost
+                    if entry.value.tokens is not None:
+                        tokens = (tokens or 0) + entry.value.tokens
+                result.append(
+                    SpanCostDetailSummaryEntry(
+                        token_type=token_type,
+                        is_prompt=is_prompt,
+                        value=CostBreakdown(
+                            tokens=tokens,
+                            cost=cost,
+                        ),
+                    )
+                )
+        return result
 def _hide_embedding_vectors(attributes: Mapping[str, Any]) -> Mapping[str, Any]:
     if not (

phoenix/server/api/types/SpanCostDetailSummaryEntry.py ADDED Viewed

@@ -0,0 +1,10 @@
+import strawberry
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
+@strawberry.type
+class SpanCostDetailSummaryEntry:
+    token_type: str
+    is_prompt: bool
+    value: CostBreakdown = strawberry.field(default_factory=CostBreakdown)

phoenix/server/api/types/SpanCostSummary.py ADDED Viewed

@@ -0,0 +1,10 @@
+import strawberry
+from phoenix.server.api.types.CostBreakdown import CostBreakdown
+@strawberry.type
+class SpanCostSummary:
+    prompt: CostBreakdown = strawberry.field(default_factory=CostBreakdown)
+    completion: CostBreakdown = strawberry.field(default_factory=CostBreakdown)
+    total: CostBreakdown = strawberry.field(default_factory=CostBreakdown)

phoenix/server/api/types/TokenPrice.py ADDED Viewed

@@ -0,0 +1,16 @@
+from enum import Enum
+import strawberry
+class TokenKind(Enum):
+    PROMPT = "prompt"
+    COMPLETION = "completion"
+@strawberry.type
+class TokenPrice:
+    token_type: str
+    kind: TokenKind
+    cost_per_million_tokens: float
+    cost_per_token: float

phoenix/server/api/types/TokenUsage.py CHANGED Viewed

@@ -3,9 +3,9 @@ import strawberry
 @strawberry.type
 class TokenUsage:
-    prompt: int = 0
-    completion: int = 0
+    prompt: float = 0
+    completion: float = 0
     @strawberry.field
-    async def total(self) -> int:
+    async def total(self) -> float:
         return self.prompt + self.completion

arize-phoenix 10.14.0__py3-none-any.whl → 11.0.0__py3-none-any.whl

Potentially problematic release.

arize-phoenix 10.14.0py3-none-any.whl → 11.0.0py3-none-any.whl