PyPI - ibm-watsonx-gov - Versions diffs - 1.3.3__cp313-cp313-macosx_11_0_arm64.whl - Mend

ibm-watsonx-gov 1.3.3__cp313-cp313-macosx_11_0_arm64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (353) hide show

ibm_watsonx_gov/entities/prompt_setup.py ADDED Viewed

@@ -0,0 +1,40 @@
+# ----------------------------------------------------------------------------------------------------
+# IBM Confidential
+# OCO Source Materials
+# 5900-A3Q, 5737-H76
+# Copyright IBM Corp. 2025
+# The source code for this program is not published or other-wise divested of its trade
+# secrets, irrespective of what has been deposited with the U.S.Copyright Office.
+# ----------------------------------------------------------------------------------------------------
+from pydantic import (BaseModel, ConfigDict, Field, ValidationError,
+                      model_validator)
+from typing_extensions import Annotated, Self
+from ibm_watsonx_gov.entities.enums import InputDataType, TaskType
+class PromptSetup(BaseModel):
+    model_config = ConfigDict(
+        arbitrary_types_allowed=True)
+    task_type: Annotated[TaskType, Field(description="Prompt task type", examples=[
+                                         TaskType.RAG, TaskType.CLASSIFICATION])]
+    question_field: Annotated[str | None, Field(
+        description="Question column name from the input", examples=["question"])] = None
+    context_fields: Annotated[list[str] | None, Field(
+        description="List of context column names from the input", examples=[["context1", "context2"]])] = None
+    prediction_field: Annotated[str | None, Field(
+        description="Prediction field name from the input", examples=["generated_text"], default="generated_text"
+    )]
+    label_column: Annotated[str, Field(
+        description="reference output column name", examples=["answer", "ground_truth"])]
+    input_data_type: Annotated[InputDataType, Field(
+        default=InputDataType.TEXT, description="Prompt input data type", examples=[InputDataType.TEXT, InputDataType.STRUCTURED])]
+    @model_validator(mode="after")
+    def require_context_and_question_columns_for_rag(self) -> Self:
+        if self.task_type == TaskType.RAG and (self.question_field is None or self.context_fields is None):
+            raise ValidationError(
+                "question_field and context_fields are required for RAG task type")
+        return self

ibm_watsonx_gov/entities/state.py ADDED Viewed

@@ -0,0 +1,22 @@
+# ----------------------------------------------------------------------------------------------------
+# IBM Confidential
+# Licensed Materials - Property of IBM
+# 5737-H76, 5900-A3Q
+# © Copyright IBM Corp. 2025  All Rights Reserved.
+# US Government Users Restricted Rights - Use, duplication or disclosure restricted by
+# GSA ADPSchedule Contract with IBM Corp.
+# ----------------------------------------------------------------------------------------------------
+from typing import Optional
+from pydantic import BaseModel
+class EvaluationState(BaseModel):
+    input_text: str
+    context: Optional[list[str]] = []
+    generated_text: Optional[str] = None
+    ground_truth: Optional[str] = None
+    record_id: Optional[str] = None
+    record_timestamp: Optional[str] = None
+    message_id: Optional[str] = None

ibm_watsonx_gov/entities/utils.py ADDED Viewed

@@ -0,0 +1,99 @@
+# ----------------------------------------------------------------------------------------------------
+# IBM Confidential
+# Licensed Materials - Property of IBM
+# 5737-H76, 5900-A3Q
+# © Copyright IBM Corp. 2025  All Rights Reserved.
+# US Government Users Restricted Rights - Use, duplication or disclosure restricted by
+# GSA ADPSchedule Contract with IBM Corp.
+# ----------------------------------------------------------------------------------------------------
+from typing import Dict, Optional
+from ibm_watsonx_gov.entities.enums import EvaluatorFields
+from ibm_watsonx_gov.entities.metric import GenAIMetric
+from ibm_watsonx_gov.metrics import (CostMetric, DurationMetric,
+                                     InputTokenCountMetric,
+                                     OutputTokenCountMetric, StatusMetric)
+from ibm_watsonx_gov.metrics.utils import TARGETED_USAGE_TRACE_NAMES
+def build_configuration_from_metric_mappings(metric: GenAIMetric, target_component: Optional[str] = None) -> Dict[str, object]:
+    """
+    Build a configuration dict from a list of GenAIMetric instances by
+    reading their mapping items.
+    """
+    kwargs: Dict[str, object] = {}
+    if not getattr(metric, "mapping", None):
+        # If no mapping_details provided, use the default values
+        # When calculating metrics from spans, details are provided under below naming convention
+        if isinstance(metric, CostMetric):
+            # Regex patterns to match fields like: '<span_name>->...->model_usage_details'
+            kwargs[EvaluatorFields.MODEL_USAGE_DETAIL_FIELDS.value] = [
+                r"^" + span_name + r"->.*->model_usage_details$" for span_name in TARGETED_USAGE_TRACE_NAMES
+            ]
+        # Regex patterns to match fields like: '<span_name>->...->prompt_tokens_count'
+        elif isinstance(metric, InputTokenCountMetric):
+            kwargs[EvaluatorFields.INPUT_TOKEN_COUNT_FIELDS.value] = [
+                r"^" + span_name + r"->.*->prompt_tokens_count$" for span_name in TARGETED_USAGE_TRACE_NAMES
+            ]
+        # Regex patterns to match fields like: '<span_name>->...->completion_tokens_count'
+        elif isinstance(metric, OutputTokenCountMetric):
+            kwargs[EvaluatorFields.OUTPUT_TOKEN_COUNT_FIELDS.value] = [
+                r"^" + span_name + r"->.*->completion_tokens_count$" for span_name in TARGETED_USAGE_TRACE_NAMES
+            ]
+        elif isinstance(metric, DurationMetric):
+            if target_component is None:
+                # Message level, assuming root span is `LangGraph.workflow`
+                kwargs[EvaluatorFields.START_TIME_FIELD.value] = "LangGraph.workflow->start_time"
+                kwargs[EvaluatorFields.END_TIME_FIELD.value] = "LangGraph.workflow->end_time"
+            else:  # Node level
+                kwargs[EvaluatorFields.START_TIME_FIELD.value] = f"{target_component}.task->start_time"
+                kwargs[EvaluatorFields.END_TIME_FIELD.value] = f"{target_component}.task->end_time"
+        elif isinstance(metric, StatusMetric):
+            kwargs[EvaluatorFields.STATUS_FIELD.value] = "status"
+        # preserve original behavior: skip the whole process when mapping is missing
+        return kwargs
+    for item in metric.mapping.items:
+        value = f"{item.span_name}->{item.attribute_name}->{item.json_path}"
+        t = item.type_
+        if t == "output":
+            kwargs.setdefault(
+                EvaluatorFields.OUTPUT_FIELDS.value, []).append(value)
+        elif t == "context":
+            kwargs.setdefault(
+                EvaluatorFields.CONTEXT_FIELDS.value, []).append(value)
+        elif t == "input":
+            kwargs.setdefault(
+                EvaluatorFields.INPUT_FIELDS.value, []).append(value)
+        elif t == "reference":
+            kwargs.setdefault(
+                EvaluatorFields.REFERENCE_FIELDS.value, []).append(value)
+        elif t == "start_time":
+            kwargs[EvaluatorFields.START_TIME_FIELD.value] = value
+        elif t == "end_time":
+            kwargs[EvaluatorFields.END_TIME_FIELD.value] = value
+        elif t == "input_token_count":
+            kwargs.setdefault(
+                EvaluatorFields.INPUT_TOKEN_COUNT_FIELDS.value, []).append(value)
+        elif t == "output_token_count":
+            kwargs.setdefault(
+                EvaluatorFields.OUTPUT_TOKEN_COUNT_FIELDS.value, []).append(value)
+        elif t == "model_usage_details":
+            kwargs.setdefault(
+                EvaluatorFields.MODEL_USAGE_DETAIL_FIELDS.value, []).append(value)
+        elif t == "status":
+            kwargs[EvaluatorFields.STATUS_FIELD.value] = value
+        elif t == "user_id":
+            kwargs[EvaluatorFields.USER_ID_FIELD.value] = value
+        elif t == "tool_call":
+            kwargs[EvaluatorFields.TOOL_CALLS_FIELD.value] = value
+        elif t == "available_tools":
+            kwargs[EvaluatorFields.AVAILABLE_TOOLS_FIELD.value] = value
+        # add any other mapping types here if needed
+    return kwargs

ibm_watsonx_gov/evaluators/__init__.py ADDED Viewed

@@ -0,0 +1,26 @@
+# ----------------------------------------------------------------------------------------------------
+# IBM Confidential
+# Licensed Materials - Property of IBM
+# 5737-H76, 5900-A3Q
+# © Copyright IBM Corp. 2025  All Rights Reserved.
+# US Government Users Restricted Rights - Use, duplication or disclosure restricted by
+# GSA ADPSchedule Contract with IBM Corp.
+# ----------------------------------------------------------------------------------------------------
+try:
+    from .agentic_evaluator import AgenticEvaluator
+except Exception:
+    # Ignore any exception to support extra requires install when MetricsEvaluator or ModelRiskEvaluator is used.
+    AgenticEvaluator = None
+try:
+    from .metrics_evaluator import MetricsEvaluator
+except Exception:
+    # Ignore any exception to support extra requires install when ModelRiskEvaluator is used.
+    MetricsEvaluator = None
+try:
+    from .model_risk_evaluator import ModelRiskEvaluator
+except Exception:
+    # Ignore any exception to support extra requires install when MetricsEvaluator or AgenticEvaluator is used.
+    ModelRiskEvaluator = None