PyPI - datarobot-moderations - Versions diffs - 11.2.11__py3-none-any.whl → 11.2.12__py3-none-any.whl - Mend

datarobot-moderations 11.2.11py3-none-any.whl → 11.2.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (31) hide show

datarobot_dome/__init__.py +1 -1
datarobot_dome/async_http_client.py +1 -1
datarobot_dome/chat_helper.py +1 -1
datarobot_dome/constants.py +3 -2
datarobot_dome/drum_integration.py +1 -1
datarobot_dome/guard_executor.py +63 -1
datarobot_dome/guard_factory.py +1 -1
datarobot_dome/guard_helpers.py +1 -1
datarobot_dome/guards/__init__.py +1 -1
datarobot_dome/guards/base.py +1 -1
datarobot_dome/guards/guard_llm_mixin.py +1 -1
datarobot_dome/guards/model_guard.py +1 -1
datarobot_dome/guards/nemo_evaluator.py +266 -10
datarobot_dome/guards/nemo_guard.py +3 -1
datarobot_dome/guards/ootb_guard.py +1 -1
datarobot_dome/guards/validation.py +34 -1
datarobot_dome/llm.py +1 -1
datarobot_dome/metrics/__init__.py +1 -1
datarobot_dome/metrics/citation_metrics.py +1 -1
datarobot_dome/metrics/factory.py +1 -1
datarobot_dome/metrics/metric_scorer.py +1 -1
datarobot_dome/pipeline/__init__.py +1 -1
datarobot_dome/pipeline/llm_pipeline.py +1 -1
datarobot_dome/pipeline/pipeline.py +1 -1
datarobot_dome/pipeline/vdb_pipeline.py +1 -1
datarobot_dome/runtime.py +1 -1
datarobot_dome/streaming.py +1 -1
{datarobot_moderations-11.2.11.dist-info → datarobot_moderations-11.2.12.dist-info}/METADATA +2 -2
datarobot_moderations-11.2.12.dist-info/RECORD +30 -0
{datarobot_moderations-11.2.11.dist-info → datarobot_moderations-11.2.12.dist-info}/WHEEL +1 -1
datarobot_moderations-11.2.11.dist-info/RECORD +0 -30

datarobot_dome/__init__.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/async_http_client.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/chat_helper.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/constants.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.
@@ -254,8 +254,9 @@ class GuardLLMType:
     AMAZON = "amazon"
     DATAROBOT = "datarobot"
     NIM = "nim"
+    LLM_GATEWAY = "llmGateway"
-    ALL = [OPENAI, AZURE_OPENAI, GOOGLE, AMAZON, DATAROBOT, NIM]
+    ALL = [OPENAI, AZURE_OPENAI, GOOGLE, AMAZON, DATAROBOT, NIM, LLM_GATEWAY]
 class GoogleModel:

datarobot_dome/drum_integration.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guard_executor.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.
@@ -31,6 +31,7 @@ from datarobot_dome.constants import GuardStage
 from datarobot_dome.constants import GuardTimeoutAction
 from datarobot_dome.constants import GuardType
 from datarobot_dome.constants import ModerationEventTypes
+from datarobot_dome.constants import NemoEvaluatorType
 from datarobot_dome.constants import OOTBType
 from datarobot_dome.guard_helpers import calculate_agent_goal_accuracy
 from datarobot_dome.guard_helpers import calculate_agent_guideline_adherence
@@ -43,6 +44,7 @@ from datarobot_dome.guard_helpers import get_token_count
 from datarobot_dome.guard_helpers import nemo_response_stage_input_formatter
 from datarobot_dome.guard_helpers import nemo_response_stage_output_formatter
 from datarobot_dome.guards import ModelGuard
+from datarobot_dome.guards import NeMoEvaluatorGuard
 from datarobot_dome.guards import NeMoGuard
 from datarobot_dome.guards import OOTBAgentGoalAccuracyGuard
 from datarobot_dome.guards import OOTBCostMetric
@@ -88,6 +90,7 @@ class AsyncGuardExecutor:
         GuardType.MODEL: "run_model_guard",
         GuardType.OOTB: "run_ootb_guard",
         GuardType.NEMO_GUARDRAILS: "run_nemo_guard",
+        GuardType.NEMO_EVALUATOR: "run_nemo_evaluator_guard",
     }
     def __init__(self, pipeline):
@@ -680,6 +683,62 @@ class AsyncGuardExecutor:
             copy_df = self._dont_intervene(guard, copy_df, stage)
         return copy_df
+    async def run_nemo_evaluator_guard(self, guard: NeMoEvaluatorGuard, copy_df, stage):
+        if not isinstance(guard, NeMoEvaluatorGuard):
+            raise ValueError(
+                f"Guard object should be of type NeMoEvaluatorGuard, got: {type(guard)}"
+            )
+        if guard.nemo_evaluator_type != NemoEvaluatorType.LLM_JUDGE and stage == GuardStage.PROMPT:
+            raise ValueError(
+                f"NeMoEvaluatorGuard of type {guard.nemo_evaluator_type} "
+                f"can only be applied to response stage"
+            )
+        # get column names
+        prompt_column_name = self.pipeline.get_input_column(GuardStage.PROMPT)
+        response_column_name = self.pipeline.get_input_column(GuardStage.RESPONSE)
+        citation_column_names = get_citation_columns(copy_df.columns)
+        # check citation / reference context columns exist when required
+        if (
+            guard.nemo_evaluator_type
+            in [
+                NemoEvaluatorType.CONTEXT_RELEVANCE,
+                NemoEvaluatorType.RESPONSE_GROUNDEDNESS,
+                NemoEvaluatorType.FAITHFULNESS,
+            ]
+            and not citation_column_names
+        ):
+            raise ValueError(
+                f"NeMoEvaluatorGuard of type {guard.nemo_evaluator_type} is configured without "
+                f"citation columns. Input Column Names: {', '.join(copy_df.columns.to_list())}."
+            )
+        # compute score
+        scores = await asyncio.gather(
+            *(
+                guard.evaluate(
+                    prompt=row.get(prompt_column_name),
+                    response=row.get(response_column_name),
+                    retrieved_contexts=[
+                        row[column]
+                        for column in citation_column_names
+                        if row.get(column) is not None
+                    ],
+                )
+                for row in copy_df.to_dict(orient="records")
+            )
+        )
+        copy_df[guard.metric_column_name] = scores
+        # handle intervention
+        if self._should_intervene(guard):
+            copy_df, _ = self._intervene(guard, copy_df, stage, guard.metric_column_name)
+        else:
+            copy_df = self._dont_intervene(guard, copy_df, stage)
+        return copy_df
     def run_guards(self, input_df, guards, stage):
         start_time = time.time()
         df = self.loop.run_until_complete(self.async_guard_executor(input_df, guards, stage))
@@ -756,6 +815,9 @@ class AsyncGuardExecutor:
                 join_columns.add(self.pipeline.get_input_column(GuardStage.PROMPT))
             if guard.ootb_type in [OOTBType.AGENT_GOAL_ACCURACY, OOTBType.TASK_ADHERENCE]:
                 join_columns.add(AGENTIC_PIPELINE_INTERACTIONS_ATTR)
+        elif stage == GuardStage.RESPONSE and isinstance(guard, NeMoEvaluatorGuard):
+            join_columns.add(self.pipeline.get_input_column(GuardStage.PROMPT))
+            join_columns = join_columns.union(set(get_citation_columns(_input_df.columns)))
         copy_df = _input_df[list(join_columns)].copy(deep=True)
         return copy_df, join_columns

datarobot_dome/guard_factory.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guard_helpers.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/__init__.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/base.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/guard_llm_mixin.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/model_guard.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/nemo_evaluator.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.
@@ -10,8 +10,18 @@
 #  https://www.datarobot.com/wp-content/uploads/2021/07/DataRobot-Tool-and-Utility-Agreement.pdf.
 #  ---------------------------------------------------------------------------------
 from functools import cached_property
+from typing import Optional
+import requests
 from nemo_microservices import AsyncNeMoMicroservices
+from nemo_microservices.types import EvaluationConfigParam
+from nemo_microservices.types import EvaluationTargetParam
+from nemo_microservices.types import LiveEvaluation
+from nemo_microservices.types import MetricConfigParam
+from nemo_microservices.types import TaskConfigParam
+from datarobot_dome.constants import GuardLLMType
+from datarobot_dome.guard_helpers import get_datarobot_endpoint_and_token
 from .base import Guard
@@ -22,6 +32,7 @@ class NeMoEvaluatorGuard(Guard):
         self.nemo_evaluator_type = config["nemo_evaluator_type"]
         self._llm_type = config["llm_type"]
         self.llm_deployment_id = config.get("deployment_id")
+        self.llm_gateway_model_id = config.get("llm_gateway_model_id")
     @cached_property
     def _client(self) -> AsyncNeMoMicroservices:
@@ -31,43 +42,288 @@ class NeMoEvaluatorGuard(Guard):
         """
         return AsyncNeMoMicroservices(base_url="http://localhost:8080")
+    @staticmethod
+    def _get_default_model_id(deployment_id: str) -> str:
+        """Get id of first model as default from a deployment that responds to /models endpoint."""
+        datarobot_endpoint, datarobot_api_token = get_datarobot_endpoint_and_token()
+        response = requests.get(
+            f"{datarobot_endpoint}/deployments/{deployment_id}/directAccess/models",
+            headers={"Authorization": f"Bearer {datarobot_api_token}"},
+        )
+        if response.status_code != 200:
+            raise ValueError(f"Unable to query for default model for deployment {deployment_id}")
+        try:
+            return response.json()["data"][0]["id"]
+        except (requests.JSONDecodeError, KeyError, IndexError, TypeError):
+            raise ValueError(f"Unable to select default model for deployment {deployment_id}")
+    @cached_property
+    def llm_judge_api_endpoint(self) -> dict:
+        """LLM Judge API endpoint, to be passed to NeMo evaluator."""
+        datarobot_endpoint, datarobot_api_token = get_datarobot_endpoint_and_token()
+        if self.llm_type == GuardLLMType.DATAROBOT:
+            url = f"{datarobot_endpoint}/deployments/{self.llm_deployment_id}/chat/completions"
+            model_id = self._get_default_model_id(self.llm_deployment_id)
+        elif self.llm_type == GuardLLMType.LLM_GATEWAY:
+            url = f"{datarobot_endpoint}/genai/llmgw/chat/completions"
+            model_id = self.llm_gateway_model_id
+        else:
+            raise ValueError(
+                f"LLM type {self.llm_type} is not supported by NeMo Evaluator based guards."
+            )
+        return {"url": url, "api_key": datarobot_api_token, "model_id": model_id}
     def has_average_score_custom_metric(self) -> bool:
         return False
-    async def evaluate(self, prompt: str, response: str) -> float:
+    async def evaluate(
+        self,
+        *,
+        prompt: Optional[str],
+        response: Optional[str],
+        retrieved_contexts: Optional[list[str]],
+    ) -> float:
         raise NotImplementedError
+    def _extract_score(self, evaluation: LiveEvaluation) -> int | float:
+        task = evaluation.result.tasks[self.nemo_evaluator_type]
+        metric = task.metrics[self.nemo_evaluator_type]
+        score = metric.scores[self.nemo_evaluator_type]
+        return score.value
 class NeMoLLMJudgeGuard(NeMoEvaluatorGuard):
     def __init__(self, config: dict, stage=None):
         super().__init__(config, stage)
+        self.nemo_llm_judge_config = config.get("nemo_llm_judge_config", {})
+    async def evaluate(self, *, prompt: str, response: str, **kwargs) -> float:
+        system_prompt = self.nemo_llm_judge_config["system_prompt"]
+        user_prompt = self.nemo_llm_judge_config["user_prompt"]
+        score_parsing_regex = self.nemo_llm_judge_config["score_parsing_regex"]
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type="llm-judge",
+                            params={
+                                "model": {"api_endpoint": self.llm_judge_api_endpoint},
+                                "template": {
+                                    "messages": [
+                                        {"role": "system", "content": system_prompt},
+                                        {"role": "user", "content": user_prompt},
+                                    ]
+                                },
+                                "scores": {
+                                    self.nemo_evaluator_type: {
+                                        "type": "int",
+                                        "parser": {"type": "regex", "pattern": score_parsing_regex},
+                                    }
+                                },
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        target = EvaluationTargetParam(
+            type="rows", rows=[{"promptText": prompt, "responseText": response}]
+        )
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoContextRelevanceGuard(NeMoEvaluatorGuard):
-    def __init__(self, config: dict, stage=None):
-        super().__init__(config, stage)
+    async def evaluate(self, *, prompt: str, retrieved_contexts: list[str], **kwargs) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        target = EvaluationTargetParam(
+            type="rows",
+            rows=[{"user_input": prompt, "retrieved_contexts": retrieved_contexts}],
+        )
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoResponseGroundednessGuard(NeMoEvaluatorGuard):
-    def __init__(self, config: dict, stage=None):
-        super().__init__(config, stage)
+    async def evaluate(self, *, response: str, retrieved_contexts: list[str], **kwargs) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        target = EvaluationTargetParam(
+            type="rows",
+            rows=[{"response": response, "retrieved_contexts": retrieved_contexts}],
+        )
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoTopicAdherenceGuard(NeMoEvaluatorGuard):
     def __init__(self, config: dict, stage=None):
         super().__init__(config, stage)
+        self.nemo_topic_adherence_config = config["nemo_topic_adherence_config"]
+    async def evaluate(self, *, prompt: str, response: str, **kwargs) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                                "metric_mode": self.nemo_topic_adherence_config["metric_mode"],
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        target = EvaluationTargetParam(
+            type="rows",
+            rows=[
+                {
+                    "user_input": [
+                        {"content": prompt, "type": "human"},
+                        {"content": response, "type": "ai"},
+                    ],
+                    "reference_topics": self.nemo_topic_adherence_config["reference_topics"],
+                }
+            ],
+        )
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoAgentGoalAccuracyGuard(NeMoEvaluatorGuard):
-    def __init__(self, config: dict, stage=None):
-        super().__init__(config, stage)
+    async def evaluate(self, *, prompt: str, response: str, **kwargs) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                                "use_reference": False,
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        target = EvaluationTargetParam(
+            type="rows",
+            rows=[
+                {
+                    "user_input": [
+                        {"content": prompt, "type": "human"},
+                        {"content": response, "type": "ai"},
+                    ],
+                }
+            ],
+        )
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoResponseRelevancyGuard(NeMoEvaluatorGuard):
     def __init__(self, config: dict, stage=None):
         super().__init__(config, stage)
+        self.response_relevancy_config = config["nemo_response_relevancy_config"]
+    @cached_property
+    def embedding_judge_api_endpoint(self) -> dict:
+        """Embedding judge API endpoint, to be passed to NeMo evaluator."""
+        datarobot_endpoint, datarobot_api_token = get_datarobot_endpoint_and_token()
+        deployment_id = self.response_relevancy_config["embedding_deployment_id"]
+        url = f"{datarobot_endpoint}/deployments/{deployment_id}/directAccess/nim/v1/"
+        return {"url": url, "api_key": datarobot_api_token, "model_id": ""}
+    async def evaluate(
+        self, *, prompt: str, response: str, retrieved_context: Optional[list[str]]
+    ) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                                "judge_embeddings": {
+                                    "model": {"api_endpoint": self.embedding_judge_api_endpoint},
+                                },
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        row = {"user_input": prompt, "response": response}
+        if retrieved_context:
+            row["retrieved_contexts"] = retrieved_context
+        target = EvaluationTargetParam(type="rows", rows=[row])
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)
 class NeMoFaithfulnessGuard(NeMoEvaluatorGuard):
-    def __init__(self, config: dict, stage=None):
-        super().__init__(config, stage)
+    async def evaluate(self, *, prompt: str, response: str, retrieved_contexts: list[str]) -> float:
+        config = EvaluationConfigParam(
+            type="custom",
+            tasks={
+                self.nemo_evaluator_type: TaskConfigParam(
+                    type="data",
+                    metrics={
+                        self.nemo_evaluator_type: MetricConfigParam(
+                            type=self.nemo_evaluator_type,
+                            params={
+                                "judge": {"model": {"api_endpoint": self.llm_judge_api_endpoint}},
+                            },
+                        )
+                    },
+                )
+            },
+        )
+        row = {"user_input": prompt, "response": response, "retrieved_contexts": retrieved_contexts}
+        target = EvaluationTargetParam(type="rows", rows=[row])
+        evaluation = await self._client.evaluation.live(config=config, target=target)
+        return self._extract_score(evaluation)

datarobot_dome/guards/nemo_guard.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.
@@ -87,6 +87,8 @@ class NeMoGuard(Guard, GuardLLMMixin):
                 raise NotImplementedError
             elif self.llm_type == GuardLLMType.DATAROBOT:
                 raise NotImplementedError
+            elif self.llm_type == GuardLLMType.LLM_GATEWAY:
+                raise NotImplementedError
             elif self.llm_type == GuardLLMType.NIM:
                 if config.get("deployment_id") is None:
                     if self.openai_api_base is None:

datarobot_dome/guards/ootb_guard.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/guards/validation.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.
@@ -35,6 +35,7 @@ MAX_REGEX_LENGTH = 255
 MAX_URL_LENGTH = 255
 MAX_TOKEN_LENGTH = 255
 MAX_GUIDELINE_LENGTH = 4096
+MAX_REFERENCE_TOPIC_LENGTH = 4096
 cost_metric_trafaret = t.Dict(
     {
@@ -72,6 +73,30 @@ model_info_trafaret = t.Dict(
 )
+nemo_llm_judge_config_trafaret = t.Dict(
+    {
+        t.Key("system_prompt", optional=False): t.String(),
+        t.Key("user_prompt", optional=False): t.String(),
+        t.Key("score_parsing_regex", optional=False): t.String(max_length=MAX_REGEX_LENGTH),
+    },
+)
+nemo_topic_adherence_config_trafaret = t.Dict(
+    {
+        t.Key("metric_mode", optional=False): t.Enum("f1", "recall", "precision"),
+        t.Key("reference_topics", optional=False): t.List(
+            t.String(max_length=MAX_REFERENCE_TOPIC_LENGTH)
+        ),
+    },
+)
+nemo_response_relevancy_config_trafaret = t.Dict(
+    {
+        t.Key("embedding_deployment_id", optional=False): t.String(max_length=OBJECT_ID_LENGTH),
+    },
+)
 model_guard_intervention_trafaret = t.Dict(
     {
         t.Key("comparand", to_name="comparand", optional=False): t.Or(
@@ -135,7 +160,15 @@ guard_trafaret = t.Dict(
         t.Key("deployment_id", to_name="deployment_id", optional=True): t.Or(
             t.String(max_length=OBJECT_ID_LENGTH), t.Null
         ),
+        t.Key("llm_gateway_model_id", to_name="llm_gateway_model_id", optional=True): t.Or(
+            t.String, t.Null
+        ),
         t.Key("model_info", to_name="model_info", optional=True): model_info_trafaret,
+        t.Key("nemo_llm_judge_config", optional=True): nemo_llm_judge_config_trafaret,
+        t.Key("nemo_topic_adherence_config", optional=True): nemo_topic_adherence_config_trafaret,
+        t.Key(
+            "nemo_response_relevancy_config", optional=True
+        ): nemo_response_relevancy_config_trafaret,
         t.Key("intervention", to_name="intervention", optional=True): t.Or(
             guard_intervention_trafaret, t.Null
         ),

datarobot_dome/llm.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/metrics/__init__.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/metrics/citation_metrics.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/metrics/factory.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/metrics/metric_scorer.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/pipeline/__init__.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/pipeline/llm_pipeline.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/pipeline/pipeline.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/pipeline/vdb_pipeline.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/runtime.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

datarobot_dome/streaming.py CHANGED Viewed

@@ -1,6 +1,6 @@
 #  ---------------------------------------------------------------------------------
 #  Copyright (c) 2026 DataRobot, Inc. and its affiliates. All rights reserved.
-#  Last updated 2025.
+#  Last updated 2026.
 #
 #  DataRobot, Inc. Confidential.
 #  This is proprietary source code of DataRobot, Inc. and its affiliates.

{datarobot_moderations-11.2.11.dist-info → datarobot_moderations-11.2.12.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: datarobot-moderations
-Version: 11.2.11
+Version: 11.2.12
 Summary: DataRobot Monitoring and Moderation framework
 License: DataRobot Tool and Utility Agreement
 Author: DataRobot
@@ -25,7 +25,7 @@ Requires-Dist: llama-index-llms-bedrock-converse (>=0.1.6)
 Requires-Dist: llama-index-llms-langchain (>=0.1.3)
 Requires-Dist: llama-index-llms-vertex (>=0.1.5)
 Requires-Dist: nemo-microservices (>=1.5.0,<2.0.0)
-Requires-Dist: nemoguardrails (>=0.9.0)
+Requires-Dist: nemoguardrails (>=0.9.0,<=0.17.0)
 Requires-Dist: nest-asyncio (>=1.6.0)
 Requires-Dist: numpy (>=1.25.0)
 Requires-Dist: openai (>=1.14.3)

datarobot_moderations-11.2.12.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,30 @@
+datarobot_dome/__init__.py,sha256=gpWJizDEzOPlZO0E2nRbRBJagAMTBVTtvMqfZnhs7LM,583
+datarobot_dome/async_http_client.py,sha256=7ljpkXtOBcgfI3HGeHVdDJBw9dOBiQ7f_jIXbP8axK8,9863
+datarobot_dome/chat_helper.py,sha256=0oEHbw4SI4vSsIWt2_r4zLufdL5gZhGPWo3AbO1XsOA,9671
+datarobot_dome/constants.py,sha256=Djtqloy9yGQKWqWDyboEOCb8iuYFJeMVO048f2W3AmM,11448
+datarobot_dome/drum_integration.py,sha256=xs_F5XGCNN1g8EUR9-UQJGbmRZwOav6tyoBXonjwcog,46480
+datarobot_dome/guard_executor.py,sha256=3ShUWBispcn6Z60EddSv1SP8H5IenDbm3JKQnl6tBq8,40315
+datarobot_dome/guard_factory.py,sha256=s74_N0pPIP03u79NvPoYtBRilUxawuFL3a8djM7N4ic,6081
+datarobot_dome/guard_helpers.py,sha256=Frhuuq-yCb5xpSWnz-D7r3f5wrImmFJDuribqBGSx54,17581
+datarobot_dome/guards/__init__.py,sha256=oV8EBIYzNuZjiXSL2pfk-JCKQKKr0UB1_yzN_6q-cFk,1287
+datarobot_dome/guards/base.py,sha256=DEG8knC0Q0fHJ0j3tGlogeMam2YyFMXDvojoMkb-TMU,10646
+datarobot_dome/guards/guard_llm_mixin.py,sha256=dy1IuSqEMD41pi8Ed20-lUUrEcLCY7GUHBypIAUJIeg,12041
+datarobot_dome/guards/model_guard.py,sha256=xaaZCAPH6r5UgfJ_2cElzBXTHsVWgH6IvTM7sfzBz18,2970
+datarobot_dome/guards/nemo_evaluator.py,sha256=GSp50N8uahmoHii4f3mwNHW8BqnsM1Lamek-ZjS-KXc,13996
+datarobot_dome/guards/nemo_guard.py,sha256=4qGjV3XzHYfh4tvQvNc99ndOenaOZRGGciUkslApKPo,7216
+datarobot_dome/guards/ootb_guard.py,sha256=5LUFZf179_5nPrrt6uqD8BThBwipY4Ume8alI28yMFA,8469
+datarobot_dome/guards/validation.py,sha256=vm21fkRvts9_9j7iJlFlQNnFzynymIuNsoSzqYJErlw,9554
+datarobot_dome/llm.py,sha256=Q-gC9vC8eWu5uAGNhdE3jfGz643VGRuLA-Pz5kQwago,5719
+datarobot_dome/metrics/__init__.py,sha256=gpWJizDEzOPlZO0E2nRbRBJagAMTBVTtvMqfZnhs7LM,583
+datarobot_dome/metrics/citation_metrics.py,sha256=nfL7fQB5E2GaQPuZ9gqHoqmyIHuM-UEYWvDloQAdwvY,4652
+datarobot_dome/metrics/factory.py,sha256=TzEL-a-o_58_2so-N-0RPw8pMXnaW2QKu-y0aXF3rbw,2153
+datarobot_dome/metrics/metric_scorer.py,sha256=JJp8WR6sKTXuCiLs96QDTIzY7QgCs8QK2Q_N5uh1HbE,2540
+datarobot_dome/pipeline/__init__.py,sha256=gpWJizDEzOPlZO0E2nRbRBJagAMTBVTtvMqfZnhs7LM,583
+datarobot_dome/pipeline/llm_pipeline.py,sha256=Ll51TgGbz_ooX4FJ2oRir5Y4ITmcf9Nz6nhyzZ_Ko7I,20981
+datarobot_dome/pipeline/pipeline.py,sha256=DMtqYZMZeUhhdIUEBY59D12LWIsk_Jc89_IjvHsZAn0,19486
+datarobot_dome/pipeline/vdb_pipeline.py,sha256=yrTn7M4IT8Q_e4Cv61haFSUx2_CAs25dftgHywfWGCw,9835
+datarobot_dome/runtime.py,sha256=J3undH6VM5Pao2PZqjfRtVGeVx0nkqw80hYpRRZUTkY,1468
+datarobot_dome/streaming.py,sha256=ov-IubMA1RfY38jg1PNG-tcuViHPgX8t9VmKz6d9lOs,18248
+datarobot_moderations-11.2.12.dist-info/METADATA,sha256=vdqm7PmRvWIAP7ZclLGwDpefb7tCmieW6hvYgrIf6T0,4864
+datarobot_moderations-11.2.12.dist-info/WHEEL,sha256=kJCRJT_g0adfAJzTx2GUMmS80rTJIVHRCfG0DQgLq3o,88
+datarobot_moderations-11.2.12.dist-info/RECORD,,

{datarobot_moderations-11.2.11.dist-info → datarobot_moderations-11.2.12.dist-info}/WHEEL RENAMED Viewed

@@ -1,4 +1,4 @@
 Wheel-Version: 1.0
-Generator: poetry-core 2.3.0
+Generator: poetry-core 2.3.1
 Root-Is-Purelib: true
 Tag: py3-none-any

datarobot_moderations-11.2.11.dist-info/RECORD DELETED Viewed

@@ -1,30 +0,0 @@
-datarobot_dome/__init__.py,sha256=S5kGePu3juoQk4ztKosOjtJyOwRqzN5quavyuO79Vvg,583
-datarobot_dome/async_http_client.py,sha256=g6smItjY7YX7v8WwjOGJrlEpYmv596W6QUXAQ5SlUBQ,9863
-datarobot_dome/chat_helper.py,sha256=maSxpTESdKCeo8jtLID6zquICxymzEOnrpuvqsfx9Dk,9671
-datarobot_dome/constants.py,sha256=Mt_IFjIyMRmp0huRb8AN9MYqGf9OSgWB8WWQ7iqcx9I,11404
-datarobot_dome/drum_integration.py,sha256=tg_rpwlClc0Dt1_X-bHG3qEKAwbaPJu_qb4VyA1lUFg,46480
-datarobot_dome/guard_executor.py,sha256=z62P4HS0PGiKX1AAKxxTBuWMiNjdFgsqJKlpnvWcPSI,37607
-datarobot_dome/guard_factory.py,sha256=g92bQ1zqlDJ5lpjDc1s60Is5RlFPbs0HkExgPgoIbg8,6081
-datarobot_dome/guard_helpers.py,sha256=B5v0nP5wZk9am_-rDRWuuk6jYuaYVh4t9ClHQM-O7c4,17581
-datarobot_dome/guards/__init__.py,sha256=sL2DO-IvQkS3pgpurfmbQf_Ot-5yyyTFp0RiH0pNjOA,1287
-datarobot_dome/guards/base.py,sha256=0eIr3uAeIIQ8-YnBVM1z452HOyE7wyeqIuNgeYVhVN0,10646
-datarobot_dome/guards/guard_llm_mixin.py,sha256=QnrQjyBrgKlDZ4yPy10kdDzleuQ4h54aGld8EykCweQ,12041
-datarobot_dome/guards/model_guard.py,sha256=2bTQYFNuLYT169ex17cclyznirHtbqtSpOSnkP_Sh5E,2970
-datarobot_dome/guards/nemo_evaluator.py,sha256=85-_V4aTLA-Ry8_rWjKI9IMlC9Nparwm_KvUy08cwVw,2497
-datarobot_dome/guards/nemo_guard.py,sha256=E50OS6tdw5PnUX_DY6U-zEkUuP6T-63YTVYOgdvvK2Y,7114
-datarobot_dome/guards/ootb_guard.py,sha256=c7SKb7zy9cMBRiP9eSrZJsAgQYFyMygjEBhdn1YZfT8,8469
-datarobot_dome/guards/validation.py,sha256=39W4wM7g6lAuVnM078gRvXFx_sYe9-YioN8T600EXv0,8367
-datarobot_dome/llm.py,sha256=e6dCK-apbr3l4Njztgm8my8vorFvvw1L7MbaHUiCOZ0,5719
-datarobot_dome/metrics/__init__.py,sha256=S5kGePu3juoQk4ztKosOjtJyOwRqzN5quavyuO79Vvg,583
-datarobot_dome/metrics/citation_metrics.py,sha256=q-uSJKNQjLizdpiju7e1qgVPQVu3SJHDm4Abc8e4m9k,4652
-datarobot_dome/metrics/factory.py,sha256=C7M_hhN6z-_Q8LWfuGhuU_gUc87TJHmvYoY6wFC6O3w,2153
-datarobot_dome/metrics/metric_scorer.py,sha256=pFWkOv1-O6zdCQOdFJwIYTvJkJOzJ2LqKiizVI1cKHA,2540
-datarobot_dome/pipeline/__init__.py,sha256=S5kGePu3juoQk4ztKosOjtJyOwRqzN5quavyuO79Vvg,583
-datarobot_dome/pipeline/llm_pipeline.py,sha256=DzSNxNH8uu46IX-cCYMhVck6yWdCBqGbr9AJbI6tSUs,20981
-datarobot_dome/pipeline/pipeline.py,sha256=TUzTux9BRQnUhiHr0yhB8nm4CsOoPNTDALZcAo8KmVE,19486
-datarobot_dome/pipeline/vdb_pipeline.py,sha256=z72xMm5gVfAYJ3vqWEy190AORrXFsJNcbrZ3y_Biod4,9835
-datarobot_dome/runtime.py,sha256=4G23IWzu6QSHEpy3INlb3s9mHNxsZlSalOHV4gN6L18,1468
-datarobot_dome/streaming.py,sha256=NRykFbv7gJQ02brZ9u5rwTTKMq6REibcLtgTw-18294,18248
-datarobot_moderations-11.2.11.dist-info/METADATA,sha256=Erh64WdPsSUZxRyqnnlEyKdviIAXfLBi2d_MZoYs9XE,4855
-datarobot_moderations-11.2.11.dist-info/WHEEL,sha256=3ny-bZhpXrU6vSQ1UPG34FoxZBp3lVcvK0LkgUz6VLk,88
-datarobot_moderations-11.2.11.dist-info/RECORD,,

datarobot-moderations 11.2.11__py3-none-any.whl → 11.2.12__py3-none-any.whl

datarobot-moderations 11.2.11py3-none-any.whl → 11.2.12py3-none-any.whl