PyPI - deepeval - Versions diffs - 3.7.6__py3-none-any.whl → 3.7.8__py3-none-any.whl - Mend

deepeval 3.7.6py3-none-any.whl → 3.7.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

deepeval/_version.py +1 -1
deepeval/cli/main.py +2022 -759
deepeval/cli/utils.py +208 -36
deepeval/config/dotenv_handler.py +19 -0
deepeval/config/settings.py +658 -262
deepeval/config/utils.py +9 -1
deepeval/dataset/test_run_tracer.py +4 -6
deepeval/evaluate/execute.py +153 -94
deepeval/integrations/pydantic_ai/instrumentator.py +4 -2
deepeval/integrations/pydantic_ai/otel.py +5 -1
deepeval/key_handler.py +121 -51
deepeval/metrics/base_metric.py +9 -3
deepeval/metrics/g_eval/g_eval.py +6 -1
deepeval/metrics/indicator.py +8 -4
deepeval/metrics/mcp/mcp_task_completion.py +15 -16
deepeval/metrics/mcp/multi_turn_mcp_use_metric.py +15 -15
deepeval/metrics/mcp/schema.py +4 -0
deepeval/metrics/mcp/template.py +8 -1
deepeval/metrics/prompt_alignment/prompt_alignment.py +6 -3
deepeval/metrics/tool_use/schema.py +4 -0
deepeval/metrics/tool_use/template.py +16 -2
deepeval/metrics/tool_use/tool_use.py +30 -28
deepeval/metrics/topic_adherence/schema.py +4 -0
deepeval/metrics/topic_adherence/template.py +8 -1
deepeval/metrics/topic_adherence/topic_adherence.py +15 -14
deepeval/metrics/turn_contextual_precision/template.py +8 -1
deepeval/metrics/turn_contextual_precision/turn_contextual_precision.py +44 -86
deepeval/metrics/turn_contextual_recall/template.py +8 -1
deepeval/metrics/turn_contextual_recall/turn_contextual_recall.py +44 -82
deepeval/metrics/turn_contextual_relevancy/template.py +8 -1
deepeval/metrics/turn_contextual_relevancy/turn_contextual_relevancy.py +48 -92
deepeval/metrics/turn_faithfulness/template.py +8 -1
deepeval/metrics/turn_faithfulness/turn_faithfulness.py +76 -130
deepeval/metrics/utils.py +16 -1
deepeval/models/__init__.py +2 -0
deepeval/models/llms/__init__.py +2 -0
deepeval/models/llms/amazon_bedrock_model.py +5 -4
deepeval/models/llms/anthropic_model.py +4 -3
deepeval/models/llms/azure_model.py +4 -3
deepeval/models/llms/deepseek_model.py +5 -8
deepeval/models/llms/grok_model.py +5 -8
deepeval/models/llms/kimi_model.py +5 -8
deepeval/models/llms/litellm_model.py +2 -0
deepeval/models/llms/local_model.py +1 -1
deepeval/models/llms/openai_model.py +4 -3
deepeval/models/retry_policy.py +10 -5
deepeval/models/utils.py +1 -5
deepeval/simulator/conversation_simulator.py +6 -2
deepeval/simulator/template.py +3 -1
deepeval/synthesizer/synthesizer.py +19 -17
deepeval/test_run/test_run.py +6 -1
deepeval/utils.py +26 -0
{deepeval-3.7.6.dist-info → deepeval-3.7.8.dist-info}/METADATA +3 -3
{deepeval-3.7.6.dist-info → deepeval-3.7.8.dist-info}/RECORD +57 -56
{deepeval-3.7.6.dist-info → deepeval-3.7.8.dist-info}/LICENSE.md +0 -0
{deepeval-3.7.6.dist-info → deepeval-3.7.8.dist-info}/WHEEL +0 -0
{deepeval-3.7.6.dist-info → deepeval-3.7.8.dist-info}/entry_points.txt +0 -0

deepeval/cli/utils.py CHANGED Viewed

@@ -1,18 +1,30 @@
 from __future__ import annotations
+import json
 import os
-import webbrowser
 import pyfiglet
+import typer
+import webbrowser
+from pydantic import ValidationError
+from pydantic.fields import FieldInfo
 from enum import Enum
 from pathlib import Path
 from rich import print
-from typing import Optional, Dict, Iterable, List, Tuple, Union
+from typing import (
+    Any,
+    Dict,
+    Iterable,
+    Tuple,
+    Optional,
+    get_args,
+    get_origin,
+    Union,
+)
 from opentelemetry.trace import Span
+from deepeval.config.settings import Settings, get_settings
 from deepeval.key_handler import (
     KEY_FILE_HANDLER,
-    KeyValues,
     ModelKeyValues,
     EmbeddingKeyValues,
 )
@@ -26,24 +38,21 @@ from deepeval.cli.dotenv_handler import DotenvHandler
 StrOrEnum = Union[str, "Enum"]
 PROD = "https://app.confident-ai.com"
 # List all mutually exclusive USE_* keys
-USE_MODEL_KEYS: List[ModelKeyValues | EmbeddingKeyValues] = [
-    ModelKeyValues.USE_OPENAI_MODEL,
-    ModelKeyValues.USE_AZURE_OPENAI,
-    ModelKeyValues.USE_LOCAL_MODEL,
-    ModelKeyValues.USE_GROK_MODEL,
-    ModelKeyValues.USE_MOONSHOT_MODEL,
-    ModelKeyValues.USE_DEEPSEEK_MODEL,
-    ModelKeyValues.USE_GEMINI_MODEL,
-    ModelKeyValues.USE_LITELLM,
-    EmbeddingKeyValues.USE_AZURE_OPENAI_EMBEDDING,
-    EmbeddingKeyValues.USE_LOCAL_EMBEDDINGS,
-    # MAINTENANCE: add more if new USE_* keys appear
+USE_LLM_KEYS = [
+    key
+    for key in Settings.model_fields
+    if key.startswith("USE_") and key in ModelKeyValues.__members__
+]
+USE_EMBED_KEYS = [
+    key
+    for key in Settings.model_fields
+    if key.startswith("USE_") and key in EmbeddingKeyValues.__members__
 ]
 def render_login_message():
     print(
-        f"🥳 Welcome to [rgb(106,0,255)]Confident AI[/rgb(106,0,255)], the DeepEval cloud platform 🏡❤️"
+        "🥳 Welcome to [rgb(106,0,255)]Confident AI[/rgb(106,0,255)], the DeepEval cloud platform 🏡❤️"
     )
     print("")
     print(pyfiglet.Figlet(font="big_money-ne").renderText("DeepEval Cloud"))
@@ -72,7 +81,7 @@ def upload_and_open_link(_span: Span):
                 else:
                     print("❌ API Key cannot be empty. Please try again.\n")
-        print(f"📤 Uploading test run to Confident AI...")
+        print("📤 Uploading test run to Confident AI...")
         global_test_run_manager.post_test_run(last_test_run_data)
     else:
         print(
@@ -91,7 +100,7 @@ def clear_embedding_model_keys():
 def _to_str_key(k: StrOrEnum) -> str:
-    return k.value if hasattr(k, "value") else str(k)
+    return k.name if hasattr(k, "name") else str(k)
 def _normalize_kv(updates: Dict[StrOrEnum, str]) -> Dict[str, str]:
@@ -102,9 +111,14 @@ def _normalize_keys(keys: Iterable[StrOrEnum]) -> list[str]:
     return [_to_str_key(k) for k in keys]
+def _normalize_setting_key(raw_key: str) -> str:
+    """Normalize CLI keys like 'log-level' / 'LOG_LEVEL' to model field names."""
+    return raw_key.strip().lower().replace("-", "_")
 def _parse_save_option(
-    save_opt: str | None, default_path: str = ".env.local"
-) -> Tuple[bool, str | None]:
+    save_opt: Optional[str] = None, default_path: str = ".env.local"
+) -> Tuple[bool, Optional[str]]:
     if not save_opt:
         return False, None
     kind, *rest = save_opt.split(":", 1)
@@ -133,8 +147,8 @@ def resolve_save_target(save_opt: Optional[str]) -> Optional[str]:
 def save_environ_to_store(
-    save_opt: str | None, updates: Dict[StrOrEnum, str]
-) -> Tuple[bool, str | None]:
+    updates: Dict[StrOrEnum, str], save_opt: Optional[str] = None
+) -> Tuple[bool, Optional[str]]:
     """
     Save 'updates' into the selected store (currently only dotenv). Idempotent upsert.
     Returns (handled, path).
@@ -148,8 +162,8 @@ def save_environ_to_store(
 def unset_environ_in_store(
-    save_opt: str | None, keys: Iterable[StrOrEnum]
-) -> Tuple[bool, str | None]:
+    keys: Iterable[StrOrEnum], save_opt: Optional[str] = None
+) -> Tuple[bool, Optional[str]]:
     """
     Remove keys from the selected store (currently only dotenv).
     Returns (handled, path).
@@ -163,19 +177,177 @@ def unset_environ_in_store(
     return True, path
-def switch_model_provider(target: ModelKeyValues, save: str = None) -> None:
+def _as_legacy_use_key(
+    k: str,
+) -> Union[ModelKeyValues, EmbeddingKeyValues, None]:
+    if k in ModelKeyValues.__members__:
+        return ModelKeyValues[k]
+    if k in EmbeddingKeyValues.__members__:
+        return EmbeddingKeyValues[k]
+    return None
+def switch_model_provider(
+    target: Union[ModelKeyValues, EmbeddingKeyValues],
+    save: Optional[str] = None,
+) -> Tuple[bool, Optional[str]]:
     """
-    Ensure exactly one USE_* model flag is set to "YES" and the rest to "NO",
-    both in the .deepeval json store and in a dotenv file (if save is provided).
+    Ensure exactly one USE_* flag is enabled.
+    We *unset* all other USE_* keys (instead of writing explicit "NO") to:
+      - keep dotenv clean
+      - preserve Optional[bool] semantics (unset vs explicit false)
     """
-    if target not in USE_MODEL_KEYS:
+    keys_to_clear = (
+        USE_LLM_KEYS if isinstance(target, ModelKeyValues) else USE_EMBED_KEYS
+    )
+    target_key = target.name  # or _to_str_key(target)
+    if target_key not in keys_to_clear:
         raise ValueError(f"{target} is not a recognized USE_* model key")
-    for key in USE_MODEL_KEYS:
-        value = "YES" if key == target else "NO"
-        KEY_FILE_HANDLER.write_key(key, value)
+    # Clear legacy JSON store entries
+    for k in keys_to_clear:
+        legacy = _as_legacy_use_key(k)
+        if legacy is not None:
+            KEY_FILE_HANDLER.remove_key(legacy)
+    KEY_FILE_HANDLER.write_key(target, "YES")
+    if not save:
+        return True, None
+    handled, path = unset_environ_in_store(keys_to_clear, save)
+    if not handled:
+        return False, None
+    return save_environ_to_store({target: "true"}, save)
+def coerce_blank_to_none(value: Optional[str]) -> Optional[str]:
+    """Return None if value is None/blank/whitespace; otherwise return stripped string."""
+    if value is None:
+        return None
+    value = value.strip()
+    return value or None
+def load_service_account_key_file(path: Path) -> str:
+    try:
+        raw = path.read_text(encoding="utf-8").strip()
+    except OSError as e:
+        raise typer.BadParameter(
+            f"Could not read service account file: {path}",
+            param_hint="--service-account-file",
+        ) from e
+    if not raw:
+        raise typer.BadParameter(
+            f"Service account file is empty: {path}",
+            param_hint="--service-account-file",
+        )
+    # Validate it's JSON and normalize to a single-line string for dotenv.
+    try:
+        obj = json.loads(raw)
+    except json.JSONDecodeError as e:
+        raise typer.BadParameter(
+            f"Service account file does not contain valid JSON: {path}",
+            param_hint="--service-account-file",
+        ) from e
+    return json.dumps(obj, separators=(",", ":"))
-        if save:
-            handled, path = save_environ_to_store(save, {key: value})
-            if not handled:
-                print("Unsupported --save option. Use --save=dotenv[:path].")
+def unwrap_optional(annotation: Any) -> Any:
+    """
+    If `annotation` is Optional[T] (i.e. Union[T, None]), return T.
+    Otherwise return `annotation` unchanged.
+    Note: If it's a Union with multiple non-None members, we leave it unchanged.
+    """
+    origin = get_origin(annotation)
+    if origin is Union:
+        non_none = [a for a in get_args(annotation) if a is not type(None)]
+        if len(non_none) == 1:
+            return non_none[0]
+    return annotation
+def looks_like_json_container_literal(raw_value: str) -> bool:
+    setting = raw_value.strip()
+    return (setting.startswith("{") and setting.endswith("}")) or (
+        setting.startswith("[") and setting.endswith("]")
+    )
+def should_parse_json_for_field(field_info: FieldInfo) -> bool:
+    annotation = unwrap_optional(field_info.annotation)
+    origin = get_origin(annotation) or annotation
+    return origin in (list, dict, tuple, set)
+def maybe_parse_json_literal(raw_value: str, field_info) -> object:
+    if not isinstance(raw_value, str):
+        return raw_value
+    if not looks_like_json_container_literal(raw_value):
+        return raw_value
+    if not should_parse_json_for_field(field_info):
+        return raw_value
+    try:
+        return json.loads(raw_value)
+    except Exception as e:
+        raise typer.BadParameter(f"Invalid JSON for {field_info}: {e}") from e
+def resolve_field_names(settings, query: str) -> list[str]:
+    """Return matching Settings fields for a case-insensitive partial query."""
+    fields = type(settings).model_fields
+    query = _normalize_setting_key(query)
+    # exact match (case-insensitive) first
+    exact = [
+        name for name in fields.keys() if _normalize_setting_key(name) == query
+    ]
+    if exact:
+        return exact
+    # substring matches
+    return [
+        name for name in fields.keys() if query in _normalize_setting_key(name)
+    ]
+def is_optional(annotation) -> bool:
+    origin = get_origin(annotation)
+    if origin is Union:
+        return type(None) in get_args(annotation)
+    return False
+def parse_and_validate(field_name: str, field_info, raw: str):
+    """
+    Validate and coerce a CLI value by delegating to the Settings model.
+    Field validators like LOG_LEVEL coercion (e.g. 'error' -> numeric log level)
+    are applied.
+    """
+    settings = get_settings()
+    value: object = maybe_parse_json_literal(raw, field_info)
+    payload = settings.model_dump(mode="python")
+    payload[field_name] = value
+    try:
+        validated = type(settings).model_validate(payload)
+    except ValidationError as e:
+        # Surface field-specific error(s) if possible
+        field_errors: list[str] = []
+        for err in e.errors():
+            loc = err.get("loc") or ()
+            if loc and loc[0] == field_name:
+                field_errors.append(err.get("msg") or str(err))
+        detail = "; ".join(field_errors) if field_errors else str(e)
+        raise typer.BadParameter(
+            f"Invalid value for {field_name}: {raw!r}. {detail}"
+        ) from e
+    return getattr(validated, field_name)

deepeval/config/dotenv_handler.py ADDED Viewed

@@ -0,0 +1,19 @@
+from dotenv import set_key, unset_key
+from pathlib import Path
+class DotenvHandler:
+    def __init__(self, path: Path):
+        self.path = Path(path)
+    def upsert(self, mapping: dict[str, str]) -> None:
+        self.path.parent.mkdir(parents=True, exist_ok=True)
+        self.path.touch(exist_ok=True)
+        for key, value in mapping.items():
+            set_key(str(self.path), key, value, quote_mode="always")
+    def unset(self, keys: set[str]) -> None:
+        if not self.path.exists():
+            return
+        for key in keys:
+            unset_key(str(self.path), key)

deepeval 3.7.6__py3-none-any.whl → 3.7.8__py3-none-any.whl

deepeval 3.7.6py3-none-any.whl → 3.7.8py3-none-any.whl