PyPI - deepeval - Versions diffs - 3.7.0__py3-none-any.whl → 3.7.2__py3-none-any.whl - Mend

deepeval 3.7.0py3-none-any.whl → 3.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (40) hide show

deepeval/__init__.py +0 -4
deepeval/_version.py +1 -1
deepeval/cli/main.py +7 -0
deepeval/confident/api.py +6 -1
deepeval/config/settings.py +5 -0
deepeval/evaluate/compare.py +219 -4
deepeval/evaluate/types.py +6 -0
deepeval/evaluate/utils.py +30 -0
deepeval/key_handler.py +1 -0
deepeval/metrics/arena_g_eval/arena_g_eval.py +5 -1
deepeval/metrics/arena_g_eval/utils.py +5 -5
deepeval/metrics/conversational_g_eval/conversational_g_eval.py +9 -18
deepeval/metrics/g_eval/g_eval.py +5 -1
deepeval/metrics/g_eval/utils.py +1 -1
deepeval/metrics/multimodal_metrics/multimodal_g_eval/multimodal_g_eval.py +5 -1
deepeval/metrics/utils.py +1 -1
deepeval/models/llms/gemini_model.py +27 -5
deepeval/openai_agents/callback_handler.py +12 -3
deepeval/prompt/prompt.py +25 -14
deepeval/simulator/template.py +1 -1
deepeval/synthesizer/config.py +9 -0
deepeval/synthesizer/schema.py +23 -0
deepeval/synthesizer/synthesizer.py +1137 -2
deepeval/synthesizer/templates/__init__.py +11 -2
deepeval/synthesizer/templates/template.py +554 -1
deepeval/synthesizer/templates/template_extraction.py +32 -0
deepeval/synthesizer/templates/template_prompt.py +262 -0
deepeval/test_case/__init__.py +2 -1
deepeval/test_case/arena_test_case.py +15 -4
deepeval/test_case/mllm_test_case.py +45 -22
deepeval/test_run/cache.py +31 -10
deepeval/test_run/hyperparameters.py +5 -1
deepeval/test_run/test_run.py +28 -9
deepeval/tracing/tracing.py +1 -1
deepeval/utils.py +4 -0
{deepeval-3.7.0.dist-info → deepeval-3.7.2.dist-info}/METADATA +3 -2
{deepeval-3.7.0.dist-info → deepeval-3.7.2.dist-info}/RECORD +40 -40
{deepeval-3.7.0.dist-info → deepeval-3.7.2.dist-info}/LICENSE.md +0 -0
{deepeval-3.7.0.dist-info → deepeval-3.7.2.dist-info}/WHEEL +0 -0
{deepeval-3.7.0.dist-info → deepeval-3.7.2.dist-info}/entry_points.txt +0 -0

deepeval/openai_agents/callback_handler.py CHANGED Viewed

@@ -1,13 +1,21 @@
+from time import perf_counter
 from deepeval.tracing.tracing import (
     Observer,
     current_span_context,
     trace_manager,
 )
-from deepeval.openai_agents.extractors import *
+from deepeval.openai_agents.extractors import (
+    update_span_properties,
+    update_trace_properties_from_span_data,
+)
 from deepeval.tracing.context import current_trace_context
 from deepeval.tracing.utils import make_json_serializable
-from time import perf_counter
-from deepeval.tracing.types import TraceSpanStatus
+from deepeval.tracing.types import (
+    BaseSpan,
+    LlmSpan,
+    TraceSpanStatus,
+)
 try:
     from agents.tracing import Span, Trace, TracingProcessor
@@ -18,6 +26,7 @@ try:
         GenerationSpanData,
         GuardrailSpanData,
         HandoffSpanData,
+        MCPListToolsSpanData,
         ResponseSpanData,
         SpanData,
     )

deepeval/prompt/prompt.py CHANGED Viewed

@@ -1,3 +1,8 @@
+import logging
+import time
+import json
+import os
 from enum import Enum
 from typing import Optional, List, Dict, Type, Literal
 from rich.progress import Progress, SpinnerColumn, TextColumn, BarColumn
@@ -5,12 +10,11 @@ from rich.console import Console
 import time
 import json
 import os
-from pydantic import BaseModel, ValidationError, ConfigDict
+from pydantic import BaseModel, ValidationError
 import asyncio
-import portalocker
 import threading
-from deepeval.utils import make_model_config
+from deepeval.utils import make_model_config, is_read_only_env
 from deepeval.prompt.api import (
     PromptHttpResponse,
@@ -24,9 +28,6 @@ from deepeval.prompt.api import (
     ModelSettings,
     OutputSchema,
     OutputType,
-    ReasoningEffort,
-    Verbosity,
-    ModelProvider,
 )
 from deepeval.prompt.utils import (
     interpolate_text,
@@ -36,6 +37,18 @@ from deepeval.prompt.utils import (
 from deepeval.confident.api import Api, Endpoints, HttpMethods
 from deepeval.constants import HIDDEN_DIR
+logger = logging.getLogger(__name__)
+portalocker = None
+if not is_read_only_env():
+    try:
+        import portalocker
+    except Exception as e:
+        logger.warning("failed to import portalocker: %s", e)
+else:
+    logger.warning("READ_ONLY filesystem: skipping disk cache for prompts.")
 CACHE_FILE_NAME = f"{HIDDEN_DIR}/.deepeval-prompt-cache.json"
 VERSION_CACHE_KEY = "version"
 LABEL_CACHE_KEY = "label"
@@ -165,7 +178,7 @@ class Prompt:
             content = f.read()
         try:
             data = json.loads(content)
-        except:
+        except (json.JSONDecodeError, TypeError):
             self.text_template = content
             return content
@@ -203,7 +216,6 @@ class Prompt:
                     "Unable to interpolate empty prompt template. Please pull a prompt from Confident AI or set template manually to continue."
                 )
-            print("@@@@@")
             return interpolate_text(interpolation_type, text_template, **kwargs)
         elif prompt_type == PromptType.LIST:
@@ -248,7 +260,7 @@ class Prompt:
         version: Optional[str] = None,
         label: Optional[str] = None,
     ) -> Optional[CachedPrompt]:
-        if not os.path.exists(CACHE_FILE_NAME):
+        if portalocker is None or not os.path.exists(CACHE_FILE_NAME):
             return None
         try:
@@ -296,13 +308,12 @@ class Prompt:
         output_type: Optional[OutputType] = None,
         output_schema: Optional[OutputSchema] = None,
     ):
-        if not self.alias:
+        if portalocker is None or not self.alias:
             return
-        # Ensure directory exists
-        os.makedirs(HIDDEN_DIR, exist_ok=True)
         try:
+            # Ensure directory exists
+            os.makedirs(HIDDEN_DIR, exist_ok=True)
             # Use r+ mode if file exists, w mode if it doesn't
             mode = "r+" if os.path.exists(CACHE_FILE_NAME) else "w"
@@ -481,7 +492,7 @@ class Prompt:
                             cached_prompt.output_schema
                         )
                     return
-            except:
+            except Exception:
                 pass
         api = Api()

deepeval/simulator/template.py CHANGED Viewed

@@ -112,7 +112,7 @@ class ConversationSimulatorTemplate:
             ]
             Example JSON Output:
             {{
-                "is_complete": False,
+                "is_complete": false,
                 "reason": "The assistant explained how to forget password but ahas not confirmed that the user successfully set a new password."
             }}

deepeval/synthesizer/config.py CHANGED Viewed

@@ -41,6 +41,15 @@ class StylingConfig:
     expected_output_format: Optional[str] = None
+@dataclass
+class ConversationalStylingConfig:
+    scenario_context: Optional[str] = None
+    conversational_task: Optional[str] = None
+    participant_roles: Optional[str] = None
+    scenario_format: Optional[str] = None
+    expected_outcome_format: Optional[str] = None
 @dataclass
 class ContextConstructionConfig:
     embedder: Optional[Union[str, DeepEvalBaseEmbeddingModel]] = None

deepeval/synthesizer/schema.py CHANGED Viewed

@@ -58,3 +58,26 @@ class PromptStyling(BaseModel):
     scenario: str
     task: str
     input_format: str
+class ConversationalScenario(BaseModel):
+    scenario: str
+class ConversationalScenarioList(BaseModel):
+    data: List[ConversationalScenario]
+class RewrittenScenario(BaseModel):
+    rewritten_scenario: str
+class ScenarioFeedback(BaseModel):
+    score: float
+    feedback: str
+class ConversationalPromptStyling(BaseModel):
+    scenario_context: str
+    conversational_task: str
+    participant_roles: str

deepeval 3.7.0__py3-none-any.whl → 3.7.2__py3-none-any.whl

deepeval 3.7.0py3-none-any.whl → 3.7.2py3-none-any.whl