PyPI - deepeval - Versions diffs - 3.5.1__py3-none-any.whl → 3.5.3__py3-none-any.whl - Mend

deepeval 3.5.1py3-none-any.whl → 3.5.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

deepeval/_version.py +1 -1
deepeval/config/settings.py +94 -2
deepeval/config/utils.py +54 -1
deepeval/constants.py +27 -0
deepeval/integrations/langchain/__init__.py +2 -3
deepeval/integrations/langchain/callback.py +126 -301
deepeval/integrations/langchain/patch.py +24 -13
deepeval/integrations/langchain/utils.py +203 -1
deepeval/integrations/pydantic_ai/patcher.py +220 -185
deepeval/integrations/pydantic_ai/utils.py +86 -0
deepeval/metrics/conversational_g_eval/conversational_g_eval.py +1 -0
deepeval/metrics/pii_leakage/pii_leakage.py +1 -1
deepeval/models/embedding_models/azure_embedding_model.py +40 -9
deepeval/models/embedding_models/local_embedding_model.py +54 -11
deepeval/models/embedding_models/ollama_embedding_model.py +25 -7
deepeval/models/embedding_models/openai_embedding_model.py +47 -5
deepeval/models/llms/amazon_bedrock_model.py +31 -4
deepeval/models/llms/anthropic_model.py +39 -13
deepeval/models/llms/azure_model.py +37 -38
deepeval/models/llms/deepseek_model.py +36 -7
deepeval/models/llms/gemini_model.py +10 -0
deepeval/models/llms/grok_model.py +50 -3
deepeval/models/llms/kimi_model.py +37 -7
deepeval/models/llms/local_model.py +38 -12
deepeval/models/llms/ollama_model.py +15 -3
deepeval/models/llms/openai_model.py +37 -44
deepeval/models/mlllms/gemini_model.py +21 -3
deepeval/models/mlllms/ollama_model.py +38 -13
deepeval/models/mlllms/openai_model.py +18 -42
deepeval/models/retry_policy.py +548 -64
deepeval/prompt/api.py +13 -9
deepeval/prompt/prompt.py +19 -9
deepeval/tracing/tracing.py +87 -0
deepeval/utils.py +12 -0
{deepeval-3.5.1.dist-info → deepeval-3.5.3.dist-info}/METADATA +1 -1
{deepeval-3.5.1.dist-info → deepeval-3.5.3.dist-info}/RECORD +39 -38
{deepeval-3.5.1.dist-info → deepeval-3.5.3.dist-info}/LICENSE.md +0 -0
{deepeval-3.5.1.dist-info → deepeval-3.5.3.dist-info}/WHEEL +0 -0
{deepeval-3.5.1.dist-info → deepeval-3.5.3.dist-info}/entry_points.txt +0 -0

deepeval/models/mlllms/ollama_model.py CHANGED Viewed

@@ -5,23 +5,31 @@ import requests
 import base64
 import io
+from deepeval.models.retry_policy import (
+    create_retry_decorator,
+)
 from deepeval.key_handler import KEY_FILE_HANDLER, ModelKeyValues
 from deepeval.models import DeepEvalBaseMLLM
 from deepeval.test_case import MLLMImage
+from deepeval.config.settings import get_settings
+from deepeval.constants import ProviderSlug as PS
+retry_ollama = create_retry_decorator(PS.OLLAMA)
 class MultimodalOllamaModel(DeepEvalBaseMLLM):
-    def __init__(
-        self,
-    ):
+    def __init__(self, **kwargs):
         model_name = KEY_FILE_HANDLER.fetch_data(
             ModelKeyValues.LOCAL_MODEL_NAME
         )
         self.base_url = KEY_FILE_HANDLER.fetch_data(
             ModelKeyValues.LOCAL_MODEL_BASE_URL
         )
+        self.kwargs = kwargs
         super().__init__(model_name)
+    @retry_ollama
     def generate(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
@@ -43,6 +51,7 @@ class MultimodalOllamaModel(DeepEvalBaseMLLM):
             0,
         )
+    @retry_ollama
     async def a_generate(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
@@ -77,12 +86,14 @@ class MultimodalOllamaModel(DeepEvalBaseMLLM):
                     }
                 )
             elif isinstance(ele, MLLMImage):
-                messages.append(
-                    {
-                        "role": "user",
-                        "images": [self.convert_to_base64(ele.url, ele.local)],
-                    }
-                )
+                img_b64 = self.convert_to_base64(ele.url, ele.local)
+                if img_b64 is not None:
+                    messages.append(
+                        {
+                            "role": "user",
+                            "images": [img_b64],
+                        }
+                    )
         return messages
     ###############################################
@@ -92,9 +103,17 @@ class MultimodalOllamaModel(DeepEvalBaseMLLM):
     def convert_to_base64(self, image_source: str, is_local: bool) -> str:
         from PIL import Image
+        settings = get_settings()
         try:
             if not is_local:
-                response = requests.get(image_source, stream=True)
+                response = requests.get(
+                    image_source,
+                    stream=True,
+                    timeout=(
+                        settings.MEDIA_IMAGE_CONNECT_TIMEOUT_SECONDS,
+                        settings.MEDIA_IMAGE_READ_TIMEOUT_SECONDS,
+                    ),
+                )
                 response.raise_for_status()  # Raise HTTPError for bad responses (4xx or 5xx)
                 image = Image.open(io.BytesIO(response.content))
             else:
@@ -105,15 +124,21 @@ class MultimodalOllamaModel(DeepEvalBaseMLLM):
             img_str = base64.b64encode(buffered.getvalue()).decode()
             return img_str
+        except (requests.exceptions.RequestException, OSError) as e:
+            # Log, then rethrow so @retry_ollama can retry generate_messages() on network failures
+            print(f"Image fetch/encode failed: {e}")
+            raise
         except Exception as e:
             print(f"Error converting image to base64: {e}")
             return None
     def load_model(self, async_mode: bool = False):
         if not async_mode:
-            return Client(host=self.base_url)
-        else:
-            return AsyncClient(host=self.base_url)
+            return self._build_client(Client)
+        return self._build_client(AsyncClient)
+    def _build_client(self, cls):
+        return cls(host=self.base_url, **self.kwargs)
     def get_model_name(self):
         return f"{self.model_name} (Ollama)"

deepeval/models/mlllms/openai_model.py CHANGED Viewed

@@ -3,15 +3,7 @@ from openai import OpenAI, AsyncOpenAI
 from openai.types.chat import ParsedChatCompletion
 from pydantic import BaseModel
 from io import BytesIO
-import logging
-import openai
 import base64
-from tenacity import (
-    retry,
-    retry_if_exception_type,
-    wait_exponential_jitter,
-    RetryCallState,
-)
 from deepeval.models.llms.openai_model import (
     model_pricing,
@@ -21,21 +13,14 @@ from deepeval.models import DeepEvalBaseMLLM
 from deepeval.models.llms.utils import trim_and_load_json
 from deepeval.test_case import MLLMImage
 from deepeval.models.utils import parse_model_name
-retryable_exceptions = (
-    openai.RateLimitError,
-    openai.APIConnectionError,
-    openai.APITimeoutError,
-    openai.LengthFinishReasonError,
+from deepeval.models.retry_policy import (
+    create_retry_decorator,
+    sdk_retries_for,
 )
+from deepeval.constants import ProviderSlug as PS
-def log_retry_error(retry_state: RetryCallState):
-    exception = retry_state.outcome.exception()
-    logging.error(
-        f"OpenAI Error: {exception} Retrying: {retry_state.attempt_number} time(s)..."
-    )
+retry_openai = create_retry_decorator(PS.OPENAI)
 valid_multimodal_gpt_models = [
     "gpt-4o",
@@ -95,11 +80,7 @@ class MultimodalOpenAIModel(DeepEvalBaseMLLM):
     # Generate functions
     ###############################################
-    @retry(
-        wait=wait_exponential_jitter(initial=1, exp_base=2, jitter=2, max=10),
-        retry=retry_if_exception_type(retryable_exceptions),
-        after=log_retry_error,
-    )
+    @retry_openai
     def generate(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
@@ -136,11 +117,7 @@ class MultimodalOpenAIModel(DeepEvalBaseMLLM):
         else:
             return output, cost
-    @retry(
-        wait=wait_exponential_jitter(initial=1, exp_base=2, jitter=2, max=10),
-        retry=retry_if_exception_type(retryable_exceptions),
-        after=log_retry_error,
-    )
+    @retry_openai
     async def a_generate(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
@@ -181,17 +158,13 @@ class MultimodalOpenAIModel(DeepEvalBaseMLLM):
     # Other generate functions
     ###############################################
-    @retry(
-        wait=wait_exponential_jitter(initial=1, exp_base=2, jitter=2, max=10),
-        retry=retry_if_exception_type(retryable_exceptions),
-        after=log_retry_error,
-    )
+    @retry_openai
     def generate_raw_response(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
         top_logprobs: int = 5,
     ) -> Tuple[ParsedChatCompletion, float]:
-        client = OpenAI(api_key=self._openai_api_key)
+        client = self._client()
         prompt = self.generate_prompt(multimodal_input)
         messages = [{"role": "user", "content": prompt}]
         completion = client.chat.completions.create(
@@ -206,17 +179,13 @@ class MultimodalOpenAIModel(DeepEvalBaseMLLM):
         cost = self.calculate_cost(input_tokens, output_tokens)
         return completion, cost
-    @retry(
-        wait=wait_exponential_jitter(initial=1, exp_base=2, jitter=2, max=10),
-        retry=retry_if_exception_type(retryable_exceptions),
-        after=log_retry_error,
-    )
+    @retry_openai
     async def a_generate_raw_response(
         self,
         multimodal_input: List[Union[str, MLLMImage]],
         top_logprobs: int = 5,
     ) -> Tuple[ParsedChatCompletion, float]:
-        client = AsyncOpenAI(api_key=self._openai_api_key)
+        client = self._client(async_mode=True)
         prompt = self.generate_prompt(multimodal_input)
         messages = [{"role": "user", "content": prompt}]
         completion = await client.chat.completions.create(
@@ -278,5 +247,12 @@ class MultimodalOpenAIModel(DeepEvalBaseMLLM):
         base64_encoded_image = base64.b64encode(image_bytes).decode("utf-8")
         return base64_encoded_image
+    def _client(self, async_mode: bool = False):
+        kw = {"api_key": self._openai_api_key}
+        if not sdk_retries_for(PS.OPENAI):
+            kw["max_retries"] = 0
+        Client = AsyncOpenAI if async_mode else OpenAI
+        return Client(**kw)
     def get_model_name(self):
         return self.model_name

deepeval 3.5.1__py3-none-any.whl → 3.5.3__py3-none-any.whl

deepeval 3.5.1py3-none-any.whl → 3.5.3py3-none-any.whl