PyPI - deepeval - Versions diffs - 3.6.7__py3-none-any.whl → 3.6.9__py3-none-any.whl - Mend

deepeval 3.6.7py3-none-any.whl → 3.6.9py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (90) hide show

deepeval/_version.py +1 -1
deepeval/config/settings.py +104 -36
deepeval/config/utils.py +5 -0
deepeval/dataset/dataset.py +162 -30
deepeval/dataset/utils.py +41 -13
deepeval/errors.py +20 -2
deepeval/evaluate/execute.py +1662 -688
deepeval/evaluate/types.py +1 -0
deepeval/evaluate/utils.py +13 -3
deepeval/integrations/crewai/__init__.py +2 -1
deepeval/integrations/crewai/tool.py +71 -0
deepeval/integrations/llama_index/__init__.py +0 -4
deepeval/integrations/llama_index/handler.py +20 -21
deepeval/integrations/pydantic_ai/instrumentator.py +125 -76
deepeval/metrics/__init__.py +13 -0
deepeval/metrics/base_metric.py +1 -0
deepeval/metrics/contextual_precision/contextual_precision.py +27 -21
deepeval/metrics/conversational_g_eval/__init__.py +3 -0
deepeval/metrics/conversational_g_eval/conversational_g_eval.py +11 -7
deepeval/metrics/dag/schema.py +1 -1
deepeval/metrics/dag/templates.py +2 -2
deepeval/metrics/goal_accuracy/__init__.py +1 -0
deepeval/metrics/goal_accuracy/goal_accuracy.py +349 -0
deepeval/metrics/goal_accuracy/schema.py +17 -0
deepeval/metrics/goal_accuracy/template.py +235 -0
deepeval/metrics/hallucination/hallucination.py +8 -8
deepeval/metrics/indicator.py +21 -1
deepeval/metrics/mcp/mcp_task_completion.py +7 -2
deepeval/metrics/mcp/multi_turn_mcp_use_metric.py +16 -6
deepeval/metrics/mcp_use_metric/mcp_use_metric.py +2 -1
deepeval/metrics/multimodal_metrics/multimodal_contextual_precision/multimodal_contextual_precision.py +32 -24
deepeval/metrics/plan_adherence/__init__.py +1 -0
deepeval/metrics/plan_adherence/plan_adherence.py +292 -0
deepeval/metrics/plan_adherence/schema.py +11 -0
deepeval/metrics/plan_adherence/template.py +170 -0
deepeval/metrics/plan_quality/__init__.py +1 -0
deepeval/metrics/plan_quality/plan_quality.py +292 -0
deepeval/metrics/plan_quality/schema.py +11 -0
deepeval/metrics/plan_quality/template.py +101 -0
deepeval/metrics/step_efficiency/__init__.py +1 -0
deepeval/metrics/step_efficiency/schema.py +11 -0
deepeval/metrics/step_efficiency/step_efficiency.py +234 -0
deepeval/metrics/step_efficiency/template.py +256 -0
deepeval/metrics/task_completion/task_completion.py +1 -0
deepeval/metrics/tool_correctness/schema.py +6 -0
deepeval/metrics/tool_correctness/template.py +88 -0
deepeval/metrics/tool_correctness/tool_correctness.py +226 -22
deepeval/metrics/tool_use/__init__.py +1 -0
deepeval/metrics/tool_use/schema.py +19 -0
deepeval/metrics/tool_use/template.py +220 -0
deepeval/metrics/tool_use/tool_use.py +458 -0
deepeval/metrics/topic_adherence/__init__.py +1 -0
deepeval/metrics/topic_adherence/schema.py +16 -0
deepeval/metrics/topic_adherence/template.py +162 -0
deepeval/metrics/topic_adherence/topic_adherence.py +355 -0
deepeval/models/embedding_models/azure_embedding_model.py +37 -36
deepeval/models/embedding_models/local_embedding_model.py +30 -32
deepeval/models/embedding_models/ollama_embedding_model.py +18 -20
deepeval/models/embedding_models/openai_embedding_model.py +22 -31
deepeval/models/llms/amazon_bedrock_model.py +20 -17
deepeval/models/llms/openai_model.py +10 -1
deepeval/models/retry_policy.py +103 -20
deepeval/openai/extractors.py +61 -16
deepeval/openai/patch.py +8 -12
deepeval/openai/types.py +1 -1
deepeval/openai/utils.py +108 -1
deepeval/prompt/prompt.py +1 -0
deepeval/prompt/utils.py +43 -14
deepeval/simulator/conversation_simulator.py +25 -18
deepeval/synthesizer/chunking/context_generator.py +9 -1
deepeval/synthesizer/synthesizer.py +11 -10
deepeval/test_case/llm_test_case.py +6 -2
deepeval/test_run/test_run.py +190 -207
deepeval/tracing/__init__.py +2 -1
deepeval/tracing/otel/exporter.py +3 -4
deepeval/tracing/otel/utils.py +23 -4
deepeval/tracing/trace_context.py +53 -38
deepeval/tracing/tracing.py +23 -0
deepeval/tracing/types.py +16 -14
deepeval/utils.py +21 -0
{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/METADATA +1 -1
{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/RECORD +85 -63
deepeval/integrations/llama_index/agent/patched.py +0 -68
deepeval/tracing/message_types/__init__.py +0 -10
deepeval/tracing/message_types/base.py +0 -6
deepeval/tracing/message_types/messages.py +0 -14
deepeval/tracing/message_types/tools.py +0 -18
{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/LICENSE.md +0 -0
{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/WHEEL +0 -0
{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/entry_points.txt +0 -0

deepeval/integrations/llama_index/agent/patched.py DELETED Viewed

@@ -1,68 +0,0 @@
-from typing import TypeVar, cast, Optional, List
-from pydantic import Field
-from deepeval.metrics import BaseMetric
-from deepeval.telemetry import capture_tracing_integration
-try:
-    from llama_index.core.agent.workflow import (
-        FunctionAgent,
-        ReActAgent,
-        CodeActAgent,
-    )
-    is_llama_index_installed = True
-except:
-    is_llama_index_installed = False
-def is_llama_index_agent_installed():
-    if not is_llama_index_installed:
-        raise ImportError(
-            "llama-index is neccesary for this functionality. Please install it with `pip install llama-index` or with package manager of choice."
-        )
-T = TypeVar("T", bound=type)
-def with_metrics(cls: T) -> T:
-    class SubClassWithMetric(cls):  # type: ignore
-        metric_collection: Optional[str] = Field(default=None)
-        metrics: Optional[List[BaseMetric]] = Field(default_factory=list)
-    SubClassWithMetric.__name__ = cls.__name__
-    SubClassWithMetric.__qualname__ = cls.__qualname__
-    return cast(T, SubClassWithMetric)
-@with_metrics
-class FunctionAgent(FunctionAgent):
-    def __init__(self, *args, metric_collection=None, metrics=None, **kwargs):
-        with capture_tracing_integration(
-            "llama_index.agent.patched.FunctionAgent"
-        ):
-            super().__init__(*args, **kwargs)
-            self.metric_collection = metric_collection
-            self.metrics = metrics
-@with_metrics
-class ReActAgent(ReActAgent):
-    def __init__(self, *args, metric_collection=None, metrics=None, **kwargs):
-        with capture_tracing_integration(
-            "llama_index.agent.patched.ReActAgent"
-        ):
-            super().__init__(*args, **kwargs)
-            self.metric_collection = metric_collection
-            self.metrics = metrics
-@with_metrics
-class CodeActAgent(CodeActAgent):
-    def __init__(self, *args, metric_collection=None, metrics=None, **kwargs):
-        with capture_tracing_integration(
-            "llama_index.agent.patched.CodeActAgent"
-        ):
-            super().__init__(*args, **kwargs)
-            self.metric_collection = metric_collection
-            self.metrics = metrics

deepeval/tracing/message_types/__init__.py DELETED Viewed

@@ -1,10 +0,0 @@
-from .messages import TextMessage, ToolCallMessage
-from .tools import BaseTool, ToolSchema, ToolOutput
-__all__ = [
-    "BaseTool",
-    "TextMessage",
-    "ToolCallMessage",
-    "ToolSchema",
-    "ToolOutput",
-]

deepeval/tracing/message_types/base.py DELETED Viewed

@@ -1,6 +0,0 @@
-from typing import Literal
-from pydantic import BaseModel
-class BaseMessage(BaseModel):
-    role: Literal["user", "assistant"]

deepeval/tracing/message_types/messages.py DELETED Viewed

@@ -1,14 +0,0 @@
-from typing import Literal, Dict, Any
-from .base import BaseMessage
-class TextMessage(BaseMessage):
-    type: Literal["text", "thinking"]
-    content: str
-class ToolCallMessage(BaseMessage):
-    """This is a message for tool calls in response.choices[0].message.tool_calls"""
-    name: str
-    args: Dict[str, Any]

deepeval/tracing/message_types/tools.py DELETED Viewed

@@ -1,18 +0,0 @@
-from typing import Any, Optional, Dict
-from pydantic import BaseModel
-class BaseTool(BaseModel):
-    name: str
-    description: Optional[str] = None
-class ToolSchema(BaseTool):
-    parameters: Dict[str, Any]
-    is_called: Optional[bool] = False
-class ToolOutput(BaseTool):
-    """Output of the tool function"""
-    output: Any

{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/LICENSE.md RENAMED Viewed

File without changes

{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/WHEEL RENAMED Viewed

File without changes

{deepeval-3.6.7.dist-info → deepeval-3.6.9.dist-info}/entry_points.txt RENAMED Viewed

File without changes

deepeval 3.6.7__py3-none-any.whl → 3.6.9__py3-none-any.whl

deepeval 3.6.7py3-none-any.whl → 3.6.9py3-none-any.whl