PyPI - ragbits-evaluate - Versions diffs - 0.0.30rc1__py3-none-any.whl → 1.4.0.dev202602030301__py3-none-any.whl - Mend

ragbits-evaluate 0.0.30rc1py3-none-any.whl → 1.4.0.dev202602030301py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (25) hide show

ragbits/evaluate/agent_simulation/__init__.py +4 -49
ragbits/evaluate/agent_simulation/conversation.py +278 -663
ragbits/evaluate/agent_simulation/logger.py +1 -1
ragbits/evaluate/agent_simulation/metrics/__init__.py +0 -10
ragbits/evaluate/agent_simulation/metrics/builtin.py +49 -59
ragbits/evaluate/agent_simulation/metrics/collectors.py +17 -37
ragbits/evaluate/agent_simulation/models.py +18 -198
ragbits/evaluate/agent_simulation/results.py +49 -125
ragbits/evaluate/agent_simulation/scenarios.py +19 -95
ragbits/evaluate/agent_simulation/simulation.py +166 -72
ragbits/evaluate/metrics/question_answer.py +25 -8
{ragbits_evaluate-0.0.30rc1.dist-info → ragbits_evaluate-1.4.0.dev202602030301.dist-info}/METADATA +2 -6
{ragbits_evaluate-0.0.30rc1.dist-info → ragbits_evaluate-1.4.0.dev202602030301.dist-info}/RECORD +14 -25
ragbits/evaluate/agent_simulation/checkers.py +0 -591
ragbits/evaluate/agent_simulation/display.py +0 -118
ragbits/evaluate/agent_simulation/metrics/deepeval.py +0 -295
ragbits/evaluate/agent_simulation/tracing.py +0 -233
ragbits/evaluate/api.py +0 -603
ragbits/evaluate/api_types.py +0 -343
ragbits/evaluate/execution_manager.py +0 -451
ragbits/evaluate/stores/__init__.py +0 -36
ragbits/evaluate/stores/base.py +0 -98
ragbits/evaluate/stores/file.py +0 -466
ragbits/evaluate/stores/kv.py +0 -535
{ragbits_evaluate-0.0.30rc1.dist-info → ragbits_evaluate-1.4.0.dev202602030301.dist-info}/WHEEL +0 -0

ragbits/evaluate/agent_simulation/__init__.py CHANGED Viewed

@@ -6,13 +6,10 @@ This module uses lazy imports for components that require optional dependencies
 from typing import TYPE_CHECKING
+# Import context, metrics, and result models eagerly - they have no external dependencies
 from ragbits.evaluate.agent_simulation.context import DataSnapshot, DomainContext
 from ragbits.evaluate.agent_simulation.metrics import (
     CompositeMetricCollector,
-    DeepEvalAllMetricsCollector,
-    DeepEvalCompletenessMetricCollector,
-    DeepEvalKnowledgeRetentionMetricCollector,
-    DeepEvalRelevancyMetricCollector,
     LatencyMetricCollector,
     MetricCollector,
     TokenUsageMetricCollector,
@@ -27,71 +24,41 @@ from ragbits.evaluate.agent_simulation.results import (
 )
 if TYPE_CHECKING:
-    from ragbits.agents.tool import ToolCallResult
-    from ragbits.core.llms.base import ToolCall, Usage, UsageItem
     from ragbits.evaluate.agent_simulation.conversation import run_simulation
     from ragbits.evaluate.agent_simulation.deepeval_evaluator import DeepEvalEvaluator
     from ragbits.evaluate.agent_simulation.logger import ConversationLogger
-    from ragbits.evaluate.agent_simulation.models import Personality, Scenario, SimulationConfig, Task, Turn
+    from ragbits.evaluate.agent_simulation.models import Personality, Scenario, Task, Turn
     from ragbits.evaluate.agent_simulation.scenarios import load_personalities, load_scenarios
     from ragbits.evaluate.agent_simulation.simulation import GoalChecker, SimulatedUser
-    from ragbits.evaluate.agent_simulation.tracing import (
-        LLMCall,
-        MemoryTraceHandler,
-        TraceAnalyzer,
-        TraceSpan,
-        collect_traces,
-    )
 __all__ = [
-    # Metrics
     "CompositeMetricCollector",
-    # Components (lazy loaded)
     "ConversationLogger",
-    # Results
     "ConversationMetrics",
-    # Context
     "DataSnapshot",
-    "DeepEvalAllMetricsCollector",
-    "DeepEvalCompletenessMetricCollector",
     "DeepEvalEvaluator",
-    "DeepEvalKnowledgeRetentionMetricCollector",
-    "DeepEvalRelevancyMetricCollector",
     "DomainContext",
     "GoalChecker",
-    # Tracing (lazy loaded)
-    "LLMCall",
     "LatencyMetricCollector",
-    "MemoryTraceHandler",
     "MetricCollector",
     "Personality",
     "Scenario",
     "SimulatedUser",
-    "SimulationConfig",
     "SimulationResult",
     "SimulationStatus",
     "Task",
     "TaskResult",
     "TokenUsageMetricCollector",
-    # Re-exports from ragbits-core/agents
-    "ToolCall",
-    "ToolCallResult",
     "ToolUsageMetricCollector",
-    "TraceAnalyzer",
-    "TraceSpan",
     "Turn",
     "TurnResult",
-    "Usage",
-    "UsageItem",
-    "collect_traces",
-    # Functions (lazy loaded)
     "load_personalities",
     "load_scenarios",
     "run_simulation",
 ]
-def __getattr__(name: str) -> object:  # noqa: PLR0911
+def __getattr__(name: str) -> object:
     """Lazy import for components with optional dependencies."""
     if name == "run_simulation":
         from ragbits.evaluate.agent_simulation.conversation import run_simulation
@@ -105,7 +72,7 @@ def __getattr__(name: str) -> object:  # noqa: PLR0911
         from ragbits.evaluate.agent_simulation.logger import ConversationLogger
         return ConversationLogger
-    if name in ("Personality", "Scenario", "SimulationConfig", "Task", "Turn"):
+    if name in ("Personality", "Scenario", "Task", "Turn"):
         from ragbits.evaluate.agent_simulation import models
         return getattr(models, name)
@@ -117,16 +84,4 @@ def __getattr__(name: str) -> object:  # noqa: PLR0911
         from ragbits.evaluate.agent_simulation import simulation
         return getattr(simulation, name)
-    if name in ("LLMCall", "MemoryTraceHandler", "TraceAnalyzer", "TraceSpan", "collect_traces"):
-        from ragbits.evaluate.agent_simulation import tracing
-        return getattr(tracing, name)
-    if name in ("ToolCall", "Usage", "UsageItem"):
-        from ragbits.core.llms import base
-        return getattr(base, name)
-    if name == "ToolCallResult":
-        from ragbits.agents.tool import ToolCallResult
-        return ToolCallResult
     raise AttributeError(f"module {__name__!r} has no attribute {name!r}")

ragbits-evaluate 0.0.30rc1__py3-none-any.whl → 1.4.0.dev202602030301__py3-none-any.whl

ragbits-evaluate 0.0.30rc1py3-none-any.whl → 1.4.0.dev202602030301py3-none-any.whl