PyPI - judgeval - Versions diffs - 0.1.0__py3-none-any.whl → 0.23.0__py3-none-any.whl - Mend

judgeval 0.1.0py3-none-any.whl → 0.23.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (234) hide show

judgeval/__init__.py +173 -10
judgeval/api/__init__.py +523 -0
judgeval/api/api_types.py +413 -0
judgeval/cli.py +112 -0
judgeval/constants.py +7 -30
judgeval/data/__init__.py +1 -3
judgeval/data/evaluation_run.py +125 -0
judgeval/data/example.py +14 -40
judgeval/data/judgment_types.py +396 -146
judgeval/data/result.py +11 -18
judgeval/data/scorer_data.py +3 -26
judgeval/data/scripts/openapi_transform.py +5 -5
judgeval/data/trace.py +115 -194
judgeval/dataset/__init__.py +335 -0
judgeval/env.py +55 -0
judgeval/evaluation/__init__.py +346 -0
judgeval/exceptions.py +28 -0
judgeval/integrations/langgraph/__init__.py +13 -0
judgeval/integrations/openlit/__init__.py +51 -0
judgeval/judges/__init__.py +2 -2
judgeval/judges/litellm_judge.py +77 -16
judgeval/judges/together_judge.py +88 -17
judgeval/judges/utils.py +7 -20
judgeval/judgment_attribute_keys.py +55 -0
judgeval/{common/logger.py → logger.py} +24 -8
judgeval/prompt/__init__.py +330 -0
judgeval/scorers/__init__.py +11 -11
judgeval/scorers/agent_scorer.py +15 -19
judgeval/scorers/api_scorer.py +21 -23
judgeval/scorers/base_scorer.py +54 -36
judgeval/scorers/example_scorer.py +1 -3
judgeval/scorers/judgeval_scorers/api_scorers/__init__.py +2 -24
judgeval/scorers/judgeval_scorers/api_scorers/answer_correctness.py +2 -10
judgeval/scorers/judgeval_scorers/api_scorers/answer_relevancy.py +2 -2
judgeval/scorers/judgeval_scorers/api_scorers/faithfulness.py +2 -10
judgeval/scorers/judgeval_scorers/api_scorers/instruction_adherence.py +2 -14
judgeval/scorers/judgeval_scorers/api_scorers/prompt_scorer.py +171 -59
judgeval/scorers/score.py +64 -47
judgeval/scorers/utils.py +2 -107
judgeval/tracer/__init__.py +1111 -2
judgeval/tracer/constants.py +1 -0
judgeval/tracer/exporters/__init__.py +40 -0
judgeval/tracer/exporters/s3.py +119 -0
judgeval/tracer/exporters/store.py +59 -0
judgeval/tracer/exporters/utils.py +32 -0
judgeval/tracer/keys.py +63 -0
judgeval/tracer/llm/__init__.py +7 -0
judgeval/tracer/llm/config.py +78 -0
judgeval/tracer/llm/constants.py +9 -0
judgeval/tracer/llm/llm_anthropic/__init__.py +3 -0
judgeval/tracer/llm/llm_anthropic/config.py +6 -0
judgeval/tracer/llm/llm_anthropic/messages.py +452 -0
judgeval/tracer/llm/llm_anthropic/messages_stream.py +322 -0
judgeval/tracer/llm/llm_anthropic/wrapper.py +59 -0
judgeval/tracer/llm/llm_google/__init__.py +3 -0
judgeval/tracer/llm/llm_google/config.py +6 -0
judgeval/tracer/llm/llm_google/generate_content.py +127 -0
judgeval/tracer/llm/llm_google/wrapper.py +30 -0
judgeval/tracer/llm/llm_openai/__init__.py +3 -0
judgeval/tracer/llm/llm_openai/beta_chat_completions.py +216 -0
judgeval/tracer/llm/llm_openai/chat_completions.py +501 -0
judgeval/tracer/llm/llm_openai/config.py +6 -0
judgeval/tracer/llm/llm_openai/responses.py +506 -0
judgeval/tracer/llm/llm_openai/utils.py +42 -0
judgeval/tracer/llm/llm_openai/wrapper.py +63 -0
judgeval/tracer/llm/llm_together/__init__.py +3 -0
judgeval/tracer/llm/llm_together/chat_completions.py +406 -0
judgeval/tracer/llm/llm_together/config.py +6 -0
judgeval/tracer/llm/llm_together/wrapper.py +52 -0
judgeval/tracer/llm/providers.py +19 -0
judgeval/tracer/managers.py +167 -0
judgeval/tracer/processors/__init__.py +220 -0
judgeval/tracer/utils.py +19 -0
judgeval/trainer/__init__.py +14 -0
judgeval/trainer/base_trainer.py +122 -0
judgeval/trainer/config.py +123 -0
judgeval/trainer/console.py +144 -0
judgeval/trainer/fireworks_trainer.py +392 -0
judgeval/trainer/trainable_model.py +252 -0
judgeval/trainer/trainer.py +70 -0
judgeval/utils/async_utils.py +39 -0
judgeval/utils/decorators/__init__.py +0 -0
judgeval/utils/decorators/dont_throw.py +37 -0
judgeval/utils/decorators/use_once.py +13 -0
judgeval/utils/file_utils.py +74 -28
judgeval/utils/guards.py +36 -0
judgeval/utils/meta.py +27 -0
judgeval/utils/project.py +15 -0
judgeval/utils/serialize.py +253 -0
judgeval/utils/testing.py +70 -0
judgeval/utils/url.py +10 -0
judgeval/{version_check.py → utils/version_check.py} +5 -3
judgeval/utils/wrappers/README.md +3 -0
judgeval/utils/wrappers/__init__.py +15 -0
judgeval/utils/wrappers/immutable_wrap_async.py +74 -0
judgeval/utils/wrappers/immutable_wrap_async_iterator.py +84 -0
judgeval/utils/wrappers/immutable_wrap_sync.py +66 -0
judgeval/utils/wrappers/immutable_wrap_sync_iterator.py +84 -0
judgeval/utils/wrappers/mutable_wrap_async.py +67 -0
judgeval/utils/wrappers/mutable_wrap_sync.py +67 -0
judgeval/utils/wrappers/py.typed +0 -0
judgeval/utils/wrappers/utils.py +35 -0
judgeval/v1/__init__.py +88 -0
judgeval/v1/data/__init__.py +7 -0
judgeval/v1/data/example.py +44 -0
judgeval/v1/data/scorer_data.py +42 -0
judgeval/v1/data/scoring_result.py +44 -0
judgeval/v1/datasets/__init__.py +6 -0
judgeval/v1/datasets/dataset.py +214 -0
judgeval/v1/datasets/dataset_factory.py +94 -0
judgeval/v1/evaluation/__init__.py +6 -0
judgeval/v1/evaluation/evaluation.py +182 -0
judgeval/v1/evaluation/evaluation_factory.py +17 -0
judgeval/v1/instrumentation/__init__.py +6 -0
judgeval/v1/instrumentation/llm/__init__.py +7 -0
judgeval/v1/instrumentation/llm/config.py +78 -0
judgeval/v1/instrumentation/llm/constants.py +11 -0
judgeval/v1/instrumentation/llm/llm_anthropic/__init__.py +5 -0
judgeval/v1/instrumentation/llm/llm_anthropic/config.py +6 -0
judgeval/v1/instrumentation/llm/llm_anthropic/messages.py +414 -0
judgeval/v1/instrumentation/llm/llm_anthropic/messages_stream.py +307 -0
judgeval/v1/instrumentation/llm/llm_anthropic/wrapper.py +61 -0
judgeval/v1/instrumentation/llm/llm_google/__init__.py +5 -0
judgeval/v1/instrumentation/llm/llm_google/config.py +6 -0
judgeval/v1/instrumentation/llm/llm_google/generate_content.py +121 -0
judgeval/v1/instrumentation/llm/llm_google/wrapper.py +30 -0
judgeval/v1/instrumentation/llm/llm_openai/__init__.py +5 -0
judgeval/v1/instrumentation/llm/llm_openai/beta_chat_completions.py +212 -0
judgeval/v1/instrumentation/llm/llm_openai/chat_completions.py +477 -0
judgeval/v1/instrumentation/llm/llm_openai/config.py +6 -0
judgeval/v1/instrumentation/llm/llm_openai/responses.py +472 -0
judgeval/v1/instrumentation/llm/llm_openai/utils.py +41 -0
judgeval/v1/instrumentation/llm/llm_openai/wrapper.py +63 -0
judgeval/v1/instrumentation/llm/llm_together/__init__.py +5 -0
judgeval/v1/instrumentation/llm/llm_together/chat_completions.py +382 -0
judgeval/v1/instrumentation/llm/llm_together/config.py +6 -0
judgeval/v1/instrumentation/llm/llm_together/wrapper.py +57 -0
judgeval/v1/instrumentation/llm/providers.py +19 -0
judgeval/v1/integrations/claude_agent_sdk/__init__.py +119 -0
judgeval/v1/integrations/claude_agent_sdk/wrapper.py +564 -0
judgeval/v1/integrations/langgraph/__init__.py +13 -0
judgeval/v1/integrations/openlit/__init__.py +47 -0
judgeval/v1/internal/api/__init__.py +525 -0
judgeval/v1/internal/api/api_types.py +413 -0
judgeval/v1/prompts/__init__.py +6 -0
judgeval/v1/prompts/prompt.py +29 -0
judgeval/v1/prompts/prompt_factory.py +189 -0
judgeval/v1/py.typed +0 -0
judgeval/v1/scorers/__init__.py +6 -0
judgeval/v1/scorers/api_scorer.py +82 -0
judgeval/v1/scorers/base_scorer.py +17 -0
judgeval/v1/scorers/built_in/__init__.py +17 -0
judgeval/v1/scorers/built_in/answer_correctness.py +28 -0
judgeval/v1/scorers/built_in/answer_relevancy.py +28 -0
judgeval/v1/scorers/built_in/built_in_factory.py +26 -0
judgeval/v1/scorers/built_in/faithfulness.py +28 -0
judgeval/v1/scorers/built_in/instruction_adherence.py +28 -0
judgeval/v1/scorers/custom_scorer/__init__.py +6 -0
judgeval/v1/scorers/custom_scorer/custom_scorer.py +50 -0
judgeval/v1/scorers/custom_scorer/custom_scorer_factory.py +16 -0
judgeval/v1/scorers/prompt_scorer/__init__.py +6 -0
judgeval/v1/scorers/prompt_scorer/prompt_scorer.py +86 -0
judgeval/v1/scorers/prompt_scorer/prompt_scorer_factory.py +85 -0
judgeval/v1/scorers/scorers_factory.py +49 -0
judgeval/v1/tracer/__init__.py +7 -0
judgeval/v1/tracer/base_tracer.py +520 -0
judgeval/v1/tracer/exporters/__init__.py +14 -0
judgeval/v1/tracer/exporters/in_memory_span_exporter.py +25 -0
judgeval/v1/tracer/exporters/judgment_span_exporter.py +42 -0
judgeval/v1/tracer/exporters/noop_span_exporter.py +19 -0
judgeval/v1/tracer/exporters/span_store.py +50 -0
judgeval/v1/tracer/judgment_tracer_provider.py +70 -0
judgeval/v1/tracer/processors/__init__.py +6 -0
judgeval/v1/tracer/processors/_lifecycles/__init__.py +28 -0
judgeval/v1/tracer/processors/_lifecycles/agent_id_processor.py +53 -0
judgeval/v1/tracer/processors/_lifecycles/context_keys.py +11 -0
judgeval/v1/tracer/processors/_lifecycles/customer_id_processor.py +29 -0
judgeval/v1/tracer/processors/_lifecycles/registry.py +18 -0
judgeval/v1/tracer/processors/judgment_span_processor.py +165 -0
judgeval/v1/tracer/processors/noop_span_processor.py +42 -0
judgeval/v1/tracer/tracer.py +67 -0
judgeval/v1/tracer/tracer_factory.py +38 -0
judgeval/v1/trainers/__init__.py +5 -0
judgeval/v1/trainers/base_trainer.py +62 -0
judgeval/v1/trainers/config.py +123 -0
judgeval/v1/trainers/console.py +144 -0
judgeval/v1/trainers/fireworks_trainer.py +392 -0
judgeval/v1/trainers/trainable_model.py +252 -0
judgeval/v1/trainers/trainers_factory.py +37 -0
judgeval/v1/utils.py +18 -0
judgeval/version.py +5 -0
judgeval/warnings.py +4 -0
judgeval-0.23.0.dist-info/METADATA +266 -0
judgeval-0.23.0.dist-info/RECORD +201 -0
judgeval-0.23.0.dist-info/entry_points.txt +2 -0
judgeval/clients.py +0 -34
judgeval/common/__init__.py +0 -13
judgeval/common/api/__init__.py +0 -3
judgeval/common/api/api.py +0 -352
judgeval/common/api/constants.py +0 -165
judgeval/common/exceptions.py +0 -27
judgeval/common/storage/__init__.py +0 -6
judgeval/common/storage/s3_storage.py +0 -98
judgeval/common/tracer/__init__.py +0 -31
judgeval/common/tracer/constants.py +0 -22
judgeval/common/tracer/core.py +0 -1916
judgeval/common/tracer/otel_exporter.py +0 -108
judgeval/common/tracer/otel_span_processor.py +0 -234
judgeval/common/tracer/span_processor.py +0 -37
judgeval/common/tracer/span_transformer.py +0 -211
judgeval/common/tracer/trace_manager.py +0 -92
judgeval/common/utils.py +0 -940
judgeval/data/datasets/__init__.py +0 -4
judgeval/data/datasets/dataset.py +0 -341
judgeval/data/datasets/eval_dataset_client.py +0 -214
judgeval/data/tool.py +0 -5
judgeval/data/trace_run.py +0 -37
judgeval/evaluation_run.py +0 -75
judgeval/integrations/langgraph.py +0 -843
judgeval/judges/mixture_of_judges.py +0 -286
judgeval/judgment_client.py +0 -369
judgeval/rules.py +0 -521
judgeval/run_evaluation.py +0 -684
judgeval/scorers/judgeval_scorers/api_scorers/derailment_scorer.py +0 -14
judgeval/scorers/judgeval_scorers/api_scorers/execution_order.py +0 -52
judgeval/scorers/judgeval_scorers/api_scorers/hallucination.py +0 -28
judgeval/scorers/judgeval_scorers/api_scorers/tool_dependency.py +0 -20
judgeval/scorers/judgeval_scorers/api_scorers/tool_order.py +0 -27
judgeval/utils/alerts.py +0 -93
judgeval/utils/requests.py +0 -50
judgeval-0.1.0.dist-info/METADATA +0 -202
judgeval-0.1.0.dist-info/RECORD +0 -73
{judgeval-0.1.0.dist-info → judgeval-0.23.0.dist-info}/WHEEL +0 -0
{judgeval-0.1.0.dist-info → judgeval-0.23.0.dist-info}/licenses/LICENSE.md +0 -0

judgeval/v1/scorers/api_scorer.py ADDED Viewed

@@ -0,0 +1,82 @@
+from __future__ import annotations
+from typing import Any, Dict, List, Optional
+from judgeval.v1.internal.api.api_types import ScorerConfig
+from judgeval.v1.scorers.base_scorer import BaseScorer
+class APIScorer(BaseScorer):
+    __slots__ = (
+        "_score_type",
+        "_required_params",
+        "_threshold",
+        "_name",
+        "_strict_mode",
+        "_model",
+        "_additional_properties",
+    )
+    def __init__(
+        self,
+        score_type: str,
+        required_params: Optional[List[str]] = None,
+        threshold: float = 0.5,
+        name: Optional[str] = None,
+        strict_mode: bool = False,
+        model: Optional[str] = None,
+        **additional_properties: Any,
+    ):
+        self._score_type = score_type
+        self._required_params = required_params or []
+        self._threshold = threshold
+        self._name = name or score_type
+        self._strict_mode = strict_mode
+        self._model = model
+        self._additional_properties = additional_properties
+    def get_name(self) -> str:
+        return self._name
+    def get_score_type(self) -> str:
+        return self._score_type
+    def get_threshold(self) -> float:
+        return self._threshold
+    def get_strict_mode(self) -> bool:
+        return self._strict_mode
+    def get_model(self) -> Optional[str]:
+        return self._model
+    def get_required_params(self) -> List[str]:
+        return self._required_params.copy()
+    def set_threshold(self, threshold: float) -> None:
+        if threshold < 0 or threshold > 1:
+            raise ValueError(f"Threshold must be between 0 and 1, got: {threshold}")
+        self._threshold = threshold
+    def set_name(self, name: str) -> None:
+        self._name = name
+    def set_strict_mode(self, strict_mode: bool) -> None:
+        self._strict_mode = strict_mode
+    def set_model(self, model: str) -> None:
+        self._model = model
+    def get_scorer_config(self) -> ScorerConfig:
+        kwargs: Dict[str, Any] = dict(self._additional_properties)
+        if self._model:
+            kwargs["model"] = self._model
+        return ScorerConfig(
+            score_type=self._score_type,
+            threshold=self._threshold,
+            name=self._name,
+            strict_mode=self._strict_mode,
+            required_params=self._required_params,
+            kwargs=kwargs,
+        )

judgeval/v1/scorers/base_scorer.py ADDED Viewed

@@ -0,0 +1,17 @@
+from __future__ import annotations
+from abc import ABC, abstractmethod
+from judgeval.v1.internal.api.api_types import ScorerConfig
+class BaseScorer(ABC):
+    __slots__ = ()
+    @abstractmethod
+    def get_name(self) -> str:
+        pass
+    @abstractmethod
+    def get_scorer_config(self) -> ScorerConfig:
+        pass

judgeval/v1/scorers/built_in/__init__.py ADDED Viewed

@@ -0,0 +1,17 @@
+from __future__ import annotations
+from judgeval.v1.scorers.built_in.answer_correctness import AnswerCorrectnessScorer
+from judgeval.v1.scorers.built_in.answer_relevancy import AnswerRelevancyScorer
+from judgeval.v1.scorers.built_in.built_in_factory import BuiltInScorersFactory
+from judgeval.v1.scorers.built_in.faithfulness import FaithfulnessScorer
+from judgeval.v1.scorers.built_in.instruction_adherence import (
+    InstructionAdherenceScorer,
+)
+__all__ = [
+    "AnswerCorrectnessScorer",
+    "AnswerRelevancyScorer",
+    "FaithfulnessScorer",
+    "InstructionAdherenceScorer",
+    "BuiltInScorersFactory",
+]

judgeval/v1/scorers/built_in/answer_correctness.py ADDED Viewed

@@ -0,0 +1,28 @@
+from __future__ import annotations
+from typing import Optional
+from judgeval.constants import APIScorerType
+from judgeval.v1.scorers.api_scorer import APIScorer
+class AnswerCorrectnessScorer(APIScorer):
+    def __init__(
+        self,
+        threshold: float = 0.5,
+        name: Optional[str] = None,
+        strict_mode: bool = False,
+        model: Optional[str] = None,
+    ):
+        super().__init__(
+            score_type=APIScorerType.ANSWER_CORRECTNESS.value,
+            required_params=["input", "actual_output", "expected_output"],
+            threshold=threshold,
+            name=name,
+            strict_mode=strict_mode,
+            model=model,
+        )
+    @staticmethod
+    def create(threshold: float = 0.5) -> AnswerCorrectnessScorer:
+        return AnswerCorrectnessScorer(threshold=threshold)

judgeval/v1/scorers/built_in/answer_relevancy.py ADDED Viewed

@@ -0,0 +1,28 @@
+from __future__ import annotations
+from typing import Optional
+from judgeval.constants import APIScorerType
+from judgeval.v1.scorers.api_scorer import APIScorer
+class AnswerRelevancyScorer(APIScorer):
+    def __init__(
+        self,
+        threshold: float = 0.5,
+        name: Optional[str] = None,
+        strict_mode: bool = False,
+        model: Optional[str] = None,
+    ):
+        super().__init__(
+            score_type=APIScorerType.ANSWER_RELEVANCY.value,
+            required_params=["input", "actual_output"],
+            threshold=threshold,
+            name=name,
+            strict_mode=strict_mode,
+            model=model,
+        )
+    @staticmethod
+    def create(threshold: float = 0.5) -> AnswerRelevancyScorer:
+        return AnswerRelevancyScorer(threshold=threshold)

judgeval/v1/scorers/built_in/built_in_factory.py ADDED Viewed

@@ -0,0 +1,26 @@
+from __future__ import annotations
+from judgeval.v1.scorers.built_in.answer_correctness import AnswerCorrectnessScorer
+from judgeval.v1.scorers.built_in.answer_relevancy import AnswerRelevancyScorer
+from judgeval.v1.scorers.built_in.faithfulness import FaithfulnessScorer
+from judgeval.v1.scorers.built_in.instruction_adherence import (
+    InstructionAdherenceScorer,
+)
+class BuiltInScorersFactory:
+    __slots__ = ()
+    def answer_correctness(self, threshold: float = 0.5) -> AnswerCorrectnessScorer:
+        return AnswerCorrectnessScorer.create(threshold)
+    def answer_relevancy(self, threshold: float = 0.5) -> AnswerRelevancyScorer:
+        return AnswerRelevancyScorer.create(threshold)
+    def faithfulness(self, threshold: float = 0.5) -> FaithfulnessScorer:
+        return FaithfulnessScorer.create(threshold)
+    def instruction_adherence(
+        self, threshold: float = 0.5
+    ) -> InstructionAdherenceScorer:
+        return InstructionAdherenceScorer.create(threshold)

judgeval/v1/scorers/built_in/faithfulness.py ADDED Viewed

@@ -0,0 +1,28 @@
+from __future__ import annotations
+from typing import Optional
+from judgeval.constants import APIScorerType
+from judgeval.v1.scorers.api_scorer import APIScorer
+class FaithfulnessScorer(APIScorer):
+    def __init__(
+        self,
+        threshold: float = 0.5,
+        name: Optional[str] = None,
+        strict_mode: bool = False,
+        model: Optional[str] = None,
+    ):
+        super().__init__(
+            score_type=APIScorerType.FAITHFULNESS.value,
+            required_params=["context", "actual_output"],
+            threshold=threshold,
+            name=name,
+            strict_mode=strict_mode,
+            model=model,
+        )
+    @staticmethod
+    def create(threshold: float = 0.5) -> FaithfulnessScorer:
+        return FaithfulnessScorer(threshold=threshold)

judgeval/v1/scorers/built_in/instruction_adherence.py ADDED Viewed

@@ -0,0 +1,28 @@
+from __future__ import annotations
+from typing import Optional
+from judgeval.constants import APIScorerType
+from judgeval.v1.scorers.api_scorer import APIScorer
+class InstructionAdherenceScorer(APIScorer):
+    def __init__(
+        self,
+        threshold: float = 0.5,
+        name: Optional[str] = None,
+        strict_mode: bool = False,
+        model: Optional[str] = None,
+    ):
+        super().__init__(
+            score_type=APIScorerType.INSTRUCTION_ADHERENCE.value,
+            required_params=["input", "actual_output"],
+            threshold=threshold,
+            name=name,
+            strict_mode=strict_mode,
+            model=model,
+        )
+    @staticmethod
+    def create(threshold: float = 0.5) -> InstructionAdherenceScorer:
+        return InstructionAdherenceScorer(threshold=threshold)

judgeval/v1/scorers/custom_scorer/__init__.py ADDED Viewed

@@ -0,0 +1,6 @@
+from __future__ import annotations
+from judgeval.v1.scorers.custom_scorer.custom_scorer import CustomScorer
+from judgeval.v1.scorers.custom_scorer.custom_scorer_factory import CustomScorerFactory
+__all__ = ["CustomScorer", "CustomScorerFactory"]

judgeval/v1/scorers/custom_scorer/custom_scorer.py ADDED Viewed

@@ -0,0 +1,50 @@
+from __future__ import annotations
+from typing import TYPE_CHECKING
+from judgeval.constants import APIScorerType
+if TYPE_CHECKING:
+    from judgeval.v1.internal.api.api_types import (
+        BaseScorer as BaseScorerDict,
+        ScorerConfig,
+    )
+from judgeval.v1.scorers.base_scorer import BaseScorer
+class CustomScorer(BaseScorer):
+    __slots__ = (
+        "_name",
+        "_class_name",
+        "_server_hosted",
+    )
+    def __init__(
+        self,
+        name: str,
+        class_name: str = "",
+        server_hosted: bool = True,
+    ):
+        self._name = name
+        self._class_name = class_name or name
+        self._server_hosted = server_hosted
+    def get_name(self) -> str:
+        return self._name
+    def get_class_name(self) -> str:
+        return self._class_name
+    def is_server_hosted(self) -> bool:
+        return self._server_hosted
+    def get_scorer_config(self) -> ScorerConfig:
+        raise NotImplementedError("CustomScorer does not use get_scorer_config")
+    def to_dict(self) -> BaseScorerDict:
+        return {
+            "score_type": APIScorerType.CUSTOM.value,
+            "name": self._name,
+            "class_name": self._class_name,
+            "server_hosted": self._server_hosted,
+        }

judgeval/v1/scorers/custom_scorer/custom_scorer_factory.py ADDED Viewed

@@ -0,0 +1,16 @@
+from __future__ import annotations
+from typing import Optional
+from judgeval.v1.scorers.custom_scorer.custom_scorer import CustomScorer
+class CustomScorerFactory:
+    __slots__ = ()
+    def get(self, name: str, class_name: Optional[str] = None) -> CustomScorer:
+        return CustomScorer(
+            name=name,
+            class_name=class_name or name,
+            server_hosted=True,
+        )

judgeval/v1/scorers/prompt_scorer/__init__.py ADDED Viewed

@@ -0,0 +1,6 @@
+from __future__ import annotations
+from judgeval.v1.scorers.prompt_scorer.prompt_scorer import PromptScorer
+from judgeval.v1.scorers.prompt_scorer.prompt_scorer_factory import PromptScorerFactory
+__all__ = ["PromptScorer", "PromptScorerFactory"]

judgeval/v1/scorers/prompt_scorer/prompt_scorer.py ADDED Viewed

@@ -0,0 +1,86 @@
+from __future__ import annotations
+from typing import Any, Dict, Optional
+from judgeval.constants import APIScorerType
+from judgeval.v1.internal.api.api_types import ScorerConfig
+from judgeval.v1.scorers.api_scorer import APIScorer
+class PromptScorer(APIScorer):
+    __slots__ = (
+        "_prompt",
+        "_options",
+        "_description",
+        "_judgment_api_key",
+        "_organization_id",
+        "_is_trace",
+    )
+    def __init__(
+        self,
+        name: str,
+        prompt: str,
+        threshold: float = 0.5,
+        options: Optional[Dict[str, float]] = None,
+        model: Optional[str] = None,
+        description: Optional[str] = None,
+        judgment_api_key: str = "",
+        organization_id: str = "",
+        is_trace: bool = False,
+    ):
+        score_type = (
+            APIScorerType.TRACE_PROMPT_SCORER
+            if is_trace
+            else APIScorerType.PROMPT_SCORER
+        )
+        super().__init__(
+            score_type=score_type,
+            threshold=threshold,
+            name=name,
+            model=model,
+        )
+        self._prompt = prompt
+        self._options = options.copy() if options else None
+        self._description = description
+        self._judgment_api_key = judgment_api_key
+        self._organization_id = organization_id
+        self._is_trace = is_trace
+    def get_prompt(self) -> str:
+        return self._prompt
+    def get_options(self) -> Optional[Dict[str, float]]:
+        return self._options.copy() if self._options else None
+    def get_description(self) -> Optional[str]:
+        return self._description
+    def set_prompt(self, prompt: str) -> None:
+        self._prompt = prompt
+    def set_options(self, options: Dict[str, float]) -> None:
+        self._options = options.copy()
+    def set_description(self, description: str) -> None:
+        self._description = description
+    def append_to_prompt(self, addition: str) -> None:
+        self._prompt = self._prompt + addition
+    def get_scorer_config(self) -> ScorerConfig:
+        kwargs: Dict[str, Any] = {"prompt": self._prompt}
+        if self._options:
+            kwargs["options"] = self._options
+        if self._model:
+            kwargs["model"] = self._model
+        if self._description:
+            kwargs["description"] = self._description
+        return ScorerConfig(
+            score_type=self._score_type,
+            threshold=self._threshold,
+            name=self._name,
+            kwargs=kwargs,
+        )

judgeval/v1/scorers/prompt_scorer/prompt_scorer_factory.py ADDED Viewed

@@ -0,0 +1,85 @@
+from __future__ import annotations
+from typing import Dict, Tuple
+from judgeval.v1.internal.api import JudgmentSyncClient
+from judgeval.v1.internal.api.api_types import (
+    FetchPromptScorersRequest,
+    FetchPromptScorersResponse,
+    PromptScorer as APIPromptScorer,
+)
+from judgeval.exceptions import JudgmentAPIError
+from judgeval.v1.scorers.prompt_scorer.prompt_scorer import PromptScorer
+class PromptScorerFactory:
+    __slots__ = ("_client", "_is_trace")
+    _cache: Dict[Tuple[str, str, str, bool], APIPromptScorer] = {}
+    def __init__(
+        self,
+        client: JudgmentSyncClient,
+        is_trace: bool,
+    ):
+        self._client = client
+        self._is_trace = is_trace
+    def get(self, name: str) -> PromptScorer:
+        cache_key = (
+            name,
+            self._client.organization_id,
+            self._client.api_key,
+            self._is_trace,
+        )
+        cached = self._cache.get(cache_key)
+        if cached is None:
+            request: FetchPromptScorersRequest = {"names": [name]}
+            if self._is_trace is not None:
+                request["is_trace"] = self._is_trace
+            try:
+                response: FetchPromptScorersResponse = self._client.fetch_scorers(
+                    request
+                )
+                scorers = response.get("scorers", [])
+                if not scorers:
+                    raise JudgmentAPIError(
+                        404, f"Failed to fetch prompt scorer '{name}': not found", None
+                    )
+                scorer = scorers[0]
+                scorer_is_trace = scorer.get("is_trace", False)
+                if scorer_is_trace != self._is_trace:
+                    expected_type = (
+                        "TracePromptScorer" if self._is_trace else "PromptScorer"
+                    )
+                    actual_type = (
+                        "TracePromptScorer" if scorer_is_trace else "PromptScorer"
+                    )
+                    raise JudgmentAPIError(
+                        400,
+                        f"Scorer with name {name} is a {actual_type}, not a {expected_type}",
+                        None,
+                    )
+                self._cache[cache_key] = scorer
+                cached = scorer
+            except JudgmentAPIError:
+                raise
+            except Exception as e:
+                raise JudgmentAPIError(
+                    500, f"Failed to fetch prompt scorer '{name}': {e}", None
+                )
+        return PromptScorer(
+            name=name,
+            prompt=cached.get("prompt", ""),
+            threshold=cached.get("threshold", 0.5),
+            options=cached.get("options"),
+            model=cached.get("model"),
+            description=cached.get("description"),
+            is_trace=self._is_trace,
+        )

judgeval/v1/scorers/scorers_factory.py ADDED Viewed

@@ -0,0 +1,49 @@
+from __future__ import annotations
+from judgeval.v1.internal.api import JudgmentSyncClient
+class ScorersFactory:
+    __slots__ = "_client"
+    def __init__(
+        self,
+        client: JudgmentSyncClient,
+    ):
+        self._client = client
+    @property
+    def prompt_scorer(self):
+        from judgeval.v1.scorers.prompt_scorer.prompt_scorer_factory import (
+            PromptScorerFactory,
+        )
+        return PromptScorerFactory(
+            client=self._client,
+            is_trace=False,
+        )
+    @property
+    def trace_prompt_scorer(self):
+        from judgeval.v1.scorers.prompt_scorer.prompt_scorer_factory import (
+            PromptScorerFactory,
+        )
+        return PromptScorerFactory(
+            client=self._client,
+            is_trace=True,
+        )
+    @property
+    def custom_scorer(self):
+        from judgeval.v1.scorers.custom_scorer.custom_scorer_factory import (
+            CustomScorerFactory,
+        )
+        return CustomScorerFactory()
+    @property
+    def built_in(self):
+        from judgeval.v1.scorers.built_in.built_in_factory import BuiltInScorersFactory
+        return BuiltInScorersFactory()

judgeval/v1/tracer/__init__.py ADDED Viewed

@@ -0,0 +1,7 @@
+from __future__ import annotations
+from judgeval.v1.tracer.base_tracer import BaseTracer
+from judgeval.v1.tracer.tracer import Tracer
+from judgeval.v1.tracer.tracer_factory import TracerFactory
+__all__ = ["BaseTracer", "Tracer", "TracerFactory"]

judgeval 0.1.0__py3-none-any.whl → 0.23.0__py3-none-any.whl

judgeval 0.1.0py3-none-any.whl → 0.23.0py3-none-any.whl