PyPI - judgeval - Versions diffs - 0.0.51__py3-none-any.whl → 0.0.53__py3-none-any.whl - Mend

judgeval 0.0.51py3-none-any.whl → 0.0.53py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

judgeval/common/logger.py +46 -199
judgeval/common/s3_storage.py +2 -6
judgeval/common/tracer.py +182 -262
judgeval/common/utils.py +16 -36
judgeval/constants.py +14 -20
judgeval/data/__init__.py +0 -2
judgeval/data/datasets/dataset.py +6 -10
judgeval/data/datasets/eval_dataset_client.py +25 -27
judgeval/data/example.py +5 -138
judgeval/data/judgment_types.py +214 -0
judgeval/data/result.py +7 -25
judgeval/data/scorer_data.py +28 -40
judgeval/data/scripts/fix_default_factory.py +23 -0
judgeval/data/scripts/openapi_transform.py +123 -0
judgeval/data/tool.py +3 -54
judgeval/data/trace.py +31 -50
judgeval/data/trace_run.py +3 -3
judgeval/evaluation_run.py +16 -23
judgeval/integrations/langgraph.py +11 -12
judgeval/judges/litellm_judge.py +3 -6
judgeval/judges/mixture_of_judges.py +8 -25
judgeval/judges/together_judge.py +3 -6
judgeval/judgment_client.py +22 -24
judgeval/rules.py +7 -19
judgeval/run_evaluation.py +79 -242
judgeval/scorers/__init__.py +4 -20
judgeval/scorers/agent_scorer.py +21 -0
judgeval/scorers/api_scorer.py +28 -38
judgeval/scorers/base_scorer.py +98 -0
judgeval/scorers/example_scorer.py +19 -0
judgeval/scorers/judgeval_scorers/api_scorers/__init__.py +0 -20
judgeval/scorers/judgeval_scorers/api_scorers/answer_correctness.py +10 -17
judgeval/scorers/judgeval_scorers/api_scorers/answer_relevancy.py +9 -24
judgeval/scorers/judgeval_scorers/api_scorers/classifier_scorer.py +16 -68
judgeval/scorers/judgeval_scorers/api_scorers/derailment_scorer.py +4 -12
judgeval/scorers/judgeval_scorers/api_scorers/execution_order.py +4 -4
judgeval/scorers/judgeval_scorers/api_scorers/faithfulness.py +10 -17
judgeval/scorers/judgeval_scorers/api_scorers/hallucination.py +4 -4
judgeval/scorers/judgeval_scorers/api_scorers/instruction_adherence.py +4 -4
judgeval/scorers/judgeval_scorers/api_scorers/tool_dependency.py +4 -4
judgeval/scorers/judgeval_scorers/api_scorers/tool_order.py +18 -14
judgeval/scorers/score.py +45 -330
judgeval/scorers/utils.py +6 -88
judgeval/utils/file_utils.py +4 -6
judgeval/version_check.py +3 -2
{judgeval-0.0.51.dist-info → judgeval-0.0.53.dist-info}/METADATA +3 -2
judgeval-0.0.53.dist-info/RECORD +65 -0
judgeval/data/custom_example.py +0 -19
judgeval/scorers/judgeval_scorer.py +0 -177
judgeval/scorers/judgeval_scorers/api_scorers/comparison.py +0 -45
judgeval/scorers/judgeval_scorers/api_scorers/contextual_precision.py +0 -29
judgeval/scorers/judgeval_scorers/api_scorers/contextual_recall.py +0 -29
judgeval/scorers/judgeval_scorers/api_scorers/contextual_relevancy.py +0 -32
judgeval/scorers/judgeval_scorers/api_scorers/groundedness.py +0 -28
judgeval/scorers/judgeval_scorers/api_scorers/json_correctness.py +0 -38
judgeval/scorers/judgeval_scorers/api_scorers/summarization.py +0 -27
judgeval/scorers/prompt_scorer.py +0 -296
judgeval-0.0.51.dist-info/RECORD +0 -69
{judgeval-0.0.51.dist-info → judgeval-0.0.53.dist-info}/WHEEL +0 -0
{judgeval-0.0.51.dist-info → judgeval-0.0.53.dist-info}/licenses/LICENSE.md +0 -0

judgeval/common/logger.py CHANGED Viewed

@@ -1,213 +1,60 @@
+# logger.py
 import logging
-from logging.handlers import RotatingFileHandler
 import sys
-from pathlib import Path
-from contextlib import contextmanager
-# Global variables
-logger = None
-class LoggingState:
-    enabled: bool = False
-    path: str | None = None
-LOGGING_STATE = LoggingState()
+import os
-# Add these as module-level variables
-current_example_id = None
-current_timestamp = None
-@contextmanager
-def enable_logging(
-    name: str = "judgeval",
-    path: str = "./logs",
-    max_bytes: int = 1024 * 1024,
-    backup_count: int = 5,
-):
-    """
-    Context manager to temporarily enable logging for a specific block of code.
-    """
-    global logger
-    LOGGING_STATE.enabled = True
-    LOGGING_STATE.path = path
-    # Initialize logger if not already initialized
-    if logger is None:
-        logger = _initialize_logger(
-            name=name, path=path, max_bytes=max_bytes, backup_count=backup_count
-        )
-    try:
-        logger.info("Logging enabled")
-        yield
-    finally:
-        logger.info("Logging disabled")
-        LOGGING_STATE.enabled = False
-        LOGGING_STATE.path = None
+# ANSI escape sequences
+RESET = "\033[0m"
+RED = "\033[31m"
+YELLOW = "\033[33m"
+BLUE = "\033[34m"
+GRAY = "\033[90m"
-def _initialize_logger(
-    name: str = "judgeval",
-    max_bytes: int = 1024 * 1024,  # 1MB
-    backup_count: int = 5,
-    path: str = "./logs",  # Added path parameter with default
-) -> logging.Logger:
+class ColorFormatter(logging.Formatter):
     """
-    Initialize the global logger instance if it doesn't exist.
-    Returns the global logger instance.
+    Wrap the final formatted log record in ANSI color codes based on level.
     """
-    global logger
-    log_dir = Path(path)
-    log_dir.mkdir(exist_ok=True, parents=True)
-    log_file = log_dir / f"{name}.log"
-    if log_file.exists():
-        log_file.unlink()  # Delete existing log file
-    if logger is not None:
-        return logger
-    # Create logs directory if it doesn't exist
-    log_dir = Path(path)
-    log_dir.mkdir(exist_ok=True)
-    # Create a custom formatter that includes example info when available
-    class ExampleFormatter(logging.Formatter):
-        def format(self, record):
-            if current_example_id is not None and current_timestamp is not None:
-                record.example_id = current_example_id
-                record.timestamp = current_timestamp
-                return logging.Formatter(
-                    "%(asctime)s - %(name)s - %(levelname)s - [Example_%(example_id)s][%(timestamp)s] %(message)s",
-                    datefmt="%Y-%m-%d %H:%M:%S",
-                ).format(record)
-            return logging.Formatter(
-                "%(asctime)s - %(name)s - %(levelname)s - %(message)s",
-                datefmt="%Y-%m-%d %H:%M:%S",
-            ).format(record)
-    # Use the custom formatter
-    console_handler = logging.StreamHandler(sys.stdout)
-    console_handler.setFormatter(ExampleFormatter())
-    console_handler.setLevel(logging.DEBUG)
-    log_filename = f"{name}.log"
-    file_handler = RotatingFileHandler(
-        log_dir / log_filename, maxBytes=max_bytes, backupCount=backup_count, mode="a"
+    COLORS = {
+        logging.DEBUG: GRAY,
+        logging.INFO: GRAY,
+        logging.WARNING: YELLOW,
+        logging.ERROR: RED,
+        logging.CRITICAL: RED,
+    }
+    def __init__(self, fmt=None, datefmt=None, use_color=True):
+        super().__init__(fmt=fmt, datefmt=datefmt)
+        self.use_color = use_color and sys.stdout.isatty()
+    def format(self, record):
+        message = super().format(record)
+        if self.use_color:
+            color = self.COLORS.get(record.levelno, "")
+            if color:
+                message = f"{color}{message}{RESET}"
+        return message
+def _setup_judgeval_logger():
+    use_color = sys.stdout.isatty() and os.getenv("NO_COLOR") is None
+    handler = logging.StreamHandler(sys.stdout)
+    handler.setLevel(logging.DEBUG)
+    handler.setFormatter(
+        ColorFormatter(
+            fmt="%(asctime)s - %(name)s - %(levelname)s - %(message)s",
+            datefmt="%Y-%m-%d %H:%M:%S",
+            use_color=use_color,
+        )
     )
-    file_handler.setFormatter(ExampleFormatter())
-    file_handler.setLevel(logging.DEBUG)
-    # Get logger
-    logger = logging.getLogger(name)
+    logger = logging.getLogger("judgeval")
     logger.setLevel(logging.DEBUG)
-    # Prevent adding handlers multiple times
-    if not logger.handlers:
-        logger.addHandler(console_handler)
-        logger.addHandler(file_handler)
+    logger.addHandler(handler)
     return logger
-# Initialize the global logger when module is imported
-# logger = _initialize_logger()
-def log_if_enabled(func):
-    """Decorator to check if logging is enabled before executing logging statements"""
-    def wrapper(*args, **kwargs):
-        if LOGGING_STATE.enabled:
-            return func(*args, **kwargs)
-    return wrapper
-@log_if_enabled
-def debug(msg: str, example_idx: int | None = None):
-    """Log debug message if logging is enabled"""
-    if logger:
-        logger.debug(msg)
-@log_if_enabled
-def info(msg: str, example_idx: int | None = None):
-    """Log info message if logging is enabled"""
-    if logger:
-        logger.info(msg)
-@log_if_enabled
-def warning(msg: str, example_idx: int | None = None):
-    """Log warning message if logging is enabled"""
-    if logger:
-        logger.warning(msg)
-@log_if_enabled
-def error(msg: str, example_idx: int | None = None):
-    """Log error message if logging is enabled"""
-    if logger:
-        logger.error(msg)
-def create_example_handler(
-    timestamp: str,
-    example_idx: int,
-    path: str = "./logs",  # Added path parameter with default
-) -> RotatingFileHandler:
-    """Creates a file handler for a specific example"""
-    debug(
-        f"Creating example handler for timestamp={timestamp}, example_idx={example_idx}"
-    )
-    log_dir = Path(path) / "examples"
-    log_dir.mkdir(exist_ok=True, parents=True)
-    formatter = logging.Formatter(
-        fmt="%(asctime)s - %(name)s - %(levelname)s - [Example_%(example_id)s][%(timestamp)s] %(message)s",
-        datefmt="%Y-%m-%d %H:%M:%S",
-    )
-    # Create a unique file for each example
-    file_handler = RotatingFileHandler(
-        log_dir / f"{timestamp}_example_{example_idx}.log",
-        maxBytes=1024 * 1024,  # 1MB
-        backupCount=5,
-        mode="a",
-    )
-    file_handler.setFormatter(formatter)
-    file_handler.setLevel(logging.DEBUG)
-    info(f"Created example handler for example {example_idx}")
-    return file_handler
-@contextmanager
-def example_logging_context(timestamp: str, example_idx: int):
-    """Context manager for example-specific logging"""
-    if not LOGGING_STATE.enabled:
-        yield
-        return
-    global current_example_id, current_timestamp
-    debug(f"Entering example logging context for example {example_idx}")
-    current_example_id = example_idx
-    current_timestamp = timestamp
-    if LOGGING_STATE.path:
-        handler = create_example_handler(
-            timestamp, example_idx, path=LOGGING_STATE.path
-        )
-    if handler and logger:
-        logger.addHandler(handler)
-    try:
-        yield
-    finally:
-        current_example_id = None
-        current_timestamp = None
-        if handler and logger:
-            logger.removeHandler(handler)
-            handler.close()
-            debug(f"Closed example handler for example {example_idx}")
+# Global logger you can import elsewhere
+judgeval_logger = _setup_judgeval_logger()

judgeval/common/s3_storage.py CHANGED Viewed

@@ -4,7 +4,7 @@ import boto3
 from typing import Optional
 from datetime import datetime, UTC
 from botocore.exceptions import ClientError
-from judgeval.common.logger import warning, info
+from judgeval.common.logger import judgeval_logger
 class S3Storage:
@@ -42,7 +42,6 @@ class S3Storage:
             error_code = e.response["Error"]["Code"]
             if error_code == "404":
                 # Bucket doesn't exist, create it
-                info(f"Bucket {self.bucket_name} doesn't exist, creating it ...")
                 try:
                     self.s3_client.create_bucket(
                         Bucket=self.bucket_name,
@@ -52,14 +51,13 @@ class S3Storage:
                     ) if self.s3_client.meta.region_name != "us-east-1" else self.s3_client.create_bucket(
                         Bucket=self.bucket_name
                     )
-                    info(f"Created S3 bucket: {self.bucket_name}")
                 except ClientError as create_error:
                     if (
                         create_error.response["Error"]["Code"]
                         == "BucketAlreadyOwnedByYou"
                     ):
                         # Bucket was just created by another process
-                        warning(
+                        judgeval_logger.warning(
                             f"Bucket {self.bucket_name} was just created by another process"
                         )
                         pass
@@ -90,8 +88,6 @@ class S3Storage:
         # Convert trace data to JSON string
         trace_json = json.dumps(trace_data)
-        # Upload to S3
-        info(f"Uploading trace to S3 at key {s3_key}, in bucket {self.bucket_name} ...")
         self.s3_client.put_object(
             Bucket=self.bucket_name,
             Key=s3_key,

judgeval 0.0.51__py3-none-any.whl → 0.0.53__py3-none-any.whl

judgeval 0.0.51py3-none-any.whl → 0.0.53py3-none-any.whl