PyPI - sdg-hub - Versions diffs - 0.1.4__py3-none-any.whl → 0.2.0__py3-none-any.whl - Mend

sdg-hub 0.1.4py3-none-any.whl → 0.2.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (139) hide show

sdg_hub/__init__.py +28 -1
sdg_hub/_version.py +2 -2
sdg_hub/core/__init__.py +22 -0
sdg_hub/core/blocks/__init__.py +58 -0
sdg_hub/core/blocks/base.py +313 -0
sdg_hub/core/blocks/deprecated_blocks/__init__.py +29 -0
sdg_hub/core/blocks/deprecated_blocks/combine_columns.py +93 -0
sdg_hub/core/blocks/deprecated_blocks/duplicate_columns.py +88 -0
sdg_hub/core/blocks/deprecated_blocks/filter_by_value.py +103 -0
sdg_hub/core/blocks/deprecated_blocks/flatten_columns.py +94 -0
sdg_hub/core/blocks/deprecated_blocks/llmblock.py +479 -0
sdg_hub/core/blocks/deprecated_blocks/rename_columns.py +88 -0
sdg_hub/core/blocks/deprecated_blocks/sample_populator.py +58 -0
sdg_hub/core/blocks/deprecated_blocks/selector.py +97 -0
sdg_hub/core/blocks/deprecated_blocks/set_to_majority_value.py +88 -0
sdg_hub/core/blocks/evaluation/__init__.py +9 -0
sdg_hub/core/blocks/evaluation/evaluate_faithfulness_block.py +564 -0
sdg_hub/core/blocks/evaluation/evaluate_relevancy_block.py +564 -0
sdg_hub/core/blocks/evaluation/verify_question_block.py +564 -0
sdg_hub/core/blocks/filtering/__init__.py +12 -0
sdg_hub/core/blocks/filtering/column_value_filter.py +188 -0
sdg_hub/core/blocks/llm/__init__.py +25 -0
sdg_hub/core/blocks/llm/client_manager.py +398 -0
sdg_hub/core/blocks/llm/config.py +336 -0
sdg_hub/core/blocks/llm/error_handler.py +368 -0
sdg_hub/core/blocks/llm/llm_chat_block.py +542 -0
sdg_hub/core/blocks/llm/prompt_builder_block.py +368 -0
sdg_hub/core/blocks/llm/text_parser_block.py +310 -0
sdg_hub/core/blocks/registry.py +331 -0
sdg_hub/core/blocks/transform/__init__.py +23 -0
sdg_hub/core/blocks/transform/duplicate_columns.py +88 -0
sdg_hub/core/blocks/transform/index_based_mapper.py +225 -0
sdg_hub/core/blocks/transform/melt_columns.py +126 -0
sdg_hub/core/blocks/transform/rename_columns.py +69 -0
sdg_hub/core/blocks/transform/text_concat.py +102 -0
sdg_hub/core/blocks/transform/uniform_col_val_setter.py +101 -0
sdg_hub/core/flow/__init__.py +20 -0
sdg_hub/core/flow/base.py +980 -0
sdg_hub/core/flow/metadata.py +344 -0
sdg_hub/core/flow/migration.py +187 -0
sdg_hub/core/flow/registry.py +330 -0
sdg_hub/core/flow/validation.py +265 -0
sdg_hub/{utils → core/utils}/__init__.py +6 -4
sdg_hub/{utils → core/utils}/datautils.py +1 -3
sdg_hub/core/utils/error_handling.py +208 -0
sdg_hub/{utils → core/utils}/path_resolution.py +2 -2
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/atomic_facts.yaml +40 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/detailed_summary.yaml +13 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/evaluate_faithfulness.yaml +64 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/evaluate_question.yaml +29 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/evaluate_relevancy.yaml +81 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/extractive_summary.yaml +13 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/flow.yaml +191 -0
sdg_hub/flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/generate_questions_responses.yaml +54 -0
sdg_hub-0.2.0.dist-info/METADATA +218 -0
sdg_hub-0.2.0.dist-info/RECORD +63 -0
sdg_hub/blocks/__init__.py +0 -42
sdg_hub/blocks/block.py +0 -96
sdg_hub/blocks/llmblock.py +0 -375
sdg_hub/blocks/openaichatblock.py +0 -556
sdg_hub/blocks/utilblocks.py +0 -597
sdg_hub/checkpointer.py +0 -139
sdg_hub/configs/annotations/cot_reflection.yaml +0 -34
sdg_hub/configs/annotations/detailed_annotations.yaml +0 -28
sdg_hub/configs/annotations/detailed_description.yaml +0 -10
sdg_hub/configs/annotations/detailed_description_icl.yaml +0 -32
sdg_hub/configs/annotations/simple_annotations.yaml +0 -9
sdg_hub/configs/knowledge/__init__.py +0 -0
sdg_hub/configs/knowledge/atomic_facts.yaml +0 -46
sdg_hub/configs/knowledge/auxilary_instructions.yaml +0 -35
sdg_hub/configs/knowledge/detailed_summary.yaml +0 -18
sdg_hub/configs/knowledge/evaluate_faithfulness.yaml +0 -68
sdg_hub/configs/knowledge/evaluate_question.yaml +0 -38
sdg_hub/configs/knowledge/evaluate_relevancy.yaml +0 -84
sdg_hub/configs/knowledge/extractive_summary.yaml +0 -18
sdg_hub/configs/knowledge/generate_code_questions_responses.yaml +0 -39
sdg_hub/configs/knowledge/generate_questions.yaml +0 -82
sdg_hub/configs/knowledge/generate_questions_responses.yaml +0 -56
sdg_hub/configs/knowledge/generate_responses.yaml +0 -86
sdg_hub/configs/knowledge/mcq_generation.yaml +0 -83
sdg_hub/configs/knowledge/router.yaml +0 -12
sdg_hub/configs/knowledge/simple_generate_qa.yaml +0 -34
sdg_hub/configs/reasoning/__init__.py +0 -0
sdg_hub/configs/reasoning/dynamic_cot.yaml +0 -40
sdg_hub/configs/skills/__init__.py +0 -0
sdg_hub/configs/skills/analyzer.yaml +0 -48
sdg_hub/configs/skills/annotation.yaml +0 -36
sdg_hub/configs/skills/contexts.yaml +0 -28
sdg_hub/configs/skills/critic.yaml +0 -60
sdg_hub/configs/skills/evaluate_freeform_pair.yaml +0 -111
sdg_hub/configs/skills/evaluate_freeform_questions.yaml +0 -78
sdg_hub/configs/skills/evaluate_grounded_pair.yaml +0 -119
sdg_hub/configs/skills/evaluate_grounded_questions.yaml +0 -51
sdg_hub/configs/skills/freeform_questions.yaml +0 -34
sdg_hub/configs/skills/freeform_responses.yaml +0 -39
sdg_hub/configs/skills/grounded_questions.yaml +0 -38
sdg_hub/configs/skills/grounded_responses.yaml +0 -59
sdg_hub/configs/skills/icl_examples/STEM.yaml +0 -56
sdg_hub/configs/skills/icl_examples/__init__.py +0 -0
sdg_hub/configs/skills/icl_examples/coding.yaml +0 -97
sdg_hub/configs/skills/icl_examples/extraction.yaml +0 -36
sdg_hub/configs/skills/icl_examples/humanities.yaml +0 -71
sdg_hub/configs/skills/icl_examples/math.yaml +0 -85
sdg_hub/configs/skills/icl_examples/reasoning.yaml +0 -30
sdg_hub/configs/skills/icl_examples/roleplay.yaml +0 -45
sdg_hub/configs/skills/icl_examples/writing.yaml +0 -80
sdg_hub/configs/skills/judge.yaml +0 -53
sdg_hub/configs/skills/planner.yaml +0 -67
sdg_hub/configs/skills/respond.yaml +0 -8
sdg_hub/configs/skills/revised_responder.yaml +0 -78
sdg_hub/configs/skills/router.yaml +0 -59
sdg_hub/configs/skills/simple_generate_qa_freeform.yaml +0 -27
sdg_hub/configs/skills/simple_generate_qa_grounded.yaml +0 -31
sdg_hub/flow.py +0 -477
sdg_hub/flow_runner.py +0 -450
sdg_hub/flows/generation/knowledge/mmlu_bench.yaml +0 -13
sdg_hub/flows/generation/knowledge/simple_knowledge.yaml +0 -12
sdg_hub/flows/generation/knowledge/synth_knowledge.yaml +0 -89
sdg_hub/flows/generation/knowledge/synth_knowledge1.5.yaml +0 -136
sdg_hub/flows/generation/skills/improve_responses.yaml +0 -103
sdg_hub/flows/generation/skills/simple_freeform_skill.yaml +0 -12
sdg_hub/flows/generation/skills/simple_grounded_skill.yaml +0 -12
sdg_hub/flows/generation/skills/synth_grounded_skills.yaml +0 -80
sdg_hub/flows/generation/skills/synth_skills.yaml +0 -59
sdg_hub/pipeline.py +0 -121
sdg_hub/prompts.py +0 -80
sdg_hub/registry.py +0 -122
sdg_hub/sdg.py +0 -206
sdg_hub/utils/config_validation.py +0 -91
sdg_hub/utils/error_handling.py +0 -94
sdg_hub/utils/validation_result.py +0 -10
sdg_hub-0.1.4.dist-info/METADATA +0 -190
sdg_hub-0.1.4.dist-info/RECORD +0 -89
sdg_hub/{logger_config.py → core/utils/logger_config.py} +1 -1
/sdg_hub/{configs/__init__.py → flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab/README.md} +0 -0
/sdg_hub/{configs/annotations → flows/qa_generation/document_grounded_qa/multi_summary_qa/instructlab}/__init__.py +0 -0
{sdg_hub-0.1.4.dist-info → sdg_hub-0.2.0.dist-info}/WHEEL +0 -0
{sdg_hub-0.1.4.dist-info → sdg_hub-0.2.0.dist-info}/licenses/LICENSE +0 -0
{sdg_hub-0.1.4.dist-info → sdg_hub-0.2.0.dist-info}/top_level.txt +0 -0

sdg_hub/core/blocks/llm/config.py ADDED Viewed

@@ -0,0 +1,336 @@
+# SPDX-License-Identifier: Apache-2.0
+"""Configuration system for LLM blocks supporting all providers via LiteLLM."""
+# Standard
+from dataclasses import dataclass
+from typing import Any, Optional, Union
+import os
+@dataclass
+class LLMConfig:
+    """Configuration for LLM blocks supporting all providers via LiteLLM.
+    This configuration supports 100+ LLM providers including OpenAI, Anthropic,
+    Google, local models (vLLM, Ollama), and more through LiteLLM.
+    Parameters
+    ----------
+    model : Optional[str], optional
+        Model identifier in LiteLLM format. Can be None initially and set later via set_model_config(). Examples:
+        - "openai/gpt-4"
+        - "anthropic/claude-3-sonnet-20240229"
+        - "hosted_vllm/meta-llama/Llama-2-7b-chat-hf"
+        - "ollama/llama2"
+    api_key : Optional[str], optional
+        API key for the provider. Falls back to environment variables:
+        - OPENAI_API_KEY for OpenAI models
+        - ANTHROPIC_API_KEY for Anthropic models
+        - GOOGLE_API_KEY for Google models
+        - etc.
+    api_base : Optional[str], optional
+        Base URL for the API. Required for local models.
+    Examples
+    --------
+        - "http://localhost:8000/v1" for local vLLM
+        - "http://localhost:11434" for Ollama
+    timeout : float, optional
+        Request timeout in seconds, by default 120.0
+    max_retries : int, optional
+        Maximum number of retry attempts, by default 6
+    ### Generation Parameters ###
+    temperature : Optional[float], optional
+        Sampling temperature (0.0 to 2.0), by default None
+    max_tokens : Optional[int], optional
+        Maximum tokens to generate, by default None
+    top_p : Optional[float], optional
+        Nucleus sampling parameter (0.0 to 1.0), by default None
+    frequency_penalty : Optional[float], optional
+        Frequency penalty (-2.0 to 2.0), by default None
+    presence_penalty : Optional[float], optional
+        Presence penalty (-2.0 to 2.0), by default None
+    stop : Optional[Union[str, List[str]]], optional
+        Stop sequences, by default None
+    seed : Optional[int], optional
+        Random seed for reproducible outputs, by default None
+    response_format : Optional[Dict[str, Any]], optional
+        Response format specification (e.g., JSON mode), by default None
+    stream : Optional[bool], optional
+        Whether to stream responses, by default None
+    n : Optional[int], optional
+        Number of completions to generate, by default None
+    logprobs : Optional[bool], optional
+        Whether to return log probabilities, by default None
+    top_logprobs : Optional[int], optional
+        Number of top log probabilities to return, by default None
+    user : Optional[str], optional
+        End-user identifier, by default None
+    extra_headers : Optional[Dict[str, str]], optional
+        Additional headers to send with requests, by default None
+    extra_body : Optional[Dict[str, Any]], optional
+        Additional parameters for the request body, by default None
+    provider_specific : Optional[Dict[str, Any]], optional
+        Provider-specific parameters that don't map to standard OpenAI params, by default None
+    """
+    model: Optional[str] = None
+    api_key: Optional[str] = None
+    api_base: Optional[str] = None
+    timeout: float = 120.0
+    max_retries: int = 6
+    # Generation parameters (OpenAI-compatible)
+    temperature: Optional[float] = None
+    max_tokens: Optional[int] = None
+    top_p: Optional[float] = None
+    frequency_penalty: Optional[float] = None
+    presence_penalty: Optional[float] = None
+    stop: Optional[Union[str, list[str]]] = None
+    seed: Optional[int] = None
+    response_format: Optional[dict[str, Any]] = None
+    stream: Optional[bool] = None
+    n: Optional[int] = None
+    logprobs: Optional[bool] = None
+    top_logprobs: Optional[int] = None
+    user: Optional[str] = None
+    # Additional parameters
+    extra_headers: Optional[dict[str, str]] = None
+    extra_body: Optional[dict[str, Any]] = None
+    provider_specific: Optional[dict[str, Any]] = None
+    def __post_init__(self) -> None:
+        """Validate configuration after initialization."""
+        self._validate_model()
+        self._validate_parameters()
+        self._resolve_api_key()
+    def _validate_model(self) -> None:
+        """Validate model identifier format."""
+        # Model is optional - will be set later via set_model_config()
+        if self.model is None:
+            return
+        # Check if it's a valid LiteLLM model format
+        if "/" not in self.model:
+            raise ValueError(
+                f"Model '{self.model}' should be in format 'provider/model-name'. "
+                f"Examples: 'openai/gpt-4', 'anthropic/claude-3-sonnet-20240229', "
+                f"'hosted_vllm/meta-llama/Llama-2-7b-chat-hf'"
+            )
+    def _validate_parameters(self) -> None:
+        """Validate generation parameters."""
+        if self.temperature is not None and not (0.0 <= self.temperature <= 2.0):
+            raise ValueError(
+                f"Temperature must be between 0.0 and 2.0, got {self.temperature}"
+            )
+        if self.max_tokens is not None and self.max_tokens <= 0:
+            raise ValueError(f"max_tokens must be positive, got {self.max_tokens}")
+        if self.top_p is not None and not (0.0 <= self.top_p <= 1.0):
+            raise ValueError(f"top_p must be between 0.0 and 1.0, got {self.top_p}")
+        if self.frequency_penalty is not None and not (
+            -2.0 <= self.frequency_penalty <= 2.0
+        ):
+            raise ValueError(
+                f"frequency_penalty must be between -2.0 and 2.0, got {self.frequency_penalty}"
+            )
+        if self.presence_penalty is not None and not (
+            -2.0 <= self.presence_penalty <= 2.0
+        ):
+            raise ValueError(
+                f"presence_penalty must be between -2.0 and 2.0, got {self.presence_penalty}"
+            )
+        if self.n is not None and self.n <= 0:
+            raise ValueError(f"n must be positive, got {self.n}")
+        if self.max_retries < 0:
+            raise ValueError(
+                f"max_retries must be non-negative, got {self.max_retries}"
+            )
+        if self.timeout <= 0:
+            raise ValueError(f"timeout must be positive, got {self.timeout}")
+    def _resolve_api_key(self) -> None:
+        """Resolve API key from environment variables if not provided.
+        This method only reads from environment variables and does not modify them,
+        ensuring thread-safety when multiple instances are used concurrently.
+        """
+        if self.api_key is not None:
+            return
+        # Skip API key resolution if model is not set yet
+        if self.model is None:
+            return
+        # Extract provider from model
+        provider = self.model.split("/")[0].lower()
+        # Map provider to environment variable
+        provider_env_map = {
+            "openai": "OPENAI_API_KEY",
+            "anthropic": "ANTHROPIC_API_KEY",
+            "google": "GOOGLE_API_KEY",
+            "azure": "AZURE_API_KEY",
+            "huggingface": "HUGGINGFACE_API_KEY",
+            "cohere": "COHERE_API_KEY",
+            "replicate": "REPLICATE_API_KEY",
+            "together": "TOGETHER_API_KEY",
+            "anyscale": "ANYSCALE_API_KEY",
+            "perplexity": "PERPLEXITY_API_KEY",
+            "groq": "GROQ_API_KEY",
+            "mistral": "MISTRAL_API_KEY",
+            "deepinfra": "DEEPINFRA_API_KEY",
+            "ai21": "AI21_API_KEY",
+            "nlp_cloud": "NLP_CLOUD_API_KEY",
+            "aleph_alpha": "ALEPH_ALPHA_API_KEY",
+            "bedrock": "AWS_ACCESS_KEY_ID",
+            "vertex_ai": "GOOGLE_APPLICATION_CREDENTIALS",
+        }
+        env_var = provider_env_map.get(provider)
+        if env_var:
+            self.api_key = os.getenv(env_var)
+    def get_generation_kwargs(self) -> dict[str, Any]:
+        """Get generation parameters as kwargs for LiteLLM completion."""
+        kwargs = {}
+        # Standard parameters
+        for param in [
+            "temperature",
+            "max_tokens",
+            "top_p",
+            "frequency_penalty",
+            "presence_penalty",
+            "stop",
+            "seed",
+            "response_format",
+            "stream",
+            "n",
+            "logprobs",
+            "top_logprobs",
+            "user",
+        ]:
+            value = getattr(self, param)
+            if value is not None:
+                kwargs[param] = value
+        # Additional parameters
+        if self.extra_headers:
+            kwargs["extra_headers"] = self.extra_headers
+        if self.extra_body:
+            kwargs["extra_body"] = self.extra_body
+        if self.provider_specific:
+            kwargs.update(self.provider_specific)
+        return kwargs
+    def merge_overrides(self, **overrides: Any) -> "LLMConfig":
+        """Create a new config with runtime overrides.
+        Parameters
+        ----------
+        **overrides : Any
+            Runtime parameter overrides.
+        Returns
+        -------
+        LLMConfig
+            New configuration with overrides applied.
+        """
+        # Get current values as dict
+        # Standard
+        from dataclasses import fields
+        current_values = {
+            field.name: getattr(self, field.name) for field in fields(self)
+        }
+        # Apply overrides
+        current_values.update(overrides)
+        # Create new config
+        return LLMConfig(**current_values)
+    def get_provider(self) -> Optional[str]:
+        """Get the provider name from the model identifier.
+        Returns
+        -------
+        Optional[str]
+            Provider name (e.g., "openai", "anthropic", "hosted_vllm"), or None if model is not set.
+        """
+        if self.model is None:
+            return None
+        return self.model.split("/")[0]
+    def get_model_name(self) -> Optional[str]:
+        """Get the model name without provider prefix.
+        Returns
+        -------
+        Optional[str]
+            Model name (e.g., "gpt-4", "claude-3-sonnet-20240229"), or None if model is not set.
+        """
+        if self.model is None:
+            return None
+        parts = self.model.split("/", 1)
+        return parts[1] if len(parts) > 1 else parts[0]
+    def is_local_model(self) -> bool:
+        """Check if this is a local model deployment.
+        Returns
+        -------
+        bool
+            True if the model is hosted locally (vLLM, Ollama, etc.).
+        """
+        provider = self.get_provider()
+        if provider is None:
+            return False
+        local_providers = {"hosted_vllm", "ollama", "local", "vllm"}
+        return provider.lower() in local_providers
+    def __str__(self) -> str:
+        """String representation of the configuration."""
+        return f"LLMConfig(model='{self.model}', provider='{self.get_provider()}')"
+    def __repr__(self) -> str:
+        """Detailed representation of the configuration."""
+        return (
+            f"LLMConfig(model='{self.model}', provider='{self.get_provider()}', "
+            f"api_base='{self.api_base}', timeout={self.timeout}, "
+            f"max_retries={self.max_retries})"
+        )

sdg_hub/core/blocks/llm/error_handler.py ADDED Viewed

@@ -0,0 +1,368 @@
+# SPDX-License-Identifier: Apache-2.0
+"""Error handling system for LLM blocks supporting multiple providers."""
+# Standard
+from enum import Enum
+from typing import Any, Optional
+# Third Party
+from litellm import (
+    APIConnectionError,
+    AuthenticationError,
+    BadRequestError,
+    ContentPolicyViolationError,
+    ContextWindowExceededError,
+    InternalServerError,
+    InvalidRequestError,
+    NotFoundError,
+    RateLimitError,
+    ServiceUnavailableError,
+    UnprocessableEntityError,
+)
+from tenacity import (
+    retry,
+    retry_if_exception_type,
+    stop_after_attempt,
+    wait_exponential,
+)
+# Local
+from ...utils.logger_config import setup_logger
+logger = setup_logger(__name__)
+class ErrorCategory(Enum):
+    """Categories of errors for different retry strategies."""
+    RETRYABLE_RATE_LIMIT = "rate_limit"
+    RETRYABLE_TIMEOUT = "timeout"
+    RETRYABLE_CONNECTION = "connection"
+    RETRYABLE_SERVER = "server_error"
+    RETRYABLE_CONTENT_FILTER = "content_filter"
+    NON_RETRYABLE_AUTH = "auth_error"
+    NON_RETRYABLE_PERMISSION = "permission"
+    NON_RETRYABLE_BAD_REQUEST = "bad_request"
+    NON_RETRYABLE_NOT_FOUND = "not_found"
+    NON_RETRYABLE_CONTEXT_LENGTH = "context_length"
+    UNKNOWN = "unknown"
+class LLMErrorHandler:
+    """Centralized error handling for LLM operations across all providers.
+    This class handles errors from multiple LLM providers through LiteLLM,
+    which maps provider-specific errors to OpenAI-compatible exceptions.
+    Parameters
+    ----------
+    max_retries : int, optional
+        Maximum number of retry attempts, by default 6
+    base_delay : float, optional
+        Base delay between retries in seconds, by default 1.0
+    max_delay : float, optional
+        Maximum delay between retries in seconds, by default 60.0
+    exponential_base : float, optional
+        Base for exponential backoff, by default 2.0
+    """
+    def __init__(
+        self,
+        max_retries: int = 6,
+        base_delay: float = 1.0,
+        max_delay: float = 60.0,
+        exponential_base: float = 2.0,
+    ) -> None:
+        self.max_retries = max_retries
+        self.base_delay = base_delay
+        self.max_delay = max_delay
+        self.exponential_base = exponential_base
+        # Error category mappings
+        self.error_mappings = {
+            # Rate limiting errors
+            RateLimitError: ErrorCategory.RETRYABLE_RATE_LIMIT,
+            # Connection errors
+            APIConnectionError: ErrorCategory.RETRYABLE_CONNECTION,
+            # Server errors (5xx)
+            InternalServerError: ErrorCategory.RETRYABLE_SERVER,
+            ServiceUnavailableError: ErrorCategory.RETRYABLE_SERVER,
+            # Content filter errors (might be retryable with different input)
+            ContentPolicyViolationError: ErrorCategory.RETRYABLE_CONTENT_FILTER,
+            # Authentication errors (non-retryable)
+            AuthenticationError: ErrorCategory.NON_RETRYABLE_AUTH,
+            # Bad request errors (non-retryable)
+            BadRequestError: ErrorCategory.NON_RETRYABLE_BAD_REQUEST,
+            InvalidRequestError: ErrorCategory.NON_RETRYABLE_BAD_REQUEST,
+            UnprocessableEntityError: ErrorCategory.NON_RETRYABLE_BAD_REQUEST,
+            # Not found errors (non-retryable)
+            NotFoundError: ErrorCategory.NON_RETRYABLE_NOT_FOUND,
+            # Context length errors (non-retryable)
+            ContextWindowExceededError: ErrorCategory.NON_RETRYABLE_CONTEXT_LENGTH,
+        }
+        # Retryable error types
+        self.retryable_errors = {
+            ErrorCategory.RETRYABLE_RATE_LIMIT,
+            ErrorCategory.RETRYABLE_TIMEOUT,
+            ErrorCategory.RETRYABLE_CONNECTION,
+            ErrorCategory.RETRYABLE_SERVER,
+            ErrorCategory.RETRYABLE_CONTENT_FILTER,
+        }
+    def classify_error(self, error: Exception) -> ErrorCategory:
+        """Classify an error into a category for retry logic.
+        Parameters
+        ----------
+        error : Exception
+            The error to classify.
+        Returns
+        -------
+        ErrorCategory
+            The category of the error.
+        """
+        error_type = type(error)
+        return self.error_mappings.get(error_type, ErrorCategory.UNKNOWN)
+    def should_retry(self, error: Exception, attempt: int) -> bool:
+        """Determine if an error should be retried.
+        Parameters
+        ----------
+        error : Exception
+            The error that occurred.
+        attempt : int
+            The current attempt number (1-based).
+        Returns
+        -------
+        bool
+            True if the error should be retried.
+        """
+        if attempt >= self.max_retries:
+            return False
+        category = self.classify_error(error)
+        return category in self.retryable_errors
+    def calculate_delay(self, error: Exception, attempt: int) -> float:
+        """Calculate the delay before the next retry.
+        Parameters
+        ----------
+        error : Exception
+            The error that occurred.
+        attempt : int
+            The current attempt number (1-based).
+        Returns
+        -------
+        float
+            Delay in seconds before the next retry.
+        """
+        category = self.classify_error(error)
+        if category == ErrorCategory.RETRYABLE_RATE_LIMIT:
+            # Longer delays for rate limiting
+            delay = min(
+                self.base_delay * (self.exponential_base**attempt) * 2,
+                self.max_delay * 2,
+            )
+        elif category == ErrorCategory.RETRYABLE_TIMEOUT:
+            # Shorter delays for timeouts
+            delay = min(
+                self.base_delay * (self.exponential_base ** (attempt - 1)),
+                self.max_delay * 0.5,
+            )
+        else:
+            # Standard exponential backoff
+            delay = min(
+                self.base_delay * (self.exponential_base ** (attempt - 1)),
+                self.max_delay,
+            )
+        return delay
+    def log_error_context(
+        self, error: Exception, context: dict[str, Any], attempt: int = 1
+    ) -> None:
+        """Log error with context information.
+        Parameters
+        ----------
+        error : Exception
+            The error that occurred.
+        context : Dict[str, Any]
+            Context information about the error.
+        attempt : int, optional
+            The current attempt number, by default 1.
+        """
+        category = self.classify_error(error)
+        log_data = {
+            "error_type": type(error).__name__,
+            "error_category": category.value,
+            "error_message": str(error),
+            "attempt": attempt,
+            "max_retries": self.max_retries,
+            "retryable": category in self.retryable_errors,
+            **context,
+        }
+        if category in self.retryable_errors and attempt < self.max_retries:
+            delay = self.calculate_delay(error, attempt)
+            log_data["retry_delay"] = delay
+            logger.warning(
+                f"Retryable error occurred (attempt {attempt}/{self.max_retries}). "
+                f"Retrying in {delay:.1f}s: {error}",
+                extra=log_data,
+            )
+        else:
+            logger.error(
+                f"Non-retryable error or max retries exceeded: {error}", extra=log_data
+            )
+    def create_retry_decorator(self, context: Optional[dict[str, Any]] = None):
+        """Create a retry decorator for LLM operations.
+        Parameters
+        ----------
+        context : Optional[Dict[str, Any]], optional
+            Context information for logging, by default None.
+        Returns
+        -------
+        Callable
+            A retry decorator configured for LLM operations.
+        """
+        context = context or {}
+        def retry_condition(retry_state):
+            """Custom retry condition that logs errors."""
+            if retry_state.outcome.failed:
+                error = retry_state.outcome.exception()
+                self.log_error_context(error, context, retry_state.attempt_number)
+                return self.should_retry(error, retry_state.attempt_number)
+            return False
+        def wait_strategy(retry_state):
+            """Custom wait strategy based on error type."""
+            if retry_state.outcome.failed:
+                error = retry_state.outcome.exception()
+                return self.calculate_delay(error, retry_state.attempt_number)
+            return 0
+        return retry(
+            retry=retry_condition,
+            wait=wait_strategy,
+            stop=stop_after_attempt(self.max_retries),
+            reraise=True,
+        )
+    def create_simple_retry_decorator(self):
+        """Create a simple retry decorator using tenacity's built-in strategies.
+        This is a simpler alternative when you don't need custom error handling logic.
+        Returns
+        -------
+        Callable
+            A simple retry decorator for LLM operations.
+        """
+        # Define retryable exception types
+        retryable_exceptions = (
+            RateLimitError,
+            APIConnectionError,
+            InternalServerError,
+            ServiceUnavailableError,
+            ContentPolicyViolationError,
+        )
+        return retry(
+            retry=retry_if_exception_type(retryable_exceptions),
+            wait=wait_exponential(
+                multiplier=self.base_delay, min=self.base_delay, max=self.max_delay
+            ),
+            stop=stop_after_attempt(self.max_retries),
+            reraise=True,
+        )
+    def wrap_completion(
+        self, completion_func, context: Optional[dict[str, Any]] = None
+    ):
+        """Wrap a completion function with error handling and retry logic.
+        Parameters
+        ----------
+        completion_func : Callable
+            The completion function to wrap.
+        context : Optional[Dict[str, Any]], optional
+            Context information for logging, by default None.
+        Returns
+        -------
+        Callable
+            The wrapped completion function with retry logic.
+        """
+        retry_decorator = self.create_retry_decorator(context)
+        return retry_decorator(completion_func)
+    def get_error_summary(self, error: Exception) -> dict[str, Any]:
+        """Get a summary of error information.
+        Parameters
+        ----------
+        error : Exception
+            The error to summarize.
+        Returns
+        -------
+        Dict[str, Any]
+            Error summary information.
+        """
+        category = self.classify_error(error)
+        return {
+            "error_type": type(error).__name__,
+            "error_category": category.value,
+            "error_message": str(error),
+            "retryable": category in self.retryable_errors,
+            "provider_error": hasattr(error, "response") and error.response is not None,
+        }
+    def format_error_message(
+        self, error: Exception, context: Optional[dict[str, Any]] = None
+    ) -> str:
+        """Format an error message for user display.
+        Parameters
+        ----------
+        error : Exception
+            The error to format.
+        context : Optional[Dict[str, Any]], optional
+            Additional context for the error, by default None.
+        Returns
+        -------
+        str
+            Formatted error message.
+        """
+        category = self.classify_error(error)
+        context = context or {}
+        base_msg = f"LLM operation failed: {error}"
+        if category == ErrorCategory.NON_RETRYABLE_AUTH:
+            return f"{base_msg}\nCheck your API key configuration."
+        if category == ErrorCategory.NON_RETRYABLE_CONTEXT_LENGTH:
+            return f"{base_msg}\nInput text is too long for the model."
+        if category == ErrorCategory.RETRYABLE_RATE_LIMIT:
+            return f"{base_msg}\nRate limit exceeded. Consider using a different model or reducing request frequency."
+        if category == ErrorCategory.NON_RETRYABLE_NOT_FOUND:
+            model = context.get("model", "unknown")
+            return f"{base_msg}\nModel '{model}' not found. Check the model identifier."
+        return base_msg

sdg-hub 0.1.4__py3-none-any.whl → 0.2.0__py3-none-any.whl

sdg-hub 0.1.4py3-none-any.whl → 0.2.0py3-none-any.whl