PyPI - ai-lib-python - Versions diffs - 0.5.0__py3-none-any.whl - Mend

ai-lib-python 0.5.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (84) hide show

ai_lib_python/__init__.py +43 -0
ai_lib_python/batch/__init__.py +15 -0
ai_lib_python/batch/collector.py +244 -0
ai_lib_python/batch/executor.py +224 -0
ai_lib_python/cache/__init__.py +26 -0
ai_lib_python/cache/backends.py +380 -0
ai_lib_python/cache/key.py +237 -0
ai_lib_python/cache/manager.py +332 -0
ai_lib_python/client/__init__.py +37 -0
ai_lib_python/client/builder.py +528 -0
ai_lib_python/client/cancel.py +368 -0
ai_lib_python/client/core.py +433 -0
ai_lib_python/client/response.py +134 -0
ai_lib_python/embeddings/__init__.py +36 -0
ai_lib_python/embeddings/client.py +339 -0
ai_lib_python/embeddings/types.py +234 -0
ai_lib_python/embeddings/vectors.py +246 -0
ai_lib_python/errors/__init__.py +41 -0
ai_lib_python/errors/base.py +316 -0
ai_lib_python/errors/classification.py +210 -0
ai_lib_python/guardrails/__init__.py +35 -0
ai_lib_python/guardrails/base.py +336 -0
ai_lib_python/guardrails/filters.py +583 -0
ai_lib_python/guardrails/validators.py +475 -0
ai_lib_python/pipeline/__init__.py +55 -0
ai_lib_python/pipeline/accumulate.py +248 -0
ai_lib_python/pipeline/base.py +240 -0
ai_lib_python/pipeline/decode.py +281 -0
ai_lib_python/pipeline/event_map.py +506 -0
ai_lib_python/pipeline/fan_out.py +284 -0
ai_lib_python/pipeline/select.py +297 -0
ai_lib_python/plugins/__init__.py +32 -0
ai_lib_python/plugins/base.py +294 -0
ai_lib_python/plugins/hooks.py +296 -0
ai_lib_python/plugins/middleware.py +285 -0
ai_lib_python/plugins/registry.py +294 -0
ai_lib_python/protocol/__init__.py +71 -0
ai_lib_python/protocol/loader.py +317 -0
ai_lib_python/protocol/manifest.py +385 -0
ai_lib_python/protocol/validator.py +460 -0
ai_lib_python/py.typed +1 -0
ai_lib_python/resilience/__init__.py +102 -0
ai_lib_python/resilience/backpressure.py +225 -0
ai_lib_python/resilience/circuit_breaker.py +318 -0
ai_lib_python/resilience/executor.py +343 -0
ai_lib_python/resilience/fallback.py +341 -0
ai_lib_python/resilience/preflight.py +413 -0
ai_lib_python/resilience/rate_limiter.py +291 -0
ai_lib_python/resilience/retry.py +299 -0
ai_lib_python/resilience/signals.py +283 -0
ai_lib_python/routing/__init__.py +118 -0
ai_lib_python/routing/manager.py +593 -0
ai_lib_python/routing/strategy.py +345 -0
ai_lib_python/routing/types.py +397 -0
ai_lib_python/structured/__init__.py +33 -0
ai_lib_python/structured/json_mode.py +281 -0
ai_lib_python/structured/schema.py +316 -0
ai_lib_python/structured/validator.py +334 -0
ai_lib_python/telemetry/__init__.py +127 -0
ai_lib_python/telemetry/exporters/__init__.py +9 -0
ai_lib_python/telemetry/exporters/prometheus.py +111 -0
ai_lib_python/telemetry/feedback.py +446 -0
ai_lib_python/telemetry/health.py +409 -0
ai_lib_python/telemetry/logger.py +389 -0
ai_lib_python/telemetry/metrics.py +496 -0
ai_lib_python/telemetry/tracer.py +473 -0
ai_lib_python/tokens/__init__.py +25 -0
ai_lib_python/tokens/counter.py +282 -0
ai_lib_python/tokens/estimator.py +286 -0
ai_lib_python/transport/__init__.py +34 -0
ai_lib_python/transport/auth.py +141 -0
ai_lib_python/transport/http.py +364 -0
ai_lib_python/transport/pool.py +425 -0
ai_lib_python/types/__init__.py +41 -0
ai_lib_python/types/events.py +343 -0
ai_lib_python/types/message.py +332 -0
ai_lib_python/types/tool.py +191 -0
ai_lib_python/utils/__init__.py +21 -0
ai_lib_python/utils/tool_call_assembler.py +317 -0
ai_lib_python-0.5.0.dist-info/METADATA +837 -0
ai_lib_python-0.5.0.dist-info/RECORD +84 -0
ai_lib_python-0.5.0.dist-info/WHEEL +4 -0
ai_lib_python-0.5.0.dist-info/licenses/LICENSE-APACHE +201 -0
ai_lib_python-0.5.0.dist-info/licenses/LICENSE-MIT +21 -0

ai_lib_python/resilience/preflight.py ADDED Viewed

@@ -0,0 +1,413 @@
+"""
+Preflight checks and unified request gating.
+Provides unified preflight validation before request execution.
+"""
+from __future__ import annotations
+import asyncio
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Any
+from ai_lib_python.errors import AiLibError
+from ai_lib_python.resilience.signals import SignalsSnapshot
+if TYPE_CHECKING:
+    from ai_lib_python.resilience.backpressure import BackpressureController
+    from ai_lib_python.resilience.circuit_breaker import CircuitBreaker
+    from ai_lib_python.resilience.rate_limiter import RateLimiter
+class PreflightError(AiLibError):
+    """Error raised when preflight check fails."""
+    def __init__(
+        self,
+        message: str,
+        component: str,
+        retryable: bool = True,
+        retry_after_ms: int | None = None,
+    ) -> None:
+        """Initialize preflight error.
+        Args:
+            message: Error message
+            component: Component that failed (rate_limiter, circuit_breaker, backpressure)
+            retryable: Whether the request can be retried
+            retry_after_ms: Suggested retry delay in milliseconds
+        """
+        super().__init__(message)
+        self.component = component
+        self.retryable = retryable
+        self.retry_after_ms = retry_after_ms
+@dataclass
+class PreflightResult:
+    """Result of preflight checks.
+    Attributes:
+        passed: Whether all checks passed
+        permit: Backpressure permit (if acquired)
+        signals: Current signals snapshot
+        errors: List of failed checks
+    """
+    passed: bool = True
+    permit: Any = None
+    signals: SignalsSnapshot | None = None
+    errors: list[PreflightError] = field(default_factory=list)
+    def release_permit(self) -> None:
+        """Release the backpressure permit if held."""
+        if self.permit is not None:
+            # Permit is typically an asyncio.Semaphore release
+            try:
+                self.permit.release()
+            except (ValueError, RuntimeError):
+                pass
+            self.permit = None
+@dataclass
+class PreflightConfig:
+    """Configuration for preflight checks.
+    Attributes:
+        check_rate_limiter: Whether to check rate limiter
+        check_circuit_breaker: Whether to check circuit breaker
+        check_backpressure: Whether to check backpressure
+        fail_fast: Whether to fail immediately on first failure
+        timeout_ms: Timeout for acquiring permits
+    """
+    check_rate_limiter: bool = True
+    check_circuit_breaker: bool = True
+    check_backpressure: bool = True
+    fail_fast: bool = True
+    timeout_ms: float = 30000.0
+class PreflightChecker:
+    """Unified preflight checker for requests.
+    Performs rate limiter, circuit breaker, and backpressure checks
+    before allowing a request to proceed.
+    Example:
+        >>> checker = PreflightChecker(
+        ...     rate_limiter=rate_limiter,
+        ...     circuit_breaker=circuit_breaker,
+        ...     backpressure=backpressure_controller,
+        ... )
+        >>>
+        >>> result = await checker.check()
+        >>> if result.passed:
+        ...     try:
+        ...         response = await make_request()
+        ...     finally:
+        ...         result.release_permit()
+        >>> else:
+        ...     for error in result.errors:
+        ...         print(f"Failed: {error.component}: {error}")
+    """
+    def __init__(
+        self,
+        rate_limiter: RateLimiter | None = None,
+        circuit_breaker: CircuitBreaker | None = None,
+        backpressure: BackpressureController | None = None,
+        config: PreflightConfig | None = None,
+        provider: str | None = None,
+        model: str | None = None,
+    ) -> None:
+        """Initialize preflight checker.
+        Args:
+            rate_limiter: Optional rate limiter
+            circuit_breaker: Optional circuit breaker
+            backpressure: Optional backpressure controller
+            config: Preflight configuration
+            provider: Provider identifier for signals
+            model: Model identifier for signals
+        """
+        self._rate_limiter = rate_limiter
+        self._circuit_breaker = circuit_breaker
+        self._backpressure = backpressure
+        self._config = config or PreflightConfig()
+        self._provider = provider
+        self._model = model
+    async def check(self) -> PreflightResult:
+        """Perform all preflight checks.
+        Returns:
+            PreflightResult with check status and permit
+        """
+        result = PreflightResult()
+        errors: list[PreflightError] = []
+        # 1. Check circuit breaker (fast fail)
+        if self._config.check_circuit_breaker and self._circuit_breaker:
+            try:
+                if not self._circuit_breaker.allow():
+                    cooldown = None
+                    if self._circuit_breaker._last_failure:
+                        import time
+                        elapsed = time.time() - self._circuit_breaker._last_failure
+                        remaining = (
+                            self._circuit_breaker.config.cooldown_seconds - elapsed
+                        )
+                        if remaining > 0:
+                            cooldown = int(remaining * 1000)
+                    error = PreflightError(
+                        "Circuit breaker is open",
+                        "circuit_breaker",
+                        retryable=True,
+                        retry_after_ms=cooldown,
+                    )
+                    errors.append(error)
+                    if self._config.fail_fast:
+                        result.passed = False
+                        result.errors = errors
+                        return result
+            except Exception as e:
+                errors.append(
+                    PreflightError(f"Circuit breaker check failed: {e}", "circuit_breaker")
+                )
+                if self._config.fail_fast:
+                    result.passed = False
+                    result.errors = errors
+                    return result
+        # 2. Check rate limiter
+        if self._config.check_rate_limiter and self._rate_limiter:
+            try:
+                allowed = await self._rate_limiter.acquire()
+                if not allowed:
+                    error = PreflightError(
+                        "Rate limit exceeded",
+                        "rate_limiter",
+                        retryable=True,
+                        retry_after_ms=1000,  # Default 1s retry
+                    )
+                    errors.append(error)
+                    if self._config.fail_fast:
+                        result.passed = False
+                        result.errors = errors
+                        return result
+            except Exception as e:
+                errors.append(
+                    PreflightError(f"Rate limiter check failed: {e}", "rate_limiter")
+                )
+                if self._config.fail_fast:
+                    result.passed = False
+                    result.errors = errors
+                    return result
+        # 3. Acquire backpressure permit
+        if self._config.check_backpressure and self._backpressure:
+            try:
+                timeout = self._config.timeout_ms / 1000.0
+                permit = await asyncio.wait_for(
+                    self._backpressure.acquire(),
+                    timeout=timeout,
+                )
+                if permit:
+                    result.permit = permit
+                else:
+                    error = PreflightError(
+                        "Backpressure limit reached",
+                        "backpressure",
+                        retryable=True,
+                        retry_after_ms=100,
+                    )
+                    errors.append(error)
+                    if self._config.fail_fast:
+                        result.passed = False
+                        result.errors = errors
+                        return result
+            except asyncio.TimeoutError:
+                error = PreflightError(
+                    "Backpressure permit timeout",
+                    "backpressure",
+                    retryable=True,
+                    retry_after_ms=100,
+                )
+                errors.append(error)
+                if self._config.fail_fast:
+                    result.passed = False
+                    result.errors = errors
+                    return result
+            except Exception as e:
+                errors.append(
+                    PreflightError(f"Backpressure check failed: {e}", "backpressure")
+                )
+                if self._config.fail_fast:
+                    result.passed = False
+                    result.errors = errors
+                    return result
+        # Generate signals snapshot
+        result.signals = self.get_signals()
+        result.errors = errors
+        result.passed = len(errors) == 0
+        return result
+    def get_signals(self) -> SignalsSnapshot:
+        """Get current signals snapshot.
+        Returns:
+            SignalsSnapshot with current state
+        """
+        inflight = None
+        if self._backpressure:
+            max_concurrent = self._backpressure.max_concurrent
+            in_use = max_concurrent - self._backpressure.available
+            inflight = (max_concurrent, in_use)
+        return SignalsSnapshot.from_components(
+            inflight=inflight,
+            rate_limiter=self._rate_limiter,
+            circuit_breaker=self._circuit_breaker,
+            provider=self._provider,
+            model=self._model,
+        )
+    def on_success(self) -> None:
+        """Report successful request completion."""
+        if self._circuit_breaker:
+            self._circuit_breaker.on_success()
+    def on_failure(self) -> None:
+        """Report request failure."""
+        if self._circuit_breaker:
+            self._circuit_breaker.on_failure()
+    async def update_rate_limits(self, headers: dict[str, str]) -> None:
+        """Update rate limiter state from response headers.
+        Args:
+            headers: Response headers
+        """
+        if not self._rate_limiter:
+            return
+        # Common header patterns
+        remaining_headers = [
+            "x-ratelimit-remaining",
+            "x-ratelimit-remaining-requests",
+            "ratelimit-remaining",
+        ]
+        reset_headers = [
+            "x-ratelimit-reset",
+            "x-ratelimit-reset-requests",
+            "ratelimit-reset",
+            "retry-after",
+        ]
+        # Try to extract remaining count
+        remaining = None
+        for header in remaining_headers:
+            value = headers.get(header) or headers.get(header.title())
+            if value:
+                try:
+                    remaining = int(value)
+                    break
+                except ValueError:
+                    continue
+        # Try to extract reset time
+        reset_after = None
+        for header in reset_headers:
+            value = headers.get(header) or headers.get(header.title())
+            if value:
+                try:
+                    val = float(value)
+                    # Check if it's an epoch timestamp or seconds
+                    if val > 1_000_000_000:
+                        import time
+                        reset_after = val - time.time()
+                    else:
+                        reset_after = val
+                    break
+                except ValueError:
+                    continue
+        # Update rate limiter if we have useful info
+        if remaining is not None or reset_after is not None:
+            await self._rate_limiter.update_budget(remaining, reset_after)
+class PreflightContext:
+    """Context manager for preflight checks.
+    Automatically releases permits on exit.
+    Example:
+        >>> async with PreflightContext(checker) as ctx:
+        ...     if ctx.passed:
+        ...         response = await make_request()
+        ...         ctx.on_success()
+        ...     else:
+        ...         print(f"Preflight failed: {ctx.errors}")
+    """
+    def __init__(self, checker: PreflightChecker) -> None:
+        """Initialize context.
+        Args:
+            checker: PreflightChecker instance
+        """
+        self._checker = checker
+        self._result: PreflightResult | None = None
+    async def __aenter__(self) -> PreflightContext:
+        """Enter context and perform checks."""
+        self._result = await self._checker.check()
+        return self
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: Any,
+    ) -> None:
+        """Exit context and release permit."""
+        if self._result:
+            self._result.release_permit()
+            # Report outcome
+            if exc_val is not None:
+                self._checker.on_failure()
+            elif self._result.passed:
+                # Success is reported explicitly by caller
+                pass
+    @property
+    def passed(self) -> bool:
+        """Check if preflight passed."""
+        return self._result.passed if self._result else False
+    @property
+    def signals(self) -> SignalsSnapshot | None:
+        """Get signals snapshot."""
+        return self._result.signals if self._result else None
+    @property
+    def errors(self) -> list[PreflightError]:
+        """Get list of errors."""
+        return self._result.errors if self._result else []
+    def on_success(self) -> None:
+        """Report successful completion."""
+        self._checker.on_success()
+    def on_failure(self) -> None:
+        """Report failure."""
+        self._checker.on_failure()

ai_lib_python/resilience/rate_limiter.py ADDED Viewed

@@ -0,0 +1,291 @@
+"""
+Rate limiter using token bucket algorithm.
+Provides both static and adaptive rate limiting based on provider response headers.
+"""
+from __future__ import annotations
+import asyncio
+import time
+from dataclasses import dataclass
+from typing import Any
+@dataclass
+class RateLimiterConfig:
+    """Configuration for rate limiter.
+    Attributes:
+        requests_per_second: Maximum requests per second (0 = unlimited)
+        burst_size: Maximum burst size (tokens in bucket)
+        initial_tokens: Initial tokens in bucket
+    """
+    requests_per_second: float = 0.0
+    burst_size: int | None = None
+    initial_tokens: int | None = None
+    @classmethod
+    def from_rps(cls, rps: float, burst_multiplier: float = 1.5) -> RateLimiterConfig:
+        """Create config from requests per second.
+        Args:
+            rps: Requests per second
+            burst_multiplier: Multiplier for burst size
+        Returns:
+            RateLimiterConfig instance
+        """
+        burst = int(rps * burst_multiplier) if rps > 0 else None
+        return cls(
+            requests_per_second=rps,
+            burst_size=burst,
+            initial_tokens=burst,
+        )
+    @classmethod
+    def from_rpm(cls, rpm: float, burst_multiplier: float = 1.5) -> RateLimiterConfig:
+        """Create config from requests per minute.
+        Args:
+            rpm: Requests per minute
+            burst_multiplier: Multiplier for burst size
+        Returns:
+            RateLimiterConfig instance
+        """
+        return cls.from_rps(rpm / 60.0, burst_multiplier)
+    @classmethod
+    def unlimited(cls) -> RateLimiterConfig:
+        """Create an unlimited rate limiter config."""
+        return cls(requests_per_second=0.0)
+class RateLimiter:
+    """Token bucket rate limiter.
+    Implements the token bucket algorithm for rate limiting:
+    - Tokens are added at a fixed rate
+    - Requests consume tokens
+    - If no tokens available, requests wait
+    Example:
+        >>> limiter = RateLimiter(RateLimiterConfig.from_rps(10))
+        >>> await limiter.acquire()  # Wait if needed
+        >>> # Make request
+    """
+    def __init__(self, config: RateLimiterConfig | None = None) -> None:
+        """Initialize rate limiter.
+        Args:
+            config: Rate limiter configuration
+        """
+        self._config = config or RateLimiterConfig()
+        self._lock = asyncio.Lock()
+        # Token bucket state
+        self._tokens = float(
+            self._config.initial_tokens
+            if self._config.initial_tokens is not None
+            else (self._config.burst_size or 1)
+        )
+        self._max_tokens = float(self._config.burst_size or 1)
+        self._last_refill = time.monotonic()
+        # Rate (tokens per second)
+        self._rate = self._config.requests_per_second
+    def _refill(self) -> None:
+        """Refill tokens based on elapsed time."""
+        if self._rate <= 0:
+            return
+        now = time.monotonic()
+        elapsed = now - self._last_refill
+        self._last_refill = now
+        # Add tokens based on elapsed time
+        new_tokens = elapsed * self._rate
+        self._tokens = min(self._tokens + new_tokens, self._max_tokens)
+    async def acquire(self, tokens: int = 1) -> float:
+        """Acquire tokens, waiting if necessary.
+        Args:
+            tokens: Number of tokens to acquire
+        Returns:
+            Wait time in seconds (0 if no wait)
+        """
+        if self._rate <= 0:
+            return 0.0  # Unlimited
+        async with self._lock:
+            self._refill()
+            wait_time = 0.0
+            if self._tokens < tokens:
+                # Calculate wait time
+                deficit = tokens - self._tokens
+                wait_time = deficit / self._rate
+                # Wait for tokens
+                await asyncio.sleep(wait_time)
+                self._refill()
+            # Consume tokens
+            self._tokens -= tokens
+            return wait_time
+    async def try_acquire(self, tokens: int = 1) -> bool:
+        """Try to acquire tokens without waiting.
+        Args:
+            tokens: Number of tokens to acquire
+        Returns:
+            True if acquired, False if would need to wait
+        """
+        if self._rate <= 0:
+            return True  # Unlimited
+        async with self._lock:
+            self._refill()
+            if self._tokens >= tokens:
+                self._tokens -= tokens
+                return True
+            return False
+    def get_wait_time(self, tokens: int = 1) -> float:
+        """Get estimated wait time without acquiring.
+        Args:
+            tokens: Number of tokens needed
+        Returns:
+            Estimated wait time in seconds
+        """
+        if self._rate <= 0:
+            return 0.0
+        self._refill()
+        if self._tokens >= tokens:
+            return 0.0
+        deficit = tokens - self._tokens
+        return deficit / self._rate
+    @property
+    def available_tokens(self) -> float:
+        """Get current available tokens."""
+        self._refill()
+        return self._tokens
+    @property
+    def is_limited(self) -> bool:
+        """Check if rate limiting is enabled."""
+        return self._rate > 0
+class AdaptiveRateLimiter(RateLimiter):
+    """Adaptive rate limiter that adjusts based on server responses.
+    Monitors rate limit headers from API responses and adjusts
+    the rate limit dynamically.
+    Example:
+        >>> limiter = AdaptiveRateLimiter()
+        >>> await limiter.acquire()
+        >>> response = await make_request()
+        >>> limiter.update_from_headers(response.headers)
+    """
+    def __init__(
+        self,
+        config: RateLimiterConfig | None = None,
+        header_config: dict[str, str] | None = None,
+    ) -> None:
+        """Initialize adaptive rate limiter.
+        Args:
+            config: Base rate limiter configuration
+            header_config: Mapping of header names for rate limit info
+        """
+        super().__init__(config)
+        self._header_config = header_config or {}
+        # Adaptive state
+        self._server_limit: int | None = None
+        self._server_remaining: int | None = None
+        self._server_reset: float | None = None
+    def update_from_headers(self, headers: dict[str, str]) -> None:
+        """Update rate limit state from response headers.
+        Args:
+            headers: Response headers
+        """
+        # Extract limit
+        limit_header = self._header_config.get(
+            "requests_limit", "x-ratelimit-limit-requests"
+        )
+        if limit_header in headers:
+            try:
+                self._server_limit = int(headers[limit_header])
+            except ValueError:
+                pass
+        # Extract remaining
+        remaining_header = self._header_config.get(
+            "requests_remaining", "x-ratelimit-remaining-requests"
+        )
+        if remaining_header in headers:
+            try:
+                self._server_remaining = int(headers[remaining_header])
+                # Update tokens to match server state
+                if self._server_remaining is not None:
+                    self._tokens = float(self._server_remaining)
+            except ValueError:
+                pass
+        # Extract reset time
+        reset_header = self._header_config.get("requests_reset")
+        if reset_header and reset_header in headers:
+            try:
+                # May be seconds or timestamp
+                reset_value = headers[reset_header]
+                if "s" in reset_value or "m" in reset_value:
+                    # Parse duration like "1s" or "1m"
+                    reset_value = reset_value.rstrip("sm")
+                    self._server_reset = float(reset_value)
+                else:
+                    self._server_reset = float(reset_value)
+            except ValueError:
+                pass
+        # Adjust rate based on server limit
+        if (
+            self._server_limit is not None
+            and self._server_reset is not None
+            and self._server_reset > 0
+        ):
+            self._rate = self._server_limit / self._server_reset
+            self._max_tokens = float(self._server_limit)
+    def get_server_state(self) -> dict[str, Any]:
+        """Get current server-reported rate limit state.
+        Returns:
+            Dict with limit, remaining, and reset values
+        """
+        return {
+            "limit": self._server_limit,
+            "remaining": self._server_remaining,
+            "reset": self._server_reset,
+        }