PyPI - osmosis-ai - Versions diffs - 0.2.1__py3-none-any.whl → 0.2.2__py3-none-any.whl - Mend

osmosis-ai 0.2.1py3-none-any.whl → 0.2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of osmosis-ai might be problematic. Click here for more details.

Files changed (18) hide show

osmosis_ai/__init__.py +13 -4
osmosis_ai/consts.py +1 -1
osmosis_ai/providers/__init__.py +36 -0
osmosis_ai/providers/anthropic_provider.py +85 -0
osmosis_ai/providers/base.py +60 -0
osmosis_ai/providers/gemini_provider.py +269 -0
osmosis_ai/providers/openai_family.py +607 -0
osmosis_ai/providers/shared.py +92 -0
osmosis_ai/rubric_eval.py +537 -0
osmosis_ai/rubric_types.py +49 -0
osmosis_ai/utils.py +392 -1
osmosis_ai-0.2.2.dist-info/METADATA +241 -0
osmosis_ai-0.2.2.dist-info/RECORD +16 -0
osmosis_ai-0.2.1.dist-info/METADATA +0 -143
osmosis_ai-0.2.1.dist-info/RECORD +0 -8
{osmosis_ai-0.2.1.dist-info → osmosis_ai-0.2.2.dist-info}/WHEEL +0 -0
{osmosis_ai-0.2.1.dist-info → osmosis_ai-0.2.2.dist-info}/licenses/LICENSE +0 -0
{osmosis_ai-0.2.1.dist-info → osmosis_ai-0.2.2.dist-info}/top_level.txt +0 -0

osmosis_ai/__init__.py CHANGED Viewed

@@ -1,8 +1,8 @@
 """
 osmosis-ai: A Python library for reward function validation with strict type enforcement.
-This library provides the @osmosis_reward decorator that enforces standardized
-function signatures for reward functions used in LLM applications.
+This library provides decorators such as @osmosis_reward and @osmosis_rubric that
+enforce standardized function signatures for LLM-centric workflows.
 Features:
 - Type-safe reward function decoration
@@ -10,6 +10,15 @@ Features:
 - Support for optional configuration parameters
 """
-from .utils import osmosis_reward
+from .rubric_eval import MissingAPIKeyError, evaluate_rubric
+from .rubric_types import ModelNotFoundError, ProviderRequestError
+from .utils import osmosis_reward, osmosis_rubric
-__all__ = ["osmosis_reward"]
+__all__ = [
+    "osmosis_reward",
+    "osmosis_rubric",
+    "evaluate_rubric",
+    "MissingAPIKeyError",
+    "ProviderRequestError",
+    "ModelNotFoundError",
+]

osmosis_ai/consts.py CHANGED Viewed

@@ -1,3 +1,3 @@
 # package metadata
 package_name = "osmosis-ai"
-package_version = "0.2.1"
+package_version = "0.2.2"

osmosis_ai/providers/__init__.py ADDED Viewed

@@ -0,0 +1,36 @@
+from __future__ import annotations
+from typing import Tuple
+from .anthropic_provider import AnthropicProvider
+from .base import DEFAULT_REQUEST_TIMEOUT_SECONDS, ProviderRegistry, ProviderRequest, RubricProvider
+from .gemini_provider import GeminiProvider
+from .openai_family import OpenAIProvider, XAIProvider
+_REGISTRY = ProviderRegistry()
+_REGISTRY.register(OpenAIProvider())
+_REGISTRY.register(XAIProvider())
+_REGISTRY.register(AnthropicProvider())
+_REGISTRY.register(GeminiProvider())
+def get_provider(name: str) -> RubricProvider:
+    return _REGISTRY.get(name)
+def register_provider(provider: RubricProvider) -> None:
+    _REGISTRY.register(provider)
+def supported_providers() -> Tuple[str, ...]:
+    return _REGISTRY.supported_providers()
+__all__ = [
+    "DEFAULT_REQUEST_TIMEOUT_SECONDS",
+    "ProviderRequest",
+    "RubricProvider",
+    "get_provider",
+    "register_provider",
+    "supported_providers",
+]

osmosis_ai/providers/anthropic_provider.py ADDED Viewed

@@ -0,0 +1,85 @@
+from __future__ import annotations
+from typing import Any, Dict
+try:  # pragma: no cover - optional dependency
+    import anthropic  # type: ignore
+    from anthropic import APIError  # type: ignore
+except ImportError:  # pragma: no cover - optional dependency
+    anthropic = None  # type: ignore[assignment]
+    APIError = None  # type: ignore[assignment]
+from ..rubric_types import ModelNotFoundError, ProviderRequestError, RewardRubricRunResult
+from .base import DEFAULT_REQUEST_TIMEOUT_SECONDS, ProviderRequest, RubricProvider
+from .shared import dump_model, extract_structured_score, reward_schema_definition
+class AnthropicProvider(RubricProvider):
+    name = "anthropic"
+    def default_timeout(self, model: str) -> float:
+        return DEFAULT_REQUEST_TIMEOUT_SECONDS
+    def run(self, request: ProviderRequest) -> RewardRubricRunResult:
+        if anthropic is None or APIError is None:
+            raise ProviderRequestError(
+                self.name,
+                request.model,
+                "Anthropic SDK is required. Install it via `pip install anthropic`.",
+            )
+        client = anthropic.Anthropic(api_key=request.api_key)
+        tool_name = "emit_reward_rubric_response"
+        schema_definition = reward_schema_definition()
+        tool = {
+            "name": tool_name,
+            "description": "Return the reward rubric score and explanation as structured JSON.",
+            "input_schema": schema_definition,
+        }
+        try:
+            response = client.messages.create(
+                model=request.model,
+                system=request.system_content,
+                messages=[{"role": "user", "content": [{"type": "text", "text": request.user_content}]}],
+                tools=[tool],
+                tool_choice={"type": "tool", "name": tool_name},
+                max_tokens=512,
+                temperature=0,
+                timeout=request.timeout,
+            )
+        except APIError as err:
+            detail = getattr(err, "message", None)
+            if not isinstance(detail, str) or not detail.strip():
+                detail = str(err)
+            status_code = getattr(err, "status_code", None)
+            if status_code == 404:
+                not_found_detail = (
+                    f"Model '{request.model}' was not found. Confirm your Anthropic account has access "
+                    "to the requested snapshot or update the model identifier."
+                )
+                raise ModelNotFoundError(self.name, request.model, not_found_detail) from err
+            raise ProviderRequestError(self.name, request.model, detail) from err
+        except Exception as err:
+            detail = str(err).strip() or "Unexpected error during Anthropic request."
+            raise ProviderRequestError(self.name, request.model, detail) from err
+        raw = dump_model(response)
+        payload: Dict[str, Any] | None = None
+        content_blocks = raw.get("content") if isinstance(raw, dict) else None
+        if isinstance(content_blocks, list):
+            for block in content_blocks:
+                if isinstance(block, dict) and block.get("type") == "tool_use" and block.get("name") == tool_name:
+                    maybe_input = block.get("input")
+                    if isinstance(maybe_input, dict):
+                        payload = maybe_input
+                    break
+        if payload is None:
+            raise ProviderRequestError(self.name, request.model, "Model response missing expected tool output.")
+        score, explanation = extract_structured_score(payload)
+        bounded = max(request.score_min, min(request.score_max, score))
+        return {"score": bounded, "explanation": explanation, "raw": raw}
+__all__ = ["AnthropicProvider"]

osmosis_ai/providers/base.py ADDED Viewed

@@ -0,0 +1,60 @@
+from __future__ import annotations
+from dataclasses import dataclass
+from typing import Dict, Tuple
+from ..rubric_types import RewardRubricRunResult
+DEFAULT_REQUEST_TIMEOUT_SECONDS = 30.0
+@dataclass(frozen=True)
+class ProviderRequest:
+    provider: str
+    model: str
+    api_key: str
+    system_content: str
+    user_content: str
+    score_min: float
+    score_max: float
+    timeout: float
+class RubricProvider:
+    """Interface for hosted LLM providers that can score rubrics."""
+    name: str
+    def default_timeout(self, model: str) -> float:
+        return DEFAULT_REQUEST_TIMEOUT_SECONDS
+    def run(self, request: ProviderRequest) -> RewardRubricRunResult:
+        raise NotImplementedError
+class ProviderRegistry:
+    def __init__(self) -> None:
+        self._providers: Dict[str, RubricProvider] = {}
+    def register(self, provider: RubricProvider) -> None:
+        key = provider.name
+        if key in self._providers:
+            raise ValueError(f"Provider '{key}' is already registered.")
+        self._providers[key] = provider
+    def get(self, name: str) -> RubricProvider:
+        try:
+            return self._providers[name]
+        except KeyError as exc:
+            raise ValueError(f"Unsupported provider '{name}'.") from exc
+    def supported_providers(self) -> Tuple[str, ...]:
+        return tuple(sorted(self._providers))
+__all__ = [
+    "DEFAULT_REQUEST_TIMEOUT_SECONDS",
+    "ProviderRequest",
+    "RubricProvider",
+    "ProviderRegistry",
+]

osmosis_ai/providers/gemini_provider.py ADDED Viewed

@@ -0,0 +1,269 @@
+from __future__ import annotations
+from contextlib import contextmanager
+import time
+import warnings
+from typing import TYPE_CHECKING, Any, Dict, Iterator, List, Tuple
+if TYPE_CHECKING:  # pragma: no cover - typing helpers only
+    from google import genai as genai_module  # type: ignore
+    from google.genai import types as genai_types_module  # type: ignore
+from ..rubric_types import ProviderRequestError, RewardRubricRunResult
+from .base import DEFAULT_REQUEST_TIMEOUT_SECONDS, ProviderRequest, RubricProvider
+from .shared import dump_model, reward_schema_definition, sanitize_json
+_GENAI_MODULE: Any | None = None
+_GENAI_TYPES_MODULE: Any | None = None
+_PYDANTIC_ANY_WARNING_MESSAGE = r".*<built-in function any> is not a Python type.*"
+GEMINI_DEFAULT_TIMEOUT_SECONDS = 60.0
+GEMINI_MIN_TIMEOUT_SECONDS = 5.0
+GEMINI_MAX_TIMEOUT_SECONDS = 180.0
+GEMINI_RETRY_ATTEMPTS = 3
+GEMINI_TIMEOUT_BACKOFF = 1.5
+GEMINI_RETRY_SLEEP_SECONDS = (0.5, 1.0, 2.0)
+@contextmanager
+def _suppress_pydantic_any_warning() -> Iterator[None]:
+    with warnings.catch_warnings():
+        warnings.filterwarnings(
+            "ignore",
+            message=_PYDANTIC_ANY_WARNING_MESSAGE,
+            category=UserWarning,
+            module=r"pydantic\._internal\._generate_schema",
+        )
+        yield
+def _load_google_genai() -> Tuple[Any, Any]:
+    """
+    Lazily import the Google Generative AI SDK so that environments without the optional
+    dependency avoid import-time side effects (like pydantic warnings) unless the Gemini
+    provider is actually used.
+    """
+    global _GENAI_MODULE, _GENAI_TYPES_MODULE
+    if _GENAI_MODULE is not None and _GENAI_TYPES_MODULE is not None:
+        return _GENAI_MODULE, _GENAI_TYPES_MODULE
+    try:  # pragma: no cover - optional dependency
+        with _suppress_pydantic_any_warning():
+            from google import genai as genai_mod  # type: ignore
+            from google.genai import types as genai_types_mod  # type: ignore
+    except ImportError as exc:  # pragma: no cover - optional dependency
+        raise RuntimeError(
+            "Google Generative AI SDK is required for provider 'gemini'. "
+            "Install it via `pip install google-genai`."
+        ) from exc
+    _GENAI_MODULE = genai_mod
+    _GENAI_TYPES_MODULE = genai_types_mod
+    return _GENAI_MODULE, _GENAI_TYPES_MODULE
+def _normalize_gemini_model(model_id: str) -> str:
+    import re
+    return re.sub(r"^models/", "", model_id, flags=re.IGNORECASE)
+def _json_schema_to_genai(
+    schema: Dict[str, Any],
+    genai_types: Any,
+) -> "genai_types_module.Schema":  # type: ignore[name-defined]
+    type_map = {
+        "object": genai_types.Type.OBJECT,
+        "string": genai_types.Type.STRING,
+        "number": genai_types.Type.NUMBER,
+        "integer": genai_types.Type.INTEGER,
+        "boolean": genai_types.Type.BOOLEAN,
+        "array": genai_types.Type.ARRAY,
+    }
+    kwargs: Dict[str, Any] = {}
+    type_value = schema.get("type")
+    if isinstance(type_value, str):
+        mapped = type_map.get(type_value.lower())
+        if mapped is not None:
+            kwargs["type"] = mapped
+    required = schema.get("required")
+    if isinstance(required, list):
+        filtered_required = [name for name in required if isinstance(name, str)]
+        if filtered_required:
+            kwargs["required"] = filtered_required
+    properties = schema.get("properties")
+    if isinstance(properties, dict):
+        converted_properties = {}
+        for key, value in properties.items():
+            if isinstance(key, str) and isinstance(value, dict):
+                converted_properties[key] = _json_schema_to_genai(value, genai_types)
+        if converted_properties:
+            kwargs["properties"] = converted_properties
+    items = schema.get("items")
+    if isinstance(items, dict):
+        kwargs["items"] = _json_schema_to_genai(items, genai_types)
+    enum_values = schema.get("enum")
+    if isinstance(enum_values, list):
+        filtered_enum = [str(option) for option in enum_values]
+        if filtered_enum:
+            kwargs["enum"] = filtered_enum
+    description = schema.get("description")
+    if isinstance(description, str):
+        kwargs["description"] = description
+    minimum = schema.get("minimum")
+    if isinstance(minimum, (int, float)):
+        kwargs["minimum"] = float(minimum)
+    maximum = schema.get("maximum")
+    if isinstance(maximum, (int, float)):
+        kwargs["maximum"] = float(maximum)
+    min_items = schema.get("min_items")
+    if isinstance(min_items, int):
+        kwargs["min_items"] = min_items
+    max_items = schema.get("max_items")
+    if isinstance(max_items, int):
+        kwargs["max_items"] = max_items
+    min_length = schema.get("min_length")
+    if isinstance(min_length, int):
+        kwargs["min_length"] = min_length
+    max_length = schema.get("max_length")
+    if isinstance(max_length, int):
+        kwargs["max_length"] = max_length
+    nullable = schema.get("nullable")
+    if isinstance(nullable, bool):
+        kwargs["nullable"] = nullable
+    with _suppress_pydantic_any_warning():
+        return genai_types.Schema(**kwargs)
+def _build_retry_timeouts(requested_timeout: float) -> List[float]:
+    # Keep the first attempt generous, then increase for retries while capping growth.
+    base = max(requested_timeout, GEMINI_MIN_TIMEOUT_SECONDS, GEMINI_DEFAULT_TIMEOUT_SECONDS)
+    timeouts: List[float] = []
+    current = base
+    for _ in range(GEMINI_RETRY_ATTEMPTS):
+        timeouts.append(min(current, GEMINI_MAX_TIMEOUT_SECONDS))
+        current = min(current * GEMINI_TIMEOUT_BACKOFF, GEMINI_MAX_TIMEOUT_SECONDS)
+    return timeouts
+def _seconds_to_millis(seconds: float) -> int:
+    # Gemini client expects timeout in milliseconds. Clamp to at least 1ms.
+    return max(int(round(seconds * 1000)), 1)
+class GeminiProvider(RubricProvider):
+    name = "gemini"
+    def default_timeout(self, model: str) -> float:
+        return max(DEFAULT_REQUEST_TIMEOUT_SECONDS, GEMINI_DEFAULT_TIMEOUT_SECONDS)
+    def run(self, request: ProviderRequest) -> RewardRubricRunResult:
+        try:
+            genai, genai_types = _load_google_genai()
+        except RuntimeError as exc:
+            detail = str(exc).strip() or "Google Generative AI SDK is required."
+            raise ProviderRequestError(self.name, request.model, detail) from exc
+        try:
+            requested_timeout = float(request.timeout)
+        except (TypeError, ValueError):
+            requested_timeout = float(DEFAULT_REQUEST_TIMEOUT_SECONDS)
+        retry_timeouts = _build_retry_timeouts(requested_timeout)
+        max_timeout = max(retry_timeouts)
+        with _suppress_pydantic_any_warning():
+            client = genai.Client(
+                api_key=request.api_key,
+                http_options={"timeout": _seconds_to_millis(max_timeout)},
+            )
+        schema_definition = reward_schema_definition()
+        gemini_schema = _json_schema_to_genai(schema_definition, genai_types)
+        config = genai_types.GenerateContentConfig(
+            response_mime_type="application/json",
+            response_schema=gemini_schema,
+            temperature=0,
+        )
+        combined_prompt = f"{request.system_content}\n\n{request.user_content}"
+        response: Any | None = None
+        last_error: Exception | None = None
+        for attempt_index, attempt_timeout in enumerate(retry_timeouts, start=1):
+            try:
+                with _suppress_pydantic_any_warning():
+                    try:
+                        response = client.models.generate_content(
+                            model=_normalize_gemini_model(request.model),
+                            contents=combined_prompt,
+                            config=config,
+                            request_options={"timeout": _seconds_to_millis(attempt_timeout)},
+                        )
+                    except TypeError as err:
+                        # Older SDKs may not accept request_options; retry without it.
+                        if "request_options" not in str(err):
+                            raise
+                        response = client.models.generate_content(
+                            model=_normalize_gemini_model(request.model),
+                            contents=combined_prompt,
+                            config=config,
+                        )
+                break
+            except Exception as err:  # pragma: no cover - network failures depend on runtime
+                last_error = err
+                if attempt_index >= len(retry_timeouts):
+                    detail = str(err).strip() or "Gemini request failed."
+                    raise ProviderRequestError(self.name, request.model, detail) from err
+                sleep_idx = min(attempt_index - 1, len(GEMINI_RETRY_SLEEP_SECONDS) - 1)
+                time.sleep(GEMINI_RETRY_SLEEP_SECONDS[sleep_idx])
+        if response is None and last_error is not None:
+            detail = str(last_error).strip() or "Gemini request failed."
+            raise ProviderRequestError(self.name, request.model, detail) from last_error
+        raw = dump_model(response)
+        text = getattr(response, "text", None)
+        if not isinstance(text, str) or not text.strip():
+            candidates = raw.get("candidates") if isinstance(raw, dict) else None
+            if isinstance(candidates, list) and candidates:
+                first = candidates[0]
+                if isinstance(first, dict):
+                    content = first.get("content")
+                    if isinstance(content, dict):
+                        parts = content.get("parts")
+                        if isinstance(parts, list):
+                            for part in parts:
+                                if isinstance(part, dict):
+                                    candidate_text = part.get("text")
+                                    if isinstance(candidate_text, str) and candidate_text.strip():
+                                        text = candidate_text
+                                        break
+        if not isinstance(text, str) or not text.strip():
+            raise ProviderRequestError(self.name, request.model, "Model response did not include any text content.")
+        try:
+            score, explanation = sanitize_json(text)
+        except ValueError as err:
+            raise ProviderRequestError(self.name, request.model, str(err)) from err
+        bounded = max(request.score_min, min(request.score_max, score))
+        return {"score": bounded, "explanation": explanation, "raw": raw}
+__all__ = ["GeminiProvider"]

osmosis-ai 0.2.1__py3-none-any.whl → 0.2.2__py3-none-any.whl

Potentially problematic release.

osmosis-ai 0.2.1py3-none-any.whl → 0.2.2py3-none-any.whl