PyPI - sentienceapi - Versions diffs - 0.92.2__py3-none-any.whl → 0.98.0__py3-none-any.whl - Mend

sentienceapi 0.92.2py3-none-any.whl → 0.98.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of sentienceapi might be problematic. Click here for more details.

Files changed (64) hide show

sentience/__init__.py +107 -2
sentience/_extension_loader.py +156 -1
sentience/action_executor.py +2 -0
sentience/actions.py +354 -9
sentience/agent.py +4 -0
sentience/agent_runtime.py +840 -0
sentience/asserts/__init__.py +70 -0
sentience/asserts/expect.py +621 -0
sentience/asserts/query.py +383 -0
sentience/async_api.py +8 -1
sentience/backends/__init__.py +137 -0
sentience/backends/actions.py +372 -0
sentience/backends/browser_use_adapter.py +241 -0
sentience/backends/cdp_backend.py +393 -0
sentience/backends/exceptions.py +211 -0
sentience/backends/playwright_backend.py +194 -0
sentience/backends/protocol.py +216 -0
sentience/backends/sentience_context.py +469 -0
sentience/backends/snapshot.py +483 -0
sentience/browser.py +230 -74
sentience/canonicalization.py +207 -0
sentience/cloud_tracing.py +65 -24
sentience/constants.py +6 -0
sentience/cursor_policy.py +142 -0
sentience/extension/content.js +35 -0
sentience/extension/injected_api.js +310 -15
sentience/extension/manifest.json +1 -1
sentience/extension/pkg/sentience_core.d.ts +22 -22
sentience/extension/pkg/sentience_core.js +192 -144
sentience/extension/pkg/sentience_core_bg.wasm +0 -0
sentience/extension/release.json +29 -29
sentience/failure_artifacts.py +241 -0
sentience/integrations/__init__.py +6 -0
sentience/integrations/langchain/__init__.py +12 -0
sentience/integrations/langchain/context.py +18 -0
sentience/integrations/langchain/core.py +326 -0
sentience/integrations/langchain/tools.py +180 -0
sentience/integrations/models.py +46 -0
sentience/integrations/pydanticai/__init__.py +15 -0
sentience/integrations/pydanticai/deps.py +20 -0
sentience/integrations/pydanticai/toolset.py +468 -0
sentience/llm_provider.py +695 -18
sentience/models.py +536 -3
sentience/ordinal.py +280 -0
sentience/query.py +66 -4
sentience/schemas/trace_v1.json +27 -1
sentience/snapshot.py +384 -93
sentience/snapshot_diff.py +39 -54
sentience/text_search.py +1 -0
sentience/trace_event_builder.py +20 -1
sentience/trace_indexing/indexer.py +3 -49
sentience/tracer_factory.py +1 -3
sentience/verification.py +618 -0
sentience/visual_agent.py +3 -1
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/METADATA +198 -40
sentienceapi-0.98.0.dist-info/RECORD +92 -0
sentience/utils.py +0 -296
sentienceapi-0.92.2.dist-info/RECORD +0 -65
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/WHEEL +0 -0
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/entry_points.txt +0 -0
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/licenses/LICENSE +0 -0
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/licenses/LICENSE-APACHE +0 -0
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/licenses/LICENSE-MIT +0 -0
{sentienceapi-0.92.2.dist-info → sentienceapi-0.98.0.dist-info}/top_level.txt +0 -0

sentience/llm_provider.py CHANGED Viewed

@@ -1,5 +1,3 @@
-from typing import Optional
 """
 LLM Provider abstraction layer for Sentience SDK
 Enables "Bring Your Own Brain" (BYOB) pattern - plug in any LLM provider
@@ -7,6 +5,7 @@ Enables "Bring Your Own Brain" (BYOB) pattern - plug in any LLM provider
 from abc import ABC, abstractmethod
 from dataclasses import dataclass
+from typing import Any
 from .llm_provider_utils import get_api_key_from_env, handle_provider_error, require_package
 from .llm_response_builder import LLMResponseBuilder
@@ -81,6 +80,48 @@ class LLMProvider(ABC):
         """
         pass
+    def supports_vision(self) -> bool:
+        """
+        Whether this provider supports image input for vision tasks.
+        Override in subclasses that support vision-capable models.
+        Returns:
+            True if provider supports vision, False otherwise
+        """
+        return False
+    def generate_with_image(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        image_base64: str,
+        **kwargs,
+    ) -> LLMResponse:
+        """
+        Generate a response with image input (for vision-capable models).
+        This method is used for vision fallback in assertions and visual agents.
+        Override in subclasses that support vision-capable models.
+        Args:
+            system_prompt: System instruction/context
+            user_prompt: User query/request
+            image_base64: Base64-encoded image (PNG or JPEG)
+            **kwargs: Provider-specific parameters (temperature, max_tokens, etc.)
+        Returns:
+            LLMResponse with content and token usage
+        Raises:
+            NotImplementedError: If provider doesn't support vision
+        """
+        raise NotImplementedError(
+            f"{type(self).__name__} does not support vision. "
+            "Use a vision-capable provider like OpenAIProvider with GPT-4o "
+            "or AnthropicProvider with Claude 3."
+        )
 class OpenAIProvider(LLMProvider):
     """
@@ -187,6 +228,92 @@ class OpenAIProvider(LLMProvider):
         model_lower = self._model_name.lower()
         return any(x in model_lower for x in ["gpt-4", "gpt-3.5"])
+    def supports_vision(self) -> bool:
+        """GPT-4o, GPT-4-turbo, and GPT-4-vision support vision."""
+        model_lower = self._model_name.lower()
+        return any(x in model_lower for x in ["gpt-4o", "gpt-4-turbo", "gpt-4-vision"])
+    def generate_with_image(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        image_base64: str,
+        temperature: float = 0.0,
+        max_tokens: int | None = None,
+        **kwargs,
+    ) -> LLMResponse:
+        """
+        Generate response with image input using OpenAI Vision API.
+        Args:
+            system_prompt: System instruction
+            user_prompt: User query
+            image_base64: Base64-encoded image (PNG or JPEG)
+            temperature: Sampling temperature (0.0 = deterministic)
+            max_tokens: Maximum tokens to generate
+            **kwargs: Additional OpenAI API parameters
+        Returns:
+            LLMResponse object
+        Raises:
+            NotImplementedError: If model doesn't support vision
+        """
+        if not self.supports_vision():
+            raise NotImplementedError(
+                f"Model {self._model_name} does not support vision. "
+                "Use gpt-4o, gpt-4-turbo, or gpt-4-vision-preview."
+            )
+        messages = []
+        if system_prompt:
+            messages.append({"role": "system", "content": system_prompt})
+        # Vision message format with image_url
+        messages.append(
+            {
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": user_prompt},
+                    {
+                        "type": "image_url",
+                        "image_url": {"url": f"data:image/png;base64,{image_base64}"},
+                    },
+                ],
+            }
+        )
+        # Build API parameters
+        api_params = {
+            "model": self._model_name,
+            "messages": messages,
+            "temperature": temperature,
+        }
+        if max_tokens:
+            api_params["max_tokens"] = max_tokens
+        # Merge additional parameters
+        api_params.update(kwargs)
+        # Call OpenAI API
+        try:
+            response = self.client.chat.completions.create(**api_params)
+        except Exception as e:
+            handle_provider_error(e, "OpenAI", "generate response with image")
+        choice = response.choices[0]
+        usage = response.usage
+        return LLMResponseBuilder.from_openai_format(
+            content=choice.message.content,
+            prompt_tokens=usage.prompt_tokens if usage else None,
+            completion_tokens=usage.completion_tokens if usage else None,
+            total_tokens=usage.total_tokens if usage else None,
+            model_name=response.model,
+            finish_reason=choice.finish_reason,
+        )
     @property
     def model_name(self) -> str:
         return self._model_name
@@ -277,6 +404,94 @@ class AnthropicProvider(LLMProvider):
         """Anthropic doesn't have native JSON mode (requires prompt engineering)"""
         return False
+    def supports_vision(self) -> bool:
+        """Claude 3 models (Opus, Sonnet, Haiku) all support vision."""
+        model_lower = self._model_name.lower()
+        return any(x in model_lower for x in ["claude-3", "claude-3.5"])
+    def generate_with_image(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        image_base64: str,
+        temperature: float = 0.0,
+        max_tokens: int = 1024,
+        **kwargs,
+    ) -> LLMResponse:
+        """
+        Generate response with image input using Anthropic Vision API.
+        Args:
+            system_prompt: System instruction
+            user_prompt: User query
+            image_base64: Base64-encoded image (PNG or JPEG)
+            temperature: Sampling temperature
+            max_tokens: Maximum tokens to generate (required by Anthropic)
+            **kwargs: Additional Anthropic API parameters
+        Returns:
+            LLMResponse object
+        Raises:
+            NotImplementedError: If model doesn't support vision
+        """
+        if not self.supports_vision():
+            raise NotImplementedError(
+                f"Model {self._model_name} does not support vision. "
+                "Use Claude 3 models (claude-3-opus, claude-3-sonnet, claude-3-haiku)."
+            )
+        # Anthropic vision message format
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {
+                        "type": "image",
+                        "source": {
+                            "type": "base64",
+                            "media_type": "image/png",
+                            "data": image_base64,
+                        },
+                    },
+                    {
+                        "type": "text",
+                        "text": user_prompt,
+                    },
+                ],
+            }
+        ]
+        # Build API parameters
+        api_params = {
+            "model": self._model_name,
+            "max_tokens": max_tokens,
+            "temperature": temperature,
+            "messages": messages,
+        }
+        if system_prompt:
+            api_params["system"] = system_prompt
+        # Merge additional parameters
+        api_params.update(kwargs)
+        # Call Anthropic API
+        try:
+            response = self.client.messages.create(**api_params)
+        except Exception as e:
+            handle_provider_error(e, "Anthropic", "generate response with image")
+        content = response.content[0].text if response.content else ""
+        return LLMResponseBuilder.from_anthropic_format(
+            content=content,
+            input_tokens=response.usage.input_tokens if hasattr(response, "usage") else None,
+            output_tokens=response.usage.output_tokens if hasattr(response, "usage") else None,
+            model_name=response.model,
+            stop_reason=response.stop_reason,
+        )
     @property
     def model_name(self) -> str:
         return self._model_name
@@ -527,15 +742,22 @@ class LocalLLMProvider(LLMProvider):
         """
         super().__init__(model_name)  # Initialize base class with model name
-        # Import required packages with consistent error handling
+        # Import required packages with consistent error handling.
+        # These are optional dependencies, so keep them out of module import-time.
         try:
-            import torch
-            from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
-        except ImportError:
+            import torch  # type: ignore[import-not-found]
+            from transformers import (  # type: ignore[import-not-found]
+                AutoModelForCausalLM,
+                AutoTokenizer,
+                BitsAndBytesConfig,
+            )
+        except ImportError as exc:
             raise ImportError(
                 "transformers and torch required for local LLM. "
                 "Install with: pip install transformers torch"
-            )
+            ) from exc
+        self._torch = torch
         # Load tokenizer
         self.tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
@@ -556,21 +778,44 @@ class LocalLLMProvider(LLMProvider):
         elif load_in_8bit:
             quantization_config = BitsAndBytesConfig(load_in_8bit=True)
+        device = (device or "auto").strip().lower()
         # Determine torch dtype
         if torch_dtype == "auto":
-            dtype = torch.float16 if device != "cpu" else torch.float32
+            dtype = torch.float16 if device not in {"cpu"} else torch.float32
         else:
             dtype = getattr(torch, torch_dtype)
-        # Load model
-        self.model = AutoModelForCausalLM.from_pretrained(
-            model_name,
-            quantization_config=quantization_config,
-            torch_dtype=dtype if quantization_config is None else None,
-            device_map=device,
-            trust_remote_code=True,
-            low_cpu_mem_usage=True,
-        )
+        # device_map is a Transformers concept (not a literal "cpu/mps/cuda" device string).
+        # - "auto" enables Accelerate device mapping.
+        # - Otherwise, we load normally and then move the model to the requested device.
+        device_map: str | None = "auto" if device == "auto" else None
+        def _load(*, device_map_override: str | None) -> Any:
+            return AutoModelForCausalLM.from_pretrained(
+                model_name,
+                quantization_config=quantization_config,
+                torch_dtype=dtype if quantization_config is None else None,
+                device_map=device_map_override,
+                trust_remote_code=True,
+                low_cpu_mem_usage=True,
+            )
+        try:
+            self.model = _load(device_map_override=device_map)
+        except KeyError as e:
+            # Some envs / accelerate versions can crash on auto mapping (e.g. KeyError: 'cpu').
+            # Keep demo ergonomics: default stays "auto", but we gracefully fall back.
+            if device == "auto" and ("cpu" in str(e).lower()):
+                device = "cpu"
+                dtype = torch.float32
+                self.model = _load(device_map_override=None)
+            else:
+                raise
+        # If we didn't use device_map, move model explicitly (only safe for non-quantized loads).
+        if device_map is None and quantization_config is None and device in {"cpu", "cuda", "mps"}:
+            self.model = self.model.to(device)
         self.model.eval()
     def generate(
@@ -596,7 +841,7 @@ class LocalLLMProvider(LLMProvider):
         Returns:
             LLMResponse object
         """
-        import torch
+        torch = self._torch
         # Auto-determine sampling based on temperature
         do_sample = temperature > 0
@@ -657,3 +902,435 @@ class LocalLLMProvider(LLMProvider):
     @property
     def model_name(self) -> str:
         return self._model_name
+class LocalVisionLLMProvider(LLMProvider):
+    """
+    Local vision-language LLM provider using HuggingFace Transformers.
+    Intended for models like:
+    - Qwen/Qwen3-VL-8B-Instruct
+    Notes on Mac (MPS) + quantization:
+    - Transformers BitsAndBytes (4-bit/8-bit) typically requires CUDA and does NOT work on MPS.
+    - If you want quantized local vision on Apple Silicon, you may prefer MLX-based stacks
+      (e.g., mlx-vlm) or llama.cpp/gguf pipelines.
+    """
+    def __init__(
+        self,
+        model_name: str = "Qwen/Qwen3-VL-8B-Instruct",
+        device: str = "auto",
+        torch_dtype: str = "auto",
+        load_in_4bit: bool = False,
+        load_in_8bit: bool = False,
+        trust_remote_code: bool = True,
+    ):
+        super().__init__(model_name)
+        # Import required packages with consistent error handling
+        try:
+            import torch  # type: ignore[import-not-found]
+            from transformers import AutoProcessor  # type: ignore[import-not-found]
+        except ImportError as exc:
+            raise ImportError(
+                "transformers and torch are required for LocalVisionLLMProvider. "
+                "Install with: pip install transformers torch"
+            ) from exc
+        self._torch = torch
+        # Resolve device
+        if device == "auto":
+            if (
+                getattr(torch.backends, "mps", None) is not None
+                and torch.backends.mps.is_available()
+            ):
+                device = "mps"
+            elif torch.cuda.is_available():
+                device = "cuda"
+            else:
+                device = "cpu"
+        if device == "mps" and (load_in_4bit or load_in_8bit):
+            raise ValueError(
+                "Quantized (4-bit/8-bit) Transformers loading is typically not supported on Apple MPS. "
+                "Set load_in_4bit/load_in_8bit to False for MPS, or use a different local runtime "
+                "(e.g., MLX/llama.cpp) for quantized vision models."
+            )
+        # Determine torch dtype
+        if torch_dtype == "auto":
+            dtype = torch.float16 if device in ("cuda", "mps") else torch.float32
+        else:
+            dtype = getattr(torch, torch_dtype)
+        # Load processor
+        self.processor = AutoProcessor.from_pretrained(
+            model_name, trust_remote_code=trust_remote_code
+        )
+        # Load model (prefer vision2seq; fall back with guidance)
+        try:
+            import importlib
+            transformers = importlib.import_module("transformers")
+            AutoModelForVision2Seq = getattr(transformers, "AutoModelForVision2Seq", None)
+            if AutoModelForVision2Seq is None:
+                raise AttributeError("transformers.AutoModelForVision2Seq is not available")
+            self.model = AutoModelForVision2Seq.from_pretrained(
+                model_name,
+                torch_dtype=dtype,
+                trust_remote_code=trust_remote_code,
+                low_cpu_mem_usage=True,
+            )
+        except Exception as exc:
+            # Some transformers versions/models don't expose AutoModelForVision2Seq.
+            # We fail loudly with a helpful message rather than silently doing text-only.
+            raise ImportError(
+                "Failed to load a vision-capable Transformers model. "
+                "Try upgrading transformers (vision models often require newer versions), "
+                "or use a model class supported by your installed transformers build."
+            ) from exc
+        # Move to device
+        self.device = device
+        self.model.to(device)
+        self.model.eval()
+    def supports_json_mode(self) -> bool:
+        return False
+    def supports_vision(self) -> bool:
+        return True
+    @property
+    def model_name(self) -> str:
+        return self._model_name
+    def generate(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        max_new_tokens: int = 512,
+        temperature: float = 0.1,
+        top_p: float = 0.9,
+        **kwargs,
+    ) -> LLMResponse:
+        """
+        Text-only generation (no image). Provided for interface completeness.
+        """
+        torch = self._torch
+        messages = []
+        if system_prompt:
+            messages.append({"role": "system", "content": system_prompt})
+        messages.append({"role": "user", "content": user_prompt})
+        if hasattr(self.processor, "apply_chat_template"):
+            prompt = self.processor.apply_chat_template(
+                messages, tokenize=False, add_generation_prompt=True
+            )
+        else:
+            prompt = (system_prompt + "\n\n" if system_prompt else "") + user_prompt
+        inputs = self.processor(text=[prompt], return_tensors="pt")
+        inputs = {
+            k: (v.to(self.model.device) if hasattr(v, "to") else v) for k, v in inputs.items()
+        }
+        do_sample = temperature > 0
+        with torch.no_grad():
+            outputs = self.model.generate(
+                **inputs,
+                max_new_tokens=max_new_tokens,
+                do_sample=do_sample,
+                temperature=temperature if do_sample else 1.0,
+                top_p=top_p,
+                **kwargs,
+            )
+        # Decode
+        input_len = inputs["input_ids"].shape[1] if "input_ids" in inputs else 0
+        generated = outputs[0][input_len:]
+        if hasattr(self.processor, "batch_decode"):
+            text = self.processor.batch_decode([generated], skip_special_tokens=True)[0].strip()
+        else:
+            text = str(generated)
+        return LLMResponseBuilder.from_local_format(
+            content=text,
+            prompt_tokens=int(input_len) if input_len else None,
+            completion_tokens=int(generated.shape[0]) if hasattr(generated, "shape") else None,
+            model_name=self._model_name,
+        )
+    def generate_with_image(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        image_base64: str,
+        max_new_tokens: int = 256,
+        temperature: float = 0.0,
+        top_p: float = 0.9,
+        **kwargs,
+    ) -> LLMResponse:
+        """
+        Vision generation using an image + prompt.
+        This is used by vision fallback in assertions and by visual agents.
+        """
+        torch = self._torch
+        # Lazy import PIL to avoid adding a hard dependency for text-only users.
+        try:
+            from PIL import Image  # type: ignore[import-not-found]
+        except ImportError as exc:
+            raise ImportError(
+                "Pillow is required for LocalVisionLLMProvider image input. Install with: pip install pillow"
+            ) from exc
+        import base64
+        import io
+        img_bytes = base64.b64decode(image_base64)
+        image = Image.open(io.BytesIO(img_bytes)).convert("RGB")
+        # Prefer processor chat template if available (needed by many VL models).
+        messages = []
+        if system_prompt:
+            messages.append({"role": "system", "content": system_prompt})
+        messages.append(
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image", "image": image},
+                    {"type": "text", "text": user_prompt},
+                ],
+            }
+        )
+        if hasattr(self.processor, "apply_chat_template"):
+            prompt = self.processor.apply_chat_template(
+                messages, tokenize=False, add_generation_prompt=True
+            )
+        else:
+            raise NotImplementedError(
+                "This local vision model/processor does not expose apply_chat_template(). "
+                "Install/upgrade to a Transformers version that supports your model's chat template."
+            )
+        inputs = self.processor(text=[prompt], images=[image], return_tensors="pt")
+        inputs = {
+            k: (v.to(self.model.device) if hasattr(v, "to") else v) for k, v in inputs.items()
+        }
+        do_sample = temperature > 0
+        with torch.no_grad():
+            outputs = self.model.generate(
+                **inputs,
+                max_new_tokens=max_new_tokens,
+                do_sample=do_sample,
+                temperature=temperature if do_sample else 1.0,
+                top_p=top_p,
+                **kwargs,
+            )
+        input_len = inputs["input_ids"].shape[1] if "input_ids" in inputs else 0
+        generated = outputs[0][input_len:]
+        if hasattr(self.processor, "batch_decode"):
+            text = self.processor.batch_decode([generated], skip_special_tokens=True)[0].strip()
+        elif hasattr(self.processor, "tokenizer") and hasattr(self.processor.tokenizer, "decode"):
+            text = self.processor.tokenizer.decode(generated, skip_special_tokens=True).strip()
+        else:
+            text = ""
+        return LLMResponseBuilder.from_local_format(
+            content=text,
+            prompt_tokens=int(input_len) if input_len else None,
+            completion_tokens=int(generated.shape[0]) if hasattr(generated, "shape") else None,
+            model_name=self._model_name,
+        )
+class MLXVLMProvider(LLMProvider):
+    """
+    Local vision-language provider using MLX-VLM (Apple Silicon optimized).
+    Recommended for running *quantized* vision models on Mac (M1/M2/M3/M4), e.g.:
+    - mlx-community/Qwen3-VL-8B-Instruct-3bit
+    Optional dependencies:
+    - mlx-vlm
+    - pillow
+    Notes:
+    - MLX-VLM APIs can vary across versions; this provider tries a couple common call shapes.
+    - For best results, use an MLX-converted model repo under `mlx-community/`.
+    """
+    def __init__(
+        self,
+        model: str = "mlx-community/Qwen3-VL-8B-Instruct-3bit",
+        *,
+        default_max_tokens: int = 256,
+        default_temperature: float = 0.0,
+        **kwargs,
+    ):
+        super().__init__(model)
+        self._default_max_tokens = default_max_tokens
+        self._default_temperature = default_temperature
+        self._default_kwargs = dict(kwargs)
+        # Lazy imports to keep base SDK light.
+        try:
+            import importlib
+            self._mlx_vlm = importlib.import_module("mlx_vlm")
+        except ImportError as exc:
+            raise ImportError(
+                "mlx-vlm is required for MLXVLMProvider. Install with: pip install mlx-vlm"
+            ) from exc
+        try:
+            from PIL import Image  # type: ignore[import-not-found]
+            self._PIL_Image = Image
+        except ImportError as exc:
+            raise ImportError(
+                "Pillow is required for MLXVLMProvider. Install with: pip install pillow"
+            ) from exc
+        # Some mlx_vlm versions expose load(model_id) -> (model, processor)
+        self._model = None
+        self._processor = None
+        load_fn = getattr(self._mlx_vlm, "load", None)
+        if callable(load_fn):
+            try:
+                loaded = load_fn(model)
+                if isinstance(loaded, tuple) and len(loaded) >= 2:
+                    self._model, self._processor = loaded[0], loaded[1]
+            except Exception:
+                # Keep it lazy; we'll try loading on demand during generate_with_image().
+                self._model, self._processor = None, None
+    def supports_json_mode(self) -> bool:
+        return False
+    def supports_vision(self) -> bool:
+        return True
+    @property
+    def model_name(self) -> str:
+        return self._model_name
+    def generate(self, system_prompt: str, user_prompt: str, **kwargs) -> LLMResponse:
+        """
+        Text-only generation is not a primary MLX-VLM use-case. We attempt it if the installed
+        mlx_vlm exposes a compatible `generate()` signature; otherwise, raise a clear error.
+        """
+        generate_fn = getattr(self._mlx_vlm, "generate", None)
+        if not callable(generate_fn):
+            raise NotImplementedError("mlx_vlm.generate is not available in your mlx-vlm install.")
+        prompt = (system_prompt + "\n\n" if system_prompt else "") + user_prompt
+        max_tokens = kwargs.pop("max_tokens", self._default_max_tokens)
+        temperature = kwargs.pop("temperature", self._default_temperature)
+        merged_kwargs = {**self._default_kwargs, **kwargs}
+        try:
+            out = generate_fn(
+                self._model_name,
+                prompt=prompt,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                **merged_kwargs,
+            )
+        except TypeError as exc:
+            if self._model is None or self._processor is None:
+                raise NotImplementedError(
+                    "Text-only generation is not supported by this mlx-vlm version without a loaded model."
+                ) from exc
+            out = generate_fn(
+                self._model,
+                self._processor,
+                prompt,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                **merged_kwargs,
+            )
+        text = getattr(out, "text", None) or getattr(out, "output", None) or str(out)
+        return LLMResponseBuilder.from_local_format(
+            content=str(text).strip(),
+            prompt_tokens=None,
+            completion_tokens=None,
+            model_name=self._model_name,
+        )
+    def generate_with_image(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        image_base64: str,
+        **kwargs,
+    ) -> LLMResponse:
+        import base64
+        import io
+        generate_fn = getattr(self._mlx_vlm, "generate", None)
+        if not callable(generate_fn):
+            raise NotImplementedError("mlx_vlm.generate is not available in your mlx-vlm install.")
+        img_bytes = base64.b64decode(image_base64)
+        image = self._PIL_Image.open(io.BytesIO(img_bytes)).convert("RGB")
+        prompt = (system_prompt + "\n\n" if system_prompt else "") + user_prompt
+        max_tokens = kwargs.pop("max_tokens", self._default_max_tokens)
+        temperature = kwargs.pop("temperature", self._default_temperature)
+        merged_kwargs = {**self._default_kwargs, **kwargs}
+        # Try a couple common MLX-VLM call shapes.
+        try:
+            # 1) generate(model_id, image=..., prompt=...)
+            out = generate_fn(
+                self._model_name,
+                image=image,
+                prompt=prompt,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                **merged_kwargs,
+            )
+        except TypeError as exc:
+            # 2) generate(model, processor, prompt, image, ...)
+            if self._model is None or self._processor is None:
+                load_fn = getattr(self._mlx_vlm, "load", None)
+                if callable(load_fn):
+                    loaded = load_fn(self._model_name)
+                    if isinstance(loaded, tuple) and len(loaded) >= 2:
+                        self._model, self._processor = loaded[0], loaded[1]
+            if self._model is None or self._processor is None:
+                raise NotImplementedError(
+                    "Unable to call mlx_vlm.generate with your installed mlx-vlm version. "
+                    "Please upgrade mlx-vlm or use LocalVisionLLMProvider (Transformers backend)."
+                ) from exc
+            out = generate_fn(
+                self._model,
+                self._processor,
+                prompt,
+                image,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                **merged_kwargs,
+            )
+        text = getattr(out, "text", None) or getattr(out, "output", None) or str(out)
+        return LLMResponseBuilder.from_local_format(
+            content=str(text).strip(),
+            prompt_tokens=None,
+            completion_tokens=None,
+            model_name=self._model_name,
+        )

sentienceapi 0.92.2__py3-none-any.whl → 0.98.0__py3-none-any.whl

Potentially problematic release.

sentienceapi 0.92.2py3-none-any.whl → 0.98.0py3-none-any.whl