PyPI - prompture - Versions diffs - 0.0.49__tar.gz → 0.0.50__tar.gz - Mend

prompture 0.0.49tar.gz → 0.0.50tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (144) hide show

{prompture-0.0.49 → prompture-0.0.50}/.env.copy RENAMED Viewed

@@ -25,12 +25,22 @@ LMSTUDIO_ENDPOINT=http://127.0.0.1:1234/v1/chat/completions
 LMSTUDIO_MODEL=deepseek/deepseek-r1-0528-qwen3-8b
 LMSTUDIO_API_KEY=
-# Azure OpenAI Configuration
+# Azure OpenAI Configuration (default backend)
 AZURE_API_KEY=
 AZURE_API_ENDPOINT=
 AZURE_DEPLOYMENT_ID=
 AZURE_API_VERSION=
+# Azure Claude Backend (optional, for claude-* models on Azure)
+AZURE_CLAUDE_API_KEY=
+AZURE_CLAUDE_ENDPOINT=
+AZURE_CLAUDE_API_VERSION=
+# Azure Mistral Backend (optional, for mistral-*/mixtral-* models on Azure)
+AZURE_MISTRAL_API_KEY=
+AZURE_MISTRAL_ENDPOINT=
+AZURE_MISTRAL_API_VERSION=
 # Additional Providers (not required for tests)
 # HuggingFace Configuration
 HF_ENDPOINT=

{prompture-0.0.49 → prompture-0.0.50}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: prompture
-Version: 0.0.49
+Version: 0.0.50
 Summary: Ask LLMs to return structured JSON and run cross-model tests. API-first.
 Author-email: Juan Denis <juan@vene.co>
 License-Expression: MIT

prompture-0.0.50/VERSION ADDED Viewed

	@@ -0,0 +1 @@
1	+ 0.0.50

{prompture-0.0.49 → prompture-0.0.50}/prompture/__init__.py RENAMED Viewed

@@ -60,6 +60,8 @@ from .drivers import (
     OllamaDriver,
     OpenAIDriver,
     OpenRouterDriver,
+    # Azure config API
+    clear_azure_configs,
     get_driver,
     get_driver_for_model,
     # Plugin registration API
@@ -69,8 +71,11 @@ from .drivers import (
     list_registered_drivers,
     load_entry_point_drivers,
     register_async_driver,
+    register_azure_config,
     register_driver,
+    set_azure_config_resolver,
     unregister_async_driver,
+    unregister_azure_config,
     unregister_driver,
 )
 from .field_definitions import (
@@ -247,6 +252,7 @@ __all__ = [
     "clean_json_text",
     "clean_json_text_with_ai",
     "clean_toon_text",
+    "clear_azure_configs",
     "clear_persona_registry",
     "clear_registry",
     "configure_cache",
@@ -292,6 +298,7 @@ __all__ = [
     "normalize_enum_value",
     "refresh_rates_cache",
     "register_async_driver",
+    "register_azure_config",
     "register_driver",
     "register_field",
     "register_persona",
@@ -301,9 +308,11 @@ __all__ = [
     "reset_registry",
     "reset_trait_registry",
     "run_suite_from_spec",
+    "set_azure_config_resolver",
     "stepwise_extract_with_model",
     "tool_from_function",
     "unregister_async_driver",
+    "unregister_azure_config",
     "unregister_driver",
     "validate_against_schema",
     "validate_enum_value",

{prompture-0.0.49 → prompture-0.0.50}/prompture/_version.py RENAMED Viewed

@@ -28,7 +28,7 @@ version_tuple: VERSION_TUPLE
 commit_id: COMMIT_ID
 __commit_id__: COMMIT_ID
-__version__ = version = '0.0.49'
-__version_tuple__ = version_tuple = (0, 0, 49)
+__version__ = version = '0.0.50'
+__version_tuple__ = version_tuple = (0, 0, 50)
 __commit_id__ = commit_id = None

{prompture-0.0.49 → prompture-0.0.50}/prompture/discovery.py RENAMED Viewed

@@ -89,10 +89,17 @@ def get_available_models(
                 if settings.openai_api_key or os.getenv("OPENAI_API_KEY"):
                     is_configured = True
             elif provider == "azure":
+                from .drivers.azure_config import has_azure_config_resolver, has_registered_configs
                 if (
-                    (settings.azure_api_key or os.getenv("AZURE_API_KEY"))
-                    and (settings.azure_api_endpoint or os.getenv("AZURE_API_ENDPOINT"))
-                    and (settings.azure_deployment_id or os.getenv("AZURE_DEPLOYMENT_ID"))
+                    (
+                        (settings.azure_api_key or os.getenv("AZURE_API_KEY"))
+                        and (settings.azure_api_endpoint or os.getenv("AZURE_API_ENDPOINT"))
+                    )
+                    or (settings.azure_claude_api_key or os.getenv("AZURE_CLAUDE_API_KEY"))
+                    or (settings.azure_mistral_api_key or os.getenv("AZURE_MISTRAL_API_KEY"))
+                    or has_registered_configs()
+                    or has_azure_config_resolver()
                 ):
                     is_configured = True
             elif provider == "claude":

{prompture-0.0.49 → prompture-0.0.50}/prompture/drivers/__init__.py RENAMED Viewed

@@ -44,6 +44,12 @@ from .async_openai_driver import AsyncOpenAIDriver
 from .async_openrouter_driver import AsyncOpenRouterDriver
 from .async_registry import ASYNC_DRIVER_REGISTRY, get_async_driver, get_async_driver_for_model
 from .async_zai_driver import AsyncZaiDriver
+from .azure_config import (
+    clear_azure_configs,
+    register_azure_config,
+    set_azure_config_resolver,
+    unregister_azure_config,
+)
 from .azure_driver import AzureDriver
 from .claude_driver import ClaudeDriver
 from .google_driver import GoogleDriver
@@ -100,7 +106,10 @@ register_driver(
 register_driver(
     "azure",
     lambda model=None: AzureDriver(
-        api_key=settings.azure_api_key, endpoint=settings.azure_api_endpoint, deployment_id=settings.azure_deployment_id
+        api_key=settings.azure_api_key,
+        endpoint=settings.azure_api_endpoint,
+        deployment_id=settings.azure_deployment_id,
+        model=model or "gpt-4o-mini",
     ),
     overwrite=True,
 )
@@ -249,6 +258,8 @@ __all__ = [
     "OpenAIDriver",
     "OpenRouterDriver",
     "ZaiDriver",
+    # Azure config API
+    "clear_azure_configs",
     "get_async_driver",
     "get_async_driver_for_model",
     # Factory functions
@@ -260,8 +271,11 @@ __all__ = [
     "list_registered_drivers",
     "load_entry_point_drivers",
     "register_async_driver",
+    "register_azure_config",
     # Registry functions (public API)
     "register_driver",
+    "set_azure_config_resolver",
     "unregister_async_driver",
+    "unregister_azure_config",
     "unregister_driver",
 ]

prompture-0.0.50/prompture/drivers/async_azure_driver.py ADDED Viewed

@@ -0,0 +1,418 @@
+"""Async Azure driver with multi-endpoint and multi-backend support.
+Requires the ``openai`` package (>=1.0.0). Claude backend also requires ``anthropic``.
+"""
+from __future__ import annotations
+import json
+import os
+from typing import Any
+try:
+    from openai import AsyncAzureOpenAI
+except Exception:
+    AsyncAzureOpenAI = None
+try:
+    import anthropic
+except Exception:
+    anthropic = None
+from ..async_driver import AsyncDriver
+from ..cost_mixin import CostMixin, prepare_strict_schema
+from .azure_config import classify_backend, resolve_config
+from .azure_driver import AzureDriver
+class AsyncAzureDriver(CostMixin, AsyncDriver):
+    supports_json_mode = True
+    supports_json_schema = True
+    supports_tool_use = True
+    supports_vision = True
+    MODEL_PRICING = AzureDriver.MODEL_PRICING
+    def __init__(
+        self,
+        api_key: str | None = None,
+        endpoint: str | None = None,
+        deployment_id: str | None = None,
+        model: str = "gpt-4o-mini",
+    ):
+        self.model = model
+        self._default_config = {
+            "api_key": api_key or os.getenv("AZURE_API_KEY"),
+            "endpoint": endpoint or os.getenv("AZURE_API_ENDPOINT"),
+            "deployment_id": deployment_id or os.getenv("AZURE_DEPLOYMENT_ID"),
+            "api_version": os.getenv("AZURE_API_VERSION", "2024-02-15-preview"),
+        }
+        self._openai_clients: dict[tuple[str, str], AsyncAzureOpenAI] = {}
+        self._anthropic_clients: dict[tuple[str, str], Any] = {}
+    supports_messages = True
+    def _prepare_messages(self, messages: list[dict[str, Any]]) -> list[dict[str, Any]]:
+        from .vision_helpers import _prepare_openai_vision_messages
+        return _prepare_openai_vision_messages(messages)
+    def _resolve_model_config(self, model: str, options: dict[str, Any]) -> dict[str, Any]:
+        """Resolve Azure config for this model using the priority chain."""
+        override = options.pop("azure_config", None)
+        return resolve_config(model, override=override, default_config=self._default_config)
+    def _get_openai_client(self, config: dict[str, Any]) -> AsyncAzureOpenAI:
+        """Get or create an AsyncAzureOpenAI client for the given config."""
+        if AsyncAzureOpenAI is None:
+            raise RuntimeError("openai package (>=1.0.0) with AsyncAzureOpenAI not installed")
+        cache_key = (config["endpoint"], config["api_key"])
+        if cache_key not in self._openai_clients:
+            self._openai_clients[cache_key] = AsyncAzureOpenAI(
+                api_key=config["api_key"],
+                api_version=config.get("api_version", "2024-02-15-preview"),
+                azure_endpoint=config["endpoint"],
+            )
+        return self._openai_clients[cache_key]
+    def _get_anthropic_client(self, config: dict[str, Any]) -> Any:
+        """Get or create an AsyncAnthropic client for the given Azure config."""
+        if anthropic is None:
+            raise RuntimeError("anthropic package not installed (required for Claude on Azure)")
+        cache_key = (config["endpoint"], config["api_key"])
+        if cache_key not in self._anthropic_clients:
+            self._anthropic_clients[cache_key] = anthropic.AsyncAnthropic(
+                base_url=config["endpoint"],
+                api_key=config["api_key"],
+            )
+        return self._anthropic_clients[cache_key]
+    async def generate(self, prompt: str, options: dict[str, Any]) -> dict[str, Any]:
+        messages = [{"role": "user", "content": prompt}]
+        return await self._do_generate(messages, options)
+    async def generate_messages(self, messages: list[dict[str, str]], options: dict[str, Any]) -> dict[str, Any]:
+        return await self._do_generate(self._prepare_messages(messages), options)
+    async def _do_generate(self, messages: list[dict[str, str]], options: dict[str, Any]) -> dict[str, Any]:
+        model = options.get("model", self.model)
+        config = self._resolve_model_config(model, options)
+        backend = classify_backend(model)
+        if backend == "claude":
+            return await self._generate_claude(messages, options, config, model)
+        else:
+            return await self._generate_openai(messages, options, config, model)
+    async def _generate_openai(
+        self,
+        messages: list[dict[str, Any]],
+        options: dict[str, Any],
+        config: dict[str, Any],
+        model: str,
+    ) -> dict[str, Any]:
+        """Generate via Azure OpenAI (or Mistral OpenAI-compat) endpoint."""
+        client = self._get_openai_client(config)
+        deployment_id = config.get("deployment_id") or model
+        model_config = self._get_model_config("azure", model)
+        tokens_param = model_config["tokens_param"]
+        supports_temperature = model_config["supports_temperature"]
+        opts = {"temperature": 1.0, "max_tokens": 512, **options}
+        kwargs = {
+            "model": deployment_id,
+            "messages": messages,
+        }
+        kwargs[tokens_param] = opts.get("max_tokens", 512)
+        if supports_temperature and "temperature" in opts:
+            kwargs["temperature"] = opts["temperature"]
+        if options.get("json_mode"):
+            json_schema = options.get("json_schema")
+            if json_schema:
+                schema_copy = prepare_strict_schema(json_schema)
+                kwargs["response_format"] = {
+                    "type": "json_schema",
+                    "json_schema": {
+                        "name": "extraction",
+                        "strict": True,
+                        "schema": schema_copy,
+                    },
+                }
+            else:
+                kwargs["response_format"] = {"type": "json_object"}
+        resp = await client.chat.completions.create(**kwargs)
+        usage = getattr(resp, "usage", None)
+        prompt_tokens = getattr(usage, "prompt_tokens", 0)
+        completion_tokens = getattr(usage, "completion_tokens", 0)
+        total_tokens = getattr(usage, "total_tokens", 0)
+        total_cost = self._calculate_cost("azure", model, prompt_tokens, completion_tokens)
+        meta = {
+            "prompt_tokens": prompt_tokens,
+            "completion_tokens": completion_tokens,
+            "total_tokens": total_tokens,
+            "cost": round(total_cost, 6),
+            "raw_response": resp.model_dump(),
+            "model_name": model,
+            "deployment_id": deployment_id,
+        }
+        text = resp.choices[0].message.content
+        return {"text": text, "meta": meta}
+    async def _generate_claude(
+        self,
+        messages: list[dict[str, Any]],
+        options: dict[str, Any],
+        config: dict[str, Any],
+        model: str,
+    ) -> dict[str, Any]:
+        """Generate via Anthropic SDK with Azure endpoint."""
+        client = self._get_anthropic_client(config)
+        opts = {**{"temperature": 0.0, "max_tokens": 512}, **options}
+        system_content = None
+        api_messages = []
+        for msg in messages:
+            if msg.get("role") == "system":
+                system_content = msg.get("content", "")
+            else:
+                api_messages.append(msg)
+        common_kwargs: dict[str, Any] = {
+            "model": model,
+            "messages": api_messages,
+            "temperature": opts["temperature"],
+            "max_tokens": opts["max_tokens"],
+        }
+        if system_content:
+            common_kwargs["system"] = system_content
+        if options.get("json_mode"):
+            json_schema = options.get("json_schema")
+            if json_schema:
+                tool_def = {
+                    "name": "extract_json",
+                    "description": "Extract structured data matching the schema",
+                    "input_schema": json_schema,
+                }
+                resp = await client.messages.create(
+                    **common_kwargs,
+                    tools=[tool_def],
+                    tool_choice={"type": "tool", "name": "extract_json"},
+                )
+                text = ""
+                for block in resp.content:
+                    if block.type == "tool_use":
+                        text = json.dumps(block.input)
+                        break
+            else:
+                resp = await client.messages.create(**common_kwargs)
+                text = resp.content[0].text
+        else:
+            resp = await client.messages.create(**common_kwargs)
+            text = resp.content[0].text
+        prompt_tokens = resp.usage.input_tokens
+        completion_tokens = resp.usage.output_tokens
+        total_tokens = prompt_tokens + completion_tokens
+        total_cost = self._calculate_cost("azure", model, prompt_tokens, completion_tokens)
+        meta = {
+            "prompt_tokens": prompt_tokens,
+            "completion_tokens": completion_tokens,
+            "total_tokens": total_tokens,
+            "cost": round(total_cost, 6),
+            "raw_response": dict(resp),
+            "model_name": model,
+        }
+        text_result = text or ""
+        return {"text": text_result, "meta": meta}
+    # ------------------------------------------------------------------
+    # Tool use
+    # ------------------------------------------------------------------
+    async def generate_messages_with_tools(
+        self,
+        messages: list[dict[str, Any]],
+        tools: list[dict[str, Any]],
+        options: dict[str, Any],
+    ) -> dict[str, Any]:
+        """Generate a response that may include tool calls."""
+        model = options.get("model", self.model)
+        config = self._resolve_model_config(model, options)
+        backend = classify_backend(model)
+        if backend == "claude":
+            return await self._generate_claude_with_tools(messages, tools, options, config, model)
+        else:
+            return await self._generate_openai_with_tools(messages, tools, options, config, model)
+    async def _generate_openai_with_tools(
+        self,
+        messages: list[dict[str, Any]],
+        tools: list[dict[str, Any]],
+        options: dict[str, Any],
+        config: dict[str, Any],
+        model: str,
+    ) -> dict[str, Any]:
+        """Tool calling via Azure OpenAI endpoint."""
+        client = self._get_openai_client(config)
+        deployment_id = config.get("deployment_id") or model
+        model_config = self._get_model_config("azure", model)
+        tokens_param = model_config["tokens_param"]
+        supports_temperature = model_config["supports_temperature"]
+        self._validate_model_capabilities("azure", model, using_tool_use=True)
+        opts = {"temperature": 1.0, "max_tokens": 512, **options}
+        kwargs: dict[str, Any] = {
+            "model": deployment_id,
+            "messages": messages,
+            "tools": tools,
+        }
+        kwargs[tokens_param] = opts.get("max_tokens", 512)
+        if supports_temperature and "temperature" in opts:
+            kwargs["temperature"] = opts["temperature"]
+        resp = await client.chat.completions.create(**kwargs)
+        usage = getattr(resp, "usage", None)
+        prompt_tokens = getattr(usage, "prompt_tokens", 0)
+        completion_tokens = getattr(usage, "completion_tokens", 0)
+        total_tokens = getattr(usage, "total_tokens", 0)
+        total_cost = self._calculate_cost("azure", model, prompt_tokens, completion_tokens)
+        meta = {
+            "prompt_tokens": prompt_tokens,
+            "completion_tokens": completion_tokens,
+            "total_tokens": total_tokens,
+            "cost": round(total_cost, 6),
+            "raw_response": resp.model_dump(),
+            "model_name": model,
+            "deployment_id": deployment_id,
+        }
+        choice = resp.choices[0]
+        text = choice.message.content or ""
+        stop_reason = choice.finish_reason
+        tool_calls_out: list[dict[str, Any]] = []
+        if choice.message.tool_calls:
+            for tc in choice.message.tool_calls:
+                try:
+                    args = json.loads(tc.function.arguments)
+                except (json.JSONDecodeError, TypeError):
+                    args = {}
+                tool_calls_out.append(
+                    {
+                        "id": tc.id,
+                        "name": tc.function.name,
+                        "arguments": args,
+                    }
+                )
+        return {
+            "text": text,
+            "meta": meta,
+            "tool_calls": tool_calls_out,
+            "stop_reason": stop_reason,
+        }
+    async def _generate_claude_with_tools(
+        self,
+        messages: list[dict[str, Any]],
+        tools: list[dict[str, Any]],
+        options: dict[str, Any],
+        config: dict[str, Any],
+        model: str,
+    ) -> dict[str, Any]:
+        """Tool calling via Anthropic SDK with Azure endpoint."""
+        client = self._get_anthropic_client(config)
+        opts = {**{"temperature": 0.0, "max_tokens": 512}, **options}
+        system_content = None
+        api_messages: list[dict[str, Any]] = []
+        for msg in messages:
+            if msg.get("role") == "system":
+                system_content = msg.get("content", "")
+            else:
+                api_messages.append(msg)
+        anthropic_tools = []
+        for t in tools:
+            if "type" in t and t["type"] == "function":
+                fn = t["function"]
+                anthropic_tools.append(
+                    {
+                        "name": fn["name"],
+                        "description": fn.get("description", ""),
+                        "input_schema": fn.get("parameters", {"type": "object", "properties": {}}),
+                    }
+                )
+            elif "input_schema" in t:
+                anthropic_tools.append(t)
+            else:
+                anthropic_tools.append(t)
+        kwargs: dict[str, Any] = {
+            "model": model,
+            "messages": api_messages,
+            "temperature": opts["temperature"],
+            "max_tokens": opts["max_tokens"],
+            "tools": anthropic_tools,
+        }
+        if system_content:
+            kwargs["system"] = system_content
+        resp = await client.messages.create(**kwargs)
+        prompt_tokens = resp.usage.input_tokens
+        completion_tokens = resp.usage.output_tokens
+        total_tokens = prompt_tokens + completion_tokens
+        total_cost = self._calculate_cost("azure", model, prompt_tokens, completion_tokens)
+        meta = {
+            "prompt_tokens": prompt_tokens,
+            "completion_tokens": completion_tokens,
+            "total_tokens": total_tokens,
+            "cost": round(total_cost, 6),
+            "raw_response": dict(resp),
+            "model_name": model,
+        }
+        text = ""
+        tool_calls_out: list[dict[str, Any]] = []
+        for block in resp.content:
+            if block.type == "text":
+                text += block.text
+            elif block.type == "tool_use":
+                tool_calls_out.append(
+                    {
+                        "id": block.id,
+                        "name": block.name,
+                        "arguments": block.input,
+                    }
+                )
+        return {
+            "text": text,
+            "meta": meta,
+            "tool_calls": tool_calls_out,
+            "stop_reason": resp.stop_reason,
+        }

{prompture-0.0.49 → prompture-0.0.50}/prompture/drivers/async_registry.py RENAMED Viewed

@@ -62,7 +62,10 @@ register_async_driver(
 register_async_driver(
     "azure",
     lambda model=None: AsyncAzureDriver(
-        api_key=settings.azure_api_key, endpoint=settings.azure_api_endpoint, deployment_id=settings.azure_deployment_id
+        api_key=settings.azure_api_key,
+        endpoint=settings.azure_api_endpoint,
+        deployment_id=settings.azure_deployment_id,
+        model=model or "gpt-4o-mini",
     ),
     overwrite=True,
 )

prompture 0.0.49__tar.gz → 0.0.50__tar.gz

prompture 0.0.49tar.gz → 0.0.50tar.gz