PyPI - lm-deluge - Versions diffs - 0.0.90__py3-none-any.whl → 0.0.91__py3-none-any.whl - Mend

lm-deluge 0.0.90py3-none-any.whl → 0.0.91py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (68) hide show

lm_deluge/__init__.py +3 -3
lm_deluge/api_requests/anthropic.py +4 -2
lm_deluge/api_requests/base.py +1 -1
lm_deluge/api_requests/bedrock.py +6 -1
lm_deluge/{request_context.py → api_requests/context.py} +4 -4
lm_deluge/api_requests/gemini.py +13 -11
lm_deluge/api_requests/mistral.py +1 -1
lm_deluge/api_requests/openai.py +4 -2
lm_deluge/batches.py +4 -4
lm_deluge/cache.py +1 -1
lm_deluge/cli.py +672 -300
lm_deluge/{client.py → client/__init__.py} +15 -12
lm_deluge/config.py +9 -31
lm_deluge/embed.py +2 -6
lm_deluge/models/__init__.py +137 -30
lm_deluge/models/anthropic.py +20 -12
lm_deluge/models/bedrock.py +9 -0
lm_deluge/models/cerebras.py +2 -0
lm_deluge/models/cohere.py +2 -0
lm_deluge/models/google.py +13 -0
lm_deluge/models/grok.py +4 -0
lm_deluge/models/groq.py +2 -0
lm_deluge/models/meta.py +2 -0
lm_deluge/models/openai.py +24 -1
lm_deluge/models/openrouter.py +107 -1
lm_deluge/models/together.py +3 -0
lm_deluge/pipelines/extract.py +4 -5
lm_deluge/pipelines/gepa/__init__.py +1 -1
lm_deluge/pipelines/gepa/examples/01_synthetic_keywords.py +1 -1
lm_deluge/pipelines/gepa/examples/02_gsm8k_math.py +1 -1
lm_deluge/pipelines/gepa/examples/03_hotpotqa_multihop.py +1 -1
lm_deluge/pipelines/gepa/examples/04_batch_classification.py +1 -1
lm_deluge/pipelines/gepa/examples/simple_qa.py +1 -1
lm_deluge/prompt/__init__.py +45 -0
lm_deluge/{prompt.py → prompt/conversation.py} +45 -1014
lm_deluge/{image.py → prompt/image.py} +0 -10
lm_deluge/prompt/message.py +571 -0
lm_deluge/prompt/serialization.py +21 -0
lm_deluge/prompt/signatures.py +77 -0
lm_deluge/prompt/text.py +47 -0
lm_deluge/prompt/thinking.py +55 -0
lm_deluge/prompt/tool_calls.py +245 -0
lm_deluge/server/app.py +1 -1
lm_deluge/tool/__init__.py +65 -18
lm_deluge/tool/builtin/anthropic/__init__.py +1 -1
lm_deluge/tool/cua/actions.py +26 -26
lm_deluge/tool/cua/batch.py +1 -2
lm_deluge/tool/cua/kernel.py +1 -1
lm_deluge/tool/prefab/filesystem.py +2 -2
lm_deluge/tool/prefab/full_text_search/__init__.py +3 -2
lm_deluge/tool/prefab/memory.py +3 -1
lm_deluge/tool/prefab/otc/executor.py +3 -3
lm_deluge/tool/prefab/random.py +30 -54
lm_deluge/tool/prefab/rlm/__init__.py +2 -2
lm_deluge/tool/prefab/rlm/executor.py +1 -1
lm_deluge/tool/prefab/sandbox/daytona_sandbox.py +2 -2
lm_deluge/tool/prefab/sandbox/seatbelt_sandbox.py +9 -7
lm_deluge/tool/prefab/subagents.py +1 -1
lm_deluge/util/logprobs.py +4 -4
lm_deluge/util/schema.py +6 -6
lm_deluge/util/validation.py +14 -9
{lm_deluge-0.0.90.dist-info → lm_deluge-0.0.91.dist-info}/METADATA +9 -10
{lm_deluge-0.0.90.dist-info → lm_deluge-0.0.91.dist-info}/RECORD +68 -60
lm_deluge-0.0.91.dist-info/entry_points.txt +3 -0
/lm_deluge/{file.py → prompt/file.py} +0 -0
{lm_deluge-0.0.90.dist-info → lm_deluge-0.0.91.dist-info}/WHEEL +0 -0
{lm_deluge-0.0.90.dist-info → lm_deluge-0.0.91.dist-info}/licenses/LICENSE +0 -0
{lm_deluge-0.0.90.dist-info → lm_deluge-0.0.91.dist-info}/top_level.txt +0 -0

lm_deluge/__init__.py CHANGED Viewed

@@ -1,7 +1,6 @@
 from .client import APIResponse, LLMClient, SamplingParams
-from .file import File
-from .prompt import Conversation, Message
-from .tool import Tool
+from .prompt import Conversation, Message, File
+from .tool import Tool, MCPServer
 # dotenv.load_dotenv() - don't do this, fucks with other packages
@@ -12,5 +11,6 @@ __all__ = [
     "Conversation",
     "Message",
     "Tool",
+    "MCPServer",
     "File",
 ]

lm_deluge/api_requests/anthropic.py CHANGED Viewed

@@ -10,7 +10,7 @@ from lm_deluge.prompt import (
     Thinking,
     ToolCall,
 )
-from lm_deluge.request_context import RequestContext
+from lm_deluge.api_requests.context import RequestContext
 from lm_deluge.tool import MCPServer, Tool
 from lm_deluge.usage import Usage
 from lm_deluge.util.schema import (
@@ -103,7 +103,9 @@ def _build_anthropic_request(
             if "top_p" in request_json:
                 request_json["top_p"] = max(request_json["top_p"], 0.95)
             request_json["temperature"] = 1.0
-            request_json["max_tokens"] += budget
+            max_tokens = request_json["max_tokens"]
+            assert isinstance(max_tokens, int)
+            request_json["max_tokens"] = max_tokens + budget
         else:
             request_json["thinking"] = {"type": "disabled"}
             if "kimi" in model.id and "thinking" in model.id:

lm_deluge/api_requests/base.py CHANGED Viewed

@@ -10,7 +10,7 @@ from aiohttp import ClientResponse
 from ..errors import raise_if_modal_exception
 from ..models.openai import OPENAI_MODELS
-from ..request_context import RequestContext
+from ..api_requests.context import RequestContext
 from .response import APIResponse

lm_deluge/api_requests/bedrock.py CHANGED Viewed

@@ -20,7 +20,7 @@ from lm_deluge.prompt import (
     Thinking,
     ToolCall,
 )
-from lm_deluge.request_context import RequestContext
+from lm_deluge.api_requests.context import RequestContext
 from lm_deluge.tool import MCPServer, Tool
 from lm_deluge.usage import Usage
@@ -263,6 +263,11 @@ class BedrockRequest(APIRequestBase):
         # Create a fake requests.PreparedRequest object for AWS4Auth to sign
         import requests
+        assert self.url is not None, "URL must be set after build_request"
+        assert (
+            self.request_header is not None
+        ), "Headers must be set after build_request"
         fake_request = requests.Request(
             method="POST",
             url=self.url,

lm_deluge/{request_context.py → api_requests/context.py} RENAMED Viewed

@@ -2,9 +2,9 @@ from dataclasses import dataclass, field
 from functools import cached_property
 from typing import Any, Callable, Sequence, TYPE_CHECKING
-from .config import SamplingParams
-from .prompt import CachePattern, Conversation
-from .tracker import StatusTracker
+from ..config import SamplingParams
+from ..prompt import CachePattern, Conversation
+from ..tracker import StatusTracker
 if TYPE_CHECKING:
     from pydantic import BaseModel
@@ -83,4 +83,4 @@ class RequestContext:
         # Update with any overrides
         current_values.update(overrides)
-        return RequestContext(**current_values)
+        return RequestContext(**current_values)  # type: ignore[arg-type]

lm_deluge/api_requests/gemini.py CHANGED Viewed

@@ -1,9 +1,10 @@
 import json
 import os
+from typing import Any
 from aiohttp import ClientResponse
-from lm_deluge.request_context import RequestContext
+from lm_deluge.api_requests.context import RequestContext
 from lm_deluge.tool import Tool
 from lm_deluge.warnings import maybe_warn
@@ -37,13 +38,14 @@ async def _build_gemini_request(
                             part_type="function call",
                         )
-    request_json = {
+    generation_config: dict[str, Any] = {
+        "temperature": sampling_params.temperature,
+        "topP": sampling_params.top_p,
+        "maxOutputTokens": sampling_params.max_new_tokens,
+    }
+    request_json: dict[str, Any] = {
         "contents": messages,
-        "generationConfig": {
-            "temperature": sampling_params.temperature,
-            "topP": sampling_params.top_p,
-            "maxOutputTokens": sampling_params.max_new_tokens,
-        },
+        "generationConfig": generation_config,
     }
     # Add system instruction if present
@@ -83,7 +85,7 @@ async def _build_gemini_request(
                 }
             effort = level_map[effort_key]
         thinking_config = {"thinkingLevel": effort}
-        request_json["generationConfig"]["thinkingConfig"] = thinking_config
+        generation_config["thinkingConfig"] = thinking_config
     elif model.reasoning_model:
         if (
@@ -126,7 +128,7 @@ async def _build_gemini_request(
             # no thoughts head empty
             thinking_config = {"includeThoughts": False, "thinkingBudget": 0}
-        request_json["generationConfig"]["thinkingConfig"] = thinking_config
+        generation_config["thinkingConfig"] = thinking_config
     else:
         if sampling_params.reasoning_effort:
@@ -171,14 +173,14 @@ async def _build_gemini_request(
     # Handle JSON mode
     if sampling_params.json_mode and model.supports_json:
-        request_json["generationConfig"]["responseMimeType"] = "application/json"
+        generation_config["responseMimeType"] = "application/json"
     # Handle media_resolution for Gemini 3 (requires v1alpha)
     if sampling_params.media_resolution is not None:
         is_gemini_3 = "gemini-3" in model.name.lower()
         if is_gemini_3:
             # Add global media resolution to generationConfig
-            request_json["generationConfig"]["mediaResolution"] = {
+            generation_config["mediaResolution"] = {
                 "level": sampling_params.media_resolution
             }
         else:

lm_deluge/api_requests/mistral.py CHANGED Viewed

@@ -7,7 +7,7 @@ from lm_deluge.warnings import maybe_warn
 from ..models import APIModel
 from ..prompt import Message
-from ..request_context import RequestContext
+from ..api_requests.context import RequestContext
 from ..usage import Usage
 from .base import APIRequestBase, APIResponse

lm_deluge/api_requests/openai.py CHANGED Viewed

@@ -7,7 +7,7 @@ from typing import Sequence
 import aiohttp
 from aiohttp import ClientResponse
-from lm_deluge.request_context import RequestContext
+from lm_deluge.api_requests.context import RequestContext
 from lm_deluge.tool import MCPServer, Tool
 from lm_deluge.util.schema import (
     prepare_output_schema,
@@ -75,7 +75,9 @@ async def _build_oa_chat_request(
             request_json["service_tier"] = context.service_tier
     # if tinker, for now hack to mush into 1 string
     if "tinker" in model.name:
-        request_json["messages"] = _message_contents_to_string(request_json["messages"])
+        messages = request_json["messages"]
+        assert isinstance(messages, list)
+        request_json["messages"] = _message_contents_to_string(messages)
     # set max_tokens or max_completion_tokens dep. on provider
     if "cohere" in model.api_base:

lm_deluge/batches.py CHANGED Viewed

@@ -3,7 +3,7 @@ import json
 import os
 import tempfile
 import time
-from typing import Literal, Sequence, cast
+from typing import Any, Literal, Sequence, cast
 import aiohttp
 from rich.console import Console
@@ -22,7 +22,7 @@ from lm_deluge.prompt import (
     Prompt,
     prompts_to_conversations,
 )
-from lm_deluge.request_context import RequestContext
+from lm_deluge.api_requests.context import RequestContext
 def _create_batch_status_display(
@@ -480,7 +480,7 @@ async def _wait_for_anthropic_batch_completion_async(
     # Event to signal when to stop the display updater
     stop_display_event = asyncio.Event()
-    current_status = {"status": "processing", "counts": None}
+    current_status: dict[str, Any] = {"status": "processing", "counts": None}
     async def display_updater():
         """Update display independently of polling."""
@@ -632,7 +632,7 @@ async def _wait_for_openai_batch_completion_async(
     # Event to signal when to stop the display updater
     stop_display_event = asyncio.Event()
-    current_status = {"status": "pending", "counts": None}
+    current_status: dict[str, Any] = {"status": "pending", "counts": None}
     async def display_updater():
         """Update display independently of polling."""

lm_deluge/cache.py CHANGED Viewed

@@ -8,7 +8,7 @@ from .api_requests.base import APIResponse
 try:
     import plyvel  # type: ignore
 except ImportError:
-    plyvel = None
+    plyvel: Any = None
     print("Warning: plyvel not installed, cannot use LevelDB.")

lm-deluge 0.0.90__py3-none-any.whl → 0.0.91__py3-none-any.whl

lm-deluge 0.0.90py3-none-any.whl → 0.0.91py3-none-any.whl