PyPI - hud-python - Versions diffs - 0.4.35__py3-none-any.whl → 0.4.37__py3-none-any.whl - Mend

hud-python 0.4.35py3-none-any.whl → 0.4.37py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hud-python might be problematic. Click here for more details.

Files changed (63) hide show

hud/agents/__init__.py +2 -0
hud/agents/lite_llm.py +72 -0
hud/agents/openai_chat_generic.py +21 -7
hud/agents/tests/test_claude.py +32 -7
hud/agents/tests/test_openai.py +29 -6
hud/cli/__init__.py +228 -79
hud/cli/build.py +26 -6
hud/cli/dev.py +21 -40
hud/cli/eval.py +96 -15
hud/cli/flows/tasks.py +198 -65
hud/cli/init.py +222 -629
hud/cli/pull.py +6 -0
hud/cli/push.py +11 -1
hud/cli/rl/__init__.py +14 -4
hud/cli/rl/celebrate.py +187 -0
hud/cli/rl/config.py +15 -8
hud/cli/rl/local_runner.py +44 -20
hud/cli/rl/remote_runner.py +166 -87
hud/cli/rl/viewer.py +141 -0
hud/cli/rl/wait_utils.py +89 -0
hud/cli/tests/test_build.py +3 -27
hud/cli/tests/test_mcp_server.py +1 -12
hud/cli/utils/config.py +85 -0
hud/cli/utils/docker.py +21 -39
hud/cli/utils/env_check.py +196 -0
hud/cli/utils/environment.py +4 -3
hud/cli/utils/interactive.py +2 -1
hud/cli/utils/local_runner.py +204 -0
hud/cli/utils/metadata.py +3 -1
hud/cli/utils/package_runner.py +292 -0
hud/cli/utils/remote_runner.py +4 -1
hud/cli/utils/source_hash.py +108 -0
hud/clients/base.py +1 -1
hud/clients/fastmcp.py +1 -1
hud/clients/mcp_use.py +30 -7
hud/datasets/parallel.py +3 -1
hud/datasets/runner.py +4 -1
hud/otel/config.py +1 -1
hud/otel/context.py +40 -6
hud/rl/buffer.py +3 -0
hud/rl/tests/test_learner.py +1 -1
hud/rl/vllm_adapter.py +1 -1
hud/server/server.py +234 -7
hud/server/tests/test_add_tool.py +60 -0
hud/server/tests/test_context.py +128 -0
hud/server/tests/test_mcp_server_handlers.py +44 -0
hud/server/tests/test_mcp_server_integration.py +405 -0
hud/server/tests/test_mcp_server_more.py +247 -0
hud/server/tests/test_run_wrapper.py +53 -0
hud/server/tests/test_server_extra.py +166 -0
hud/server/tests/test_sigterm_runner.py +78 -0
hud/settings.py +38 -0
hud/shared/hints.py +2 -2
hud/telemetry/job.py +2 -2
hud/types.py +9 -2
hud/utils/tasks.py +32 -24
hud/utils/tests/test_version.py +1 -1
hud/version.py +1 -1
{hud_python-0.4.35.dist-info → hud_python-0.4.37.dist-info}/METADATA +43 -23
{hud_python-0.4.35.dist-info → hud_python-0.4.37.dist-info}/RECORD +63 -46
{hud_python-0.4.35.dist-info → hud_python-0.4.37.dist-info}/WHEEL +0 -0
{hud_python-0.4.35.dist-info → hud_python-0.4.37.dist-info}/entry_points.txt +0 -0
{hud_python-0.4.35.dist-info → hud_python-0.4.37.dist-info}/licenses/LICENSE +0 -0

hud/agents/__init__.py CHANGED Viewed

@@ -2,12 +2,14 @@ from __future__ import annotations
 from .base import MCPAgent
 from .claude import ClaudeAgent
+from .lite_llm import LiteAgent
 from .openai import OperatorAgent
 from .openai_chat_generic import GenericOpenAIChatAgent
 __all__ = [
     "ClaudeAgent",
     "GenericOpenAIChatAgent",
+    "LiteAgent",
     "MCPAgent",
     "OperatorAgent",
 ]

hud/agents/lite_llm.py ADDED Viewed

@@ -0,0 +1,72 @@
+"""LiteLLM MCP Agent implementation.
+Same OpenAI chat-completions shape + MCP tool plumbing,
+but transport is LiteLLM and (optionally) tools are shaped by LiteLLM's MCP transformer.
+"""
+from __future__ import annotations
+import logging
+from typing import Any, ClassVar
+import litellm
+from .openai_chat_generic import GenericOpenAIChatAgent
+logger = logging.getLogger(__name__)
+# Prefer LiteLLM's built-in MCP -> OpenAI tool transformer (handles Bedrock nuances)
+try:
+    from litellm.experimental_mcp_client.tools import (
+        transform_mcp_tool_to_openai_tool,
+    )
+except Exception:  # pragma: no cover - optional dependency
+    transform_mcp_tool_to_openai_tool = None  # type: ignore
+class LiteAgent(GenericOpenAIChatAgent):
+    """
+    Same OpenAI chat-completions shape + MCP tool plumbing,
+    but transport is LiteLLM and (optionally) tools are shaped by LiteLLM's MCP transformer.
+    """
+    metadata: ClassVar[dict[str, Any]] = {}
+    def __init__(
+        self,
+        *,
+        model_name: str = "gpt-4o-mini",
+        completion_kwargs: dict[str, Any] | None = None,
+        **agent_kwargs: Any,
+    ) -> None:
+        # We don't need an OpenAI client; pass None
+        super().__init__(
+            openai_client=None,
+            model_name=model_name,
+            completion_kwargs=completion_kwargs,
+            **agent_kwargs,
+        )
+    def get_tool_schemas(self) -> list[dict]:
+        # Prefer LiteLLM's stricter transformer (handles Bedrock & friends)
+        if transform_mcp_tool_to_openai_tool is not None:
+            return [
+                transform_mcp_tool_to_openai_tool(t)  # returns ChatCompletionToolParam-like dict
+                for t in self.get_available_tools()
+            ]
+        # Fallback to the generic OpenAI sanitizer
+        return GenericOpenAIChatAgent.get_tool_schemas(self)
+    async def _invoke_chat_completion(
+        self,
+        *,
+        messages: list[Any],
+        tools: list[dict] | None,
+        extra: dict[str, Any],
+    ):
+        return await litellm.acompletion(
+            model=self.model_name,
+            messages=messages,
+            tools=tools or None,  # LiteLLM tolerates None better than []
+            **extra,
+        )

hud/agents/openai_chat_generic.py CHANGED Viewed

@@ -42,7 +42,7 @@ class GenericOpenAIChatAgent(MCPAgent):
     def __init__(
         self,
         *,
-        openai_client: AsyncOpenAI,
+        openai_client: AsyncOpenAI | None,
         model_name: str = "gpt-4o-mini",
         completion_kwargs: dict[str, Any] | None = None,
         **agent_kwargs: Any,
@@ -171,6 +171,23 @@ class GenericOpenAIChatAgent(MCPAgent):
             openai_tools.append(openai_tool)
         return openai_tools
+    async def _invoke_chat_completion(
+        self,
+        *,
+        messages: list[Any],
+        tools: list[dict] | None,
+        extra: dict[str, Any],
+    ):
+        if self.oai is None:
+            raise ValueError("openai_client is required for GenericOpenAIChatAgent")
+        # default transport = OpenAI SDK
+        return await self.oai.chat.completions.create(
+            model=self.model_name,
+            messages=messages,
+            tools=tools,  # already ChatCompletionToolParam-shaped
+            **extra,
+        )
     @instrument(
         span_type="agent",
         record_args=False,
@@ -180,17 +197,14 @@ class GenericOpenAIChatAgent(MCPAgent):
         """Send chat request to OpenAI and convert the response."""
         # Convert MCP tool schemas to OpenAI format
-        mcp_schemas = self.get_tool_schemas()
+        tools = cast("list[ChatCompletionToolParam]", self.get_tool_schemas())
         protected_keys = {"model", "messages", "tools"}
         extra = {k: v for k, v in (self.completion_kwargs or {}).items() if k not in protected_keys}
         try:
-            response = await self.oai.chat.completions.create(
-                model=self.model_name,
-                messages=messages,
-                tools=cast("list[ChatCompletionToolParam]", mcp_schemas),
-                **extra,
+            response = await self._invoke_chat_completion(
+                messages=messages, tools=tools, extra=extra
             )
         except Exception as e:
             error_content = f"Error getting response {e}"

hud/agents/tests/test_claude.py CHANGED Viewed

@@ -86,6 +86,7 @@ class TestClaudeAgent:
             model_client=mock_model_client,
             model="claude-3-opus-20240229",
             max_tokens=1000,
+            validate_api_key=False,  # Skip validation in tests
         )
         assert agent.model_name == "claude-3-opus-20240229"
@@ -93,10 +94,14 @@ class TestClaudeAgent:
         assert agent.anthropic_client == mock_model_client
     @pytest.mark.asyncio
-    async def test_init_without_model_client(self, mock_mcp_client):
+    async def test_init_without_model_client(self, mock_mcp_client, mock_anthropic):
         """Test agent initialization without model client."""
         with patch("hud.settings.settings.anthropic_api_key", "test_key"):
-            agent = ClaudeAgent(mcp_client=mock_mcp_client, model="claude-3-opus-20240229")
+            agent = ClaudeAgent(
+                mcp_client=mock_mcp_client,
+                model="claude-3-opus-20240229",
+                validate_api_key=False,  # Skip validation in tests
+            )
             assert agent.model_name == "claude-3-opus-20240229"
             assert agent.anthropic_client is not None
@@ -105,7 +110,11 @@ class TestClaudeAgent:
     async def test_format_blocks(self, mock_mcp_client):
         """Test formatting content blocks into Claude messages."""
         mock_model_client = MagicMock()
-        agent = ClaudeAgent(mcp_client=mock_mcp_client, model_client=mock_model_client)
+        agent = ClaudeAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_model_client,
+            validate_api_key=False,  # Skip validation in tests
+        )
         # Test with text only
         text_blocks: list[types.ContentBlock] = [
@@ -141,7 +150,11 @@ class TestClaudeAgent:
     async def test_format_tool_results_method(self, mock_mcp_client):
         """Test the agent's format_tool_results method."""
         mock_model_client = MagicMock()
-        agent = ClaudeAgent(mcp_client=mock_mcp_client, model_client=mock_model_client)
+        agent = ClaudeAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_model_client,
+            validate_api_key=False,  # Skip validation in tests
+        )
         tool_calls = [
             MCPToolCall(name="test_tool", arguments={}, id="id1"),
@@ -171,7 +184,11 @@ class TestClaudeAgent:
         """Test getting model response from Claude API."""
         # Disable telemetry for this test to avoid backend configuration issues
         with patch("hud.settings.settings.telemetry_enabled", False):
-            agent = ClaudeAgent(mcp_client=mock_mcp_client, model_client=mock_anthropic)
+            agent = ClaudeAgent(
+                mcp_client=mock_mcp_client,
+                model_client=mock_anthropic,
+                validate_api_key=False,  # Skip validation in tests
+            )
             # Mock the API response
             mock_response = MagicMock()
@@ -215,7 +232,11 @@ class TestClaudeAgent:
         """Test getting text-only response."""
         # Disable telemetry for this test to avoid backend configuration issues
         with patch("hud.settings.settings.telemetry_enabled", False):
-            agent = ClaudeAgent(mcp_client=mock_mcp_client, model_client=mock_anthropic)
+            agent = ClaudeAgent(
+                mcp_client=mock_mcp_client,
+                model_client=mock_anthropic,
+                validate_api_key=False,  # Skip validation in tests
+            )
             mock_response = MagicMock()
             # Create text block
@@ -242,7 +263,11 @@ class TestClaudeAgent:
         """Test handling API errors."""
         # Disable telemetry for this test to avoid backend configuration issues
         with patch("hud.settings.settings.telemetry_enabled", False):
-            agent = ClaudeAgent(mcp_client=mock_mcp_client, model_client=mock_anthropic)
+            agent = ClaudeAgent(
+                mcp_client=mock_mcp_client,
+                model_client=mock_anthropic,
+                validate_api_key=False,  # Skip validation in tests
+            )
             # Mock API error
             mock_anthropic.beta.messages.create = AsyncMock(

hud/agents/tests/test_openai.py CHANGED Viewed

@@ -44,7 +44,10 @@ class TestOperatorAgent:
         """Test agent initialization."""
         mock_model_client = MagicMock()
         agent = OperatorAgent(
-            mcp_client=mock_mcp_client, model_client=mock_model_client, model="gpt-4"
+            mcp_client=mock_mcp_client,
+            model_client=mock_model_client,
+            model="gpt-4",
+            validate_api_key=False,  # Skip validation in tests
         )
         assert agent.model_name == "openai-gpt-4"
@@ -55,7 +58,11 @@ class TestOperatorAgent:
     async def test_format_blocks(self, mock_mcp_client):
         """Test formatting content blocks."""
         mock_model_client = MagicMock()
-        agent = OperatorAgent(mcp_client=mock_mcp_client, model_client=mock_model_client)
+        agent = OperatorAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_model_client,
+            validate_api_key=False,  # Skip validation in tests
+        )
         # Test with text blocks
         blocks: list[types.ContentBlock] = [
@@ -85,7 +92,11 @@ class TestOperatorAgent:
     @pytest.mark.asyncio
     async def test_format_tool_results(self, mock_mcp_client, mock_openai):
         """Test formatting tool results."""
-        agent = OperatorAgent(mcp_client=mock_mcp_client, model_client=mock_openai)
+        agent = OperatorAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_openai,
+            validate_api_key=False,  # Skip validation in tests
+        )
         tool_calls = [
             MCPToolCall(name="test_tool", arguments={}, id="call_123"),  # type: ignore
@@ -111,7 +122,11 @@ class TestOperatorAgent:
     @pytest.mark.asyncio
     async def test_format_tool_results_with_error(self, mock_mcp_client, mock_openai):
         """Test formatting tool results with errors."""
-        agent = OperatorAgent(mcp_client=mock_mcp_client, model_client=mock_openai)
+        agent = OperatorAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_openai,
+            validate_api_key=False,  # Skip validation in tests
+        )
         tool_calls = [
             MCPToolCall(name="failing_tool", arguments={}, id="call_error"),  # type: ignore
@@ -131,7 +146,11 @@ class TestOperatorAgent:
     @pytest.mark.asyncio
     async def test_get_model_response(self, mock_mcp_client, mock_openai):
         """Test getting model response from OpenAI API."""
-        agent = OperatorAgent(mcp_client=mock_mcp_client, model_client=mock_openai)
+        agent = OperatorAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_openai,
+            validate_api_key=False,  # Skip validation in tests
+        )
         # Set up available tools so agent doesn't return "No computer use tools available"
         agent._available_tools = [
@@ -162,7 +181,11 @@ class TestOperatorAgent:
     @pytest.mark.asyncio
     async def test_handle_empty_response(self, mock_mcp_client, mock_openai):
         """Test handling empty response from API."""
-        agent = OperatorAgent(mcp_client=mock_mcp_client, model_client=mock_openai)
+        agent = OperatorAgent(
+            mcp_client=mock_mcp_client,
+            model_client=mock_openai,
+            validate_api_key=False,  # Skip validation in tests
+        )
         # Set up available tools
         agent._available_tools = [

hud-python 0.4.35__py3-none-any.whl → 0.4.37__py3-none-any.whl

Potentially problematic release.

hud-python 0.4.35py3-none-any.whl → 0.4.37py3-none-any.whl