PyPI - hud-python - Versions diffs - 0.3.5__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

hud-python 0.3.5py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hud-python might be problematic. Click here for more details.

Files changed (192) hide show

hud/__init__.py +22 -89
hud/agents/__init__.py +17 -0
hud/agents/art.py +101 -0
hud/agents/base.py +599 -0
hud/{mcp → agents}/claude.py +373 -321
hud/{mcp → agents}/langchain.py +250 -250
hud/agents/misc/__init__.py +7 -0
hud/{agent → agents}/misc/response_agent.py +80 -80
hud/{mcp → agents}/openai.py +352 -334
hud/agents/openai_chat_generic.py +154 -0
hud/{mcp → agents}/tests/__init__.py +1 -1
hud/agents/tests/test_base.py +742 -0
hud/agents/tests/test_claude.py +324 -0
hud/{mcp → agents}/tests/test_client.py +363 -324
hud/{mcp → agents}/tests/test_openai.py +237 -238
hud/cli/__init__.py +617 -0
hud/cli/__main__.py +8 -0
hud/cli/analyze.py +371 -0
hud/cli/analyze_metadata.py +230 -0
hud/cli/build.py +427 -0
hud/cli/clone.py +185 -0
hud/cli/cursor.py +92 -0
hud/cli/debug.py +392 -0
hud/cli/docker_utils.py +83 -0
hud/cli/init.py +281 -0
hud/cli/interactive.py +353 -0
hud/cli/mcp_server.py +756 -0
hud/cli/pull.py +336 -0
hud/cli/push.py +379 -0
hud/cli/remote_runner.py +311 -0
hud/cli/runner.py +160 -0
hud/cli/tests/__init__.py +3 -0
hud/cli/tests/test_analyze.py +284 -0
hud/cli/tests/test_cli_init.py +265 -0
hud/cli/tests/test_cli_main.py +27 -0
hud/cli/tests/test_clone.py +142 -0
hud/cli/tests/test_cursor.py +253 -0
hud/cli/tests/test_debug.py +453 -0
hud/cli/tests/test_mcp_server.py +139 -0
hud/cli/tests/test_utils.py +388 -0
hud/cli/utils.py +263 -0
hud/clients/README.md +143 -0
hud/clients/__init__.py +16 -0
hud/clients/base.py +354 -0
hud/clients/fastmcp.py +202 -0
hud/clients/mcp_use.py +278 -0
hud/clients/tests/__init__.py +1 -0
hud/clients/tests/test_client_integration.py +111 -0
hud/clients/tests/test_fastmcp.py +342 -0
hud/clients/tests/test_protocol.py +188 -0
hud/clients/utils/__init__.py +1 -0
hud/clients/utils/retry_transport.py +160 -0
hud/datasets.py +322 -192
hud/misc/__init__.py +1 -0
hud/{agent → misc}/claude_plays_pokemon.py +292 -283
hud/otel/__init__.py +35 -0
hud/otel/collector.py +142 -0
hud/otel/config.py +164 -0
hud/otel/context.py +536 -0
hud/otel/exporters.py +366 -0
hud/otel/instrumentation.py +97 -0
hud/otel/processors.py +118 -0
hud/otel/tests/__init__.py +1 -0
hud/otel/tests/test_processors.py +197 -0
hud/server/__init__.py +5 -5
hud/server/context.py +114 -0
hud/server/helper/__init__.py +5 -0
hud/server/low_level.py +132 -0
hud/server/server.py +166 -0
hud/server/tests/__init__.py +3 -0
hud/settings.py +73 -79
hud/shared/__init__.py +5 -0
hud/{exceptions.py → shared/exceptions.py} +180 -180
hud/{server → shared}/requests.py +264 -264
hud/shared/tests/test_exceptions.py +157 -0
hud/{server → shared}/tests/test_requests.py +275 -275
hud/telemetry/__init__.py +25 -30
hud/telemetry/instrument.py +379 -0
hud/telemetry/job.py +309 -141
hud/telemetry/replay.py +74 -0
hud/telemetry/trace.py +83 -0
hud/tools/__init__.py +33 -34
hud/tools/base.py +365 -65
hud/tools/bash.py +161 -137
hud/tools/computer/__init__.py +15 -13
hud/tools/computer/anthropic.py +437 -420
hud/tools/computer/hud.py +376 -334
hud/tools/computer/openai.py +295 -292
hud/tools/computer/settings.py +82 -0
hud/tools/edit.py +314 -290
hud/tools/executors/__init__.py +30 -30
hud/tools/executors/base.py +539 -532
hud/tools/executors/pyautogui.py +621 -619
hud/tools/executors/tests/__init__.py +1 -1
hud/tools/executors/tests/test_base_executor.py +338 -338
hud/tools/executors/tests/test_pyautogui_executor.py +165 -165
hud/tools/executors/xdo.py +511 -503
hud/tools/{playwright_tool.py → playwright.py} +412 -379
hud/tools/tests/__init__.py +3 -3
hud/tools/tests/test_base.py +282 -0
hud/tools/tests/test_bash.py +158 -152
hud/tools/tests/test_bash_extended.py +197 -0
hud/tools/tests/test_computer.py +425 -52
hud/tools/tests/test_computer_actions.py +34 -34
hud/tools/tests/test_edit.py +259 -240
hud/tools/tests/test_init.py +27 -27
hud/tools/tests/test_playwright_tool.py +183 -183
hud/tools/tests/test_tools.py +145 -157
hud/tools/tests/test_utils.py +156 -156
hud/tools/types.py +72 -0
hud/tools/utils.py +50 -50
hud/types.py +136 -89
hud/utils/__init__.py +10 -16
hud/utils/async_utils.py +65 -0
hud/utils/design.py +168 -0
hud/utils/mcp.py +55 -0
hud/utils/progress.py +149 -149
hud/utils/telemetry.py +66 -66
hud/utils/tests/test_async_utils.py +173 -0
hud/utils/tests/test_init.py +17 -21
hud/utils/tests/test_progress.py +261 -225
hud/utils/tests/test_telemetry.py +82 -37
hud/utils/tests/test_version.py +8 -8
hud/version.py +7 -7
hud_python-0.4.0.dist-info/METADATA +474 -0
hud_python-0.4.0.dist-info/RECORD +132 -0
hud_python-0.4.0.dist-info/entry_points.txt +3 -0
{hud_python-0.3.5.dist-info → hud_python-0.4.0.dist-info}/licenses/LICENSE +21 -21
hud/adapters/__init__.py +0 -8
hud/adapters/claude/__init__.py +0 -5
hud/adapters/claude/adapter.py +0 -180
hud/adapters/claude/tests/__init__.py +0 -1
hud/adapters/claude/tests/test_adapter.py +0 -519
hud/adapters/common/__init__.py +0 -6
hud/adapters/common/adapter.py +0 -178
hud/adapters/common/tests/test_adapter.py +0 -289
hud/adapters/common/types.py +0 -446
hud/adapters/operator/__init__.py +0 -5
hud/adapters/operator/adapter.py +0 -108
hud/adapters/operator/tests/__init__.py +0 -1
hud/adapters/operator/tests/test_adapter.py +0 -370
hud/agent/__init__.py +0 -19
hud/agent/base.py +0 -126
hud/agent/claude.py +0 -271
hud/agent/langchain.py +0 -215
hud/agent/misc/__init__.py +0 -3
hud/agent/operator.py +0 -268
hud/agent/tests/__init__.py +0 -1
hud/agent/tests/test_base.py +0 -202
hud/env/__init__.py +0 -11
hud/env/client.py +0 -35
hud/env/docker_client.py +0 -349
hud/env/environment.py +0 -446
hud/env/local_docker_client.py +0 -358
hud/env/remote_client.py +0 -212
hud/env/remote_docker_client.py +0 -292
hud/gym.py +0 -130
hud/job.py +0 -773
hud/mcp/__init__.py +0 -17
hud/mcp/base.py +0 -631
hud/mcp/client.py +0 -312
hud/mcp/tests/test_base.py +0 -512
hud/mcp/tests/test_claude.py +0 -294
hud/task.py +0 -149
hud/taskset.py +0 -237
hud/telemetry/_trace.py +0 -347
hud/telemetry/context.py +0 -230
hud/telemetry/exporter.py +0 -575
hud/telemetry/instrumentation/__init__.py +0 -3
hud/telemetry/instrumentation/mcp.py +0 -259
hud/telemetry/instrumentation/registry.py +0 -59
hud/telemetry/mcp_models.py +0 -270
hud/telemetry/tests/__init__.py +0 -1
hud/telemetry/tests/test_context.py +0 -210
hud/telemetry/tests/test_trace.py +0 -312
hud/tools/helper/README.md +0 -56
hud/tools/helper/__init__.py +0 -9
hud/tools/helper/mcp_server.py +0 -78
hud/tools/helper/server_initialization.py +0 -115
hud/tools/helper/utils.py +0 -58
hud/trajectory.py +0 -94
hud/utils/agent.py +0 -37
hud/utils/common.py +0 -256
hud/utils/config.py +0 -120
hud/utils/deprecation.py +0 -115
hud/utils/misc.py +0 -53
hud/utils/tests/test_common.py +0 -277
hud/utils/tests/test_config.py +0 -129
hud_python-0.3.5.dist-info/METADATA +0 -284
hud_python-0.3.5.dist-info/RECORD +0 -120
/hud/{adapters/common → shared}/tests/__init__.py +0 -0
{hud_python-0.3.5.dist-info → hud_python-0.4.0.dist-info}/WHEEL +0 -0

hud/cli/tests/test_debug.py ADDED Viewed

@@ -0,0 +1,453 @@
+"""Tests for hud.cli.debug module."""
+from __future__ import annotations
+import json
+from unittest.mock import AsyncMock, MagicMock, Mock, patch
+import pytest
+from hud.cli.debug import debug_mcp_stdio
+from hud.cli.utils import CaptureLogger
+class TestDebugMCPStdio:
+    """Test the debug_mcp_stdio function."""
+    @pytest.mark.asyncio
+    async def test_phase_1_command_not_found(self) -> None:
+        """Test Phase 1 failure when command not found."""
+        logger = CaptureLogger(print_output=False)
+        with patch("subprocess.run", side_effect=FileNotFoundError()):
+            phases = await debug_mcp_stdio(["nonexistent"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Command not found: nonexistent" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_command_fails(self) -> None:
+        """Test Phase 1 failure when command returns error."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 1
+        mock_result.stderr = "Command failed with error"
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Command failed with exit code 1" in output
+            assert "Command failed with error" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_success(self) -> None:
+        """Test Phase 1 success."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 0
+        mock_result.stderr = ""
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
+            assert phases == 1
+            output = logger.get_output()
+            assert "Command executable found" in output
+            assert "Stopping at phase 1 as requested" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_usage_in_stderr(self) -> None:
+        """Test Phase 1 success when usage info in stderr."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 1
+        mock_result.stderr = "usage: test-cmd [options]"
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
+            assert phases == 1
+            output = logger.get_output()
+            assert "Command executable found" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_mcp_initialize_success(self) -> None:
+        """Test Phase 2 MCP initialization success."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen for Phase 2
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # Mock successful MCP response
+        init_response = {
+            "jsonrpc": "2.0",
+            "id": 1,
+            "result": {
+                "serverInfo": {"name": "TestServer", "version": "1.0"},
+                "capabilities": {"tools": {}, "resources": {}},
+            },
+        }
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])  # No stderr output
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+        ):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=2)
+            assert phases == 2
+            output = logger.get_output()
+            assert "MCP server initialized successfully" in output
+            assert "Server: TestServer v1.0" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_no_response(self) -> None:
+        """Test Phase 2 failure when no MCP response."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen for Phase 2
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # No stdout response
+        mock_proc.stdout.readline.return_value = ""
+        mock_proc.stderr.__iter__ = lambda x: iter(["[ERROR] Server failed to start"])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("time.time", side_effect=[0, 0, 20]),
+        ):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 1
+            output = logger.get_output()
+            assert "No valid MCP response received" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_invalid_json_response(self) -> None:
+        """Test Phase 2 handling of invalid JSON response."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # Invalid JSON response
+        mock_proc.stdout.readline.return_value = "Invalid JSON\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+        ):
+            # Simulate timeout - time.time() is called multiple times in the loop
+            # Return increasing values to simulate time passing
+            time_values = list(range(20))
+            with patch("time.time", side_effect=time_values):
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+                assert phases == 1
+                output = logger.get_output()
+                # The error message might vary, but should indicate no valid response
+                assert (
+                    "Failed to parse MCP response" in output
+                    or "No valid MCP response received" in output
+                )
+    @pytest.mark.asyncio
+    async def test_phase_3_tool_discovery(self) -> None:
+        """Test Phase 3 tool discovery."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 & 2 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        init_response = {
+            "jsonrpc": "2.0",
+            "id": 1,
+            "result": {"serverInfo": {"name": "TestServer", "version": "1.0"}},
+        }
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        # Mock tool discovery - create proper mock tools
+        mock_tools = []
+        for tool_name in ["setup", "evaluate", "computer", "custom_tool"]:
+            tool = Mock()
+            tool.name = tool_name
+            mock_tools.append(tool)
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=mock_tools)
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=3)
+            assert phases == 3
+            output = logger.get_output()
+            assert "Found 4 tools" in output
+            assert "Lifecycle tools: setup=✅, evaluate=✅" in output
+            assert "Interaction tools: computer" in output
+            assert "All tools: setup, evaluate, computer, custom_tool" in output
+    @pytest.mark.asyncio
+    async def test_phase_3_no_tools(self) -> None:
+        """Test Phase 3 when no tools found."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 & 2 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 2
+            output = logger.get_output()
+            assert "No tools found" in output
+            assert "@mcp.tool() decorator" in output
+    @pytest.mark.asyncio
+    async def test_phase_4_remote_deployment(self) -> None:
+        """Test Phase 4 remote deployment readiness."""
+        logger = CaptureLogger(print_output=False)
+        # Setup mocks for phases 1-3
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        # Create proper mock tools
+        mock_tools = []
+        for tool_name in ["setup", "evaluate"]:
+            tool = Mock()
+            tool.name = tool_name
+            mock_tools.append(tool)
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=mock_tools)
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.call_tool = AsyncMock()
+            mock_client.shutdown = AsyncMock()
+            with patch("time.time", side_effect=[0, 5, 5, 5, 5]):  # Start at 0, then 5 for the rest
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=4)
+                assert phases == 4
+                output = logger.get_output()
+                assert "Total initialization time: 5.00s" in output
+                # Should have tested setup and evaluate tools
+                assert mock_client.call_tool.call_count == 2
+    @pytest.mark.asyncio
+    async def test_phase_4_slow_initialization(self) -> None:
+        """Test Phase 4 with slow initialization warning."""
+        logger = CaptureLogger(print_output=False)
+        # Setup basic mocks
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            # Create proper mock tool
+            test_tool = Mock()
+            test_tool.name = "test"
+            mock_client.list_tools = AsyncMock(return_value=[test_tool])
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            # Simulate slow init (>30s)
+            # time.time() is called at start and after phase 3
+            with patch("time.time", side_effect=[0, 0, 0, 35, 35, 35]):
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+                output = logger.get_output()
+                # Check if we got to phase 4 where the timing check happens
+                if phases >= 4:
+                    assert "Initialization took >30s" in output
+                    assert "Consider optimizing startup time" in output
+    @pytest.mark.asyncio
+    async def test_phase_5_concurrent_clients(self) -> None:
+        """Test Phase 5 concurrent clients."""
+        logger = CaptureLogger(print_output=False)
+        # Setup mocks for all phases
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            # Create different mock instances for each client
+            mock_clients = []
+            for i in range(4):  # 1 main + 3 concurrent
+                mock_client = MagicMock()
+                mock_client.initialize = AsyncMock()
+                # Create proper mock tool
+                test_tool = Mock()
+                test_tool.name = "test"
+                mock_client.list_tools = AsyncMock(return_value=[test_tool])
+                mock_client.list_resources = AsyncMock(return_value=[])
+                mock_client.shutdown = AsyncMock()
+                mock_clients.append(mock_client)
+            MockClient.side_effect = mock_clients
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 5
+            output = logger.get_output()
+            assert "Creating 3 concurrent MCP clients" in output
+            assert "All concurrent clients connected" in output
+            # Verify all clients were shut down
+            for client in mock_clients:
+                client.shutdown.assert_called()
+    @pytest.mark.asyncio
+    async def test_phase_5_concurrent_failure(self) -> None:
+        """Test Phase 5 handling concurrent client failures."""
+        logger = CaptureLogger(print_output=False)
+        # Setup basic mocks
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            # Set up for phase 1-4 success first
+            test_tool = Mock()
+            test_tool.name = "test"
+            # Phase 1-4 client
+            phase_client = MagicMock()
+            phase_client.initialize = AsyncMock()
+            phase_client.list_tools = AsyncMock(return_value=[test_tool])
+            phase_client.list_resources = AsyncMock(return_value=[])
+            phase_client.shutdown = AsyncMock()
+            # Phase 5 clients - first succeeds, second fails
+            mock_client1 = MagicMock()
+            mock_client1.initialize = AsyncMock()
+            mock_client1.list_tools = AsyncMock(return_value=[test_tool])
+            mock_client1.list_resources = AsyncMock(return_value=[])
+            mock_client1.shutdown = AsyncMock()
+            mock_client2 = MagicMock()
+            mock_client2.initialize = AsyncMock(side_effect=Exception("Connection failed"))
+            mock_client2.shutdown = AsyncMock()
+            MockClient.side_effect = [phase_client, mock_client1, mock_client2]
+            await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            output = logger.get_output()
+            assert "Concurrent test failed: Connection failed" in output
+    @pytest.mark.asyncio
+    async def test_docker_command_handling(self) -> None:
+        """Test special handling of Docker commands."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 0
+        with patch("subprocess.run", return_value=mock_result) as mock_run:
+            await debug_mcp_stdio(["docker", "run", "--rm", "image:latest"], logger, max_phase=1)
+            # Should add echo command for Docker
+            call_args = mock_run.call_args[0][0]
+            assert call_args == ["docker"]
+    @pytest.mark.asyncio
+    async def test_phase_exception_handling(self) -> None:
+        """Test general exception handling in phases."""
+        logger = CaptureLogger(print_output=False)
+        with patch("subprocess.run", side_effect=Exception("Unexpected error")):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Startup test failed: Unexpected error" in output
+if __name__ == "__main__":
+    pytest.main([__file__])

hud/cli/tests/test_mcp_server.py ADDED Viewed

@@ -0,0 +1,139 @@
+"""Tests for hud.cli.mcp_server module."""
+from __future__ import annotations
+from typing import TYPE_CHECKING
+from unittest.mock import MagicMock, patch
+import pytest
+from hud.cli.mcp_server import (
+    create_proxy_server,
+    get_docker_cmd,
+    get_image_name,
+    inject_supervisor,
+    run_mcp_dev_server,
+    update_pyproject_toml,
+)
+if TYPE_CHECKING:
+    from pathlib import Path
+class TestCreateMCPServer:
+    """Test MCP server creation."""
+    def test_create_mcp_server(self) -> None:
+        """Test that MCP server is created with correct configuration."""
+        mcp = create_proxy_server(".", "test-image:latest")
+        assert mcp._mcp_server.name == "HUD Dev Proxy - test-image:latest"
+        # Proxy server doesn't define its own tools, it forwards to Docker containers
+class TestDockerUtils:
+    """Test Docker utility functions."""
+    def test_get_docker_cmd(self) -> None:
+        """Test extracting CMD from Docker image."""
+        with patch("subprocess.run") as mock_run:
+            mock_result = MagicMock()
+            mock_result.returncode = 0
+            mock_result.stdout = '["python", "-m", "server"]'
+            mock_run.return_value = mock_result
+            cmd = get_docker_cmd("test-image:latest")
+            assert cmd is None
+    def test_get_docker_cmd_failure(self) -> None:
+        """Test handling when Docker inspect fails."""
+        import subprocess
+        with patch("subprocess.run") as mock_run:
+            # check=True causes CalledProcessError on non-zero return
+            mock_run.side_effect = subprocess.CalledProcessError(1, "docker inspect")
+            cmd = get_docker_cmd("test-image:latest")
+            assert cmd is None
+    def test_inject_supervisor(self) -> None:
+        """Test supervisor injection into Docker CMD."""
+        original_cmd = ["python", "-m", "server"]
+        modified = inject_supervisor(original_cmd)
+        assert modified[0] == "sh"
+        assert modified[1] == "-c"
+        assert "watchfiles" in modified[2]
+        assert "python -m server" in modified[2]
+class TestImageResolution:
+    """Test image name resolution."""
+    def test_get_image_name_override(self) -> None:
+        """Test image name with override."""
+        name, source = get_image_name(".", "custom-image:v1")
+        assert name == "custom-image:v1"
+        assert source == "override"
+    def test_get_image_name_from_pyproject(self, tmp_path: Path) -> None:
+        """Test image name from pyproject.toml."""
+        pyproject = tmp_path / "pyproject.toml"
+        pyproject.write_text("""
+[tool.hud]
+image = "my-project:latest"
+""")
+        name, source = get_image_name(str(tmp_path))
+        assert name == "my-project:latest"
+        assert source == "cache"
+    def test_get_image_name_auto_generate(self, tmp_path: Path) -> None:
+        """Test auto-generated image name."""
+        test_dir = tmp_path / "my_test_project"
+        test_dir.mkdir()
+        name, source = get_image_name(str(test_dir))
+        assert name == "hud-my-test-project:dev"
+        assert source == "auto"
+    def test_update_pyproject_toml(self, tmp_path: Path) -> None:
+        """Test updating pyproject.toml with image name."""
+        pyproject = tmp_path / "pyproject.toml"
+        pyproject.write_text("""
+[project]
+name = "test"
+""")
+        update_pyproject_toml(str(tmp_path), "new-image:v1", silent=True)
+        content = pyproject.read_text()
+        assert "[tool.hud]" in content
+        assert 'image = "new-image:v1"' in content
+class TestRunMCPDevServer:
+    """Test the main server runner."""
+    def test_run_dev_server_image_not_found(self) -> None:
+        """Test handling when Docker image doesn't exist."""
+        import click
+        with (
+            patch("hud.cli.mcp_server.image_exists", return_value=False),
+            patch("click.confirm", return_value=False),
+            pytest.raises(click.Abort),
+        ):
+            run_mcp_dev_server(
+                directory=".",
+                image="missing:latest",
+                build=False,
+                no_cache=False,
+                transport="http",
+                port=8765,
+                no_reload=False,
+                verbose=False,
+                inspector=False,
+                no_logs=False,
+                docker_args=[],
+                interactive=False,
+            )

hud-python 0.3.5__py3-none-any.whl → 0.4.0__py3-none-any.whl

Potentially problematic release.

hud-python 0.3.5py3-none-any.whl → 0.4.0py3-none-any.whl