PyPI - hud-python - Versions diffs - 0.4.1__py3-none-any.whl → 0.4.3__py3-none-any.whl - Mend

hud-python 0.4.1py3-none-any.whl → 0.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hud-python might be problematic. Click here for more details.

Files changed (130) hide show

hud/__init__.py +22 -22
hud/agents/__init__.py +13 -15
hud/agents/base.py +599 -599
hud/agents/claude.py +373 -373
hud/agents/langchain.py +261 -250
hud/agents/misc/__init__.py +7 -7
hud/agents/misc/response_agent.py +82 -80
hud/agents/openai.py +352 -352
hud/agents/openai_chat_generic.py +154 -154
hud/agents/tests/__init__.py +1 -1
hud/agents/tests/test_base.py +742 -742
hud/agents/tests/test_claude.py +324 -324
hud/agents/tests/test_client.py +363 -363
hud/agents/tests/test_openai.py +237 -237
hud/cli/__init__.py +617 -617
hud/cli/__main__.py +8 -8
hud/cli/analyze.py +371 -371
hud/cli/analyze_metadata.py +230 -230
hud/cli/build.py +498 -427
hud/cli/clone.py +185 -185
hud/cli/cursor.py +92 -92
hud/cli/debug.py +392 -392
hud/cli/docker_utils.py +83 -83
hud/cli/init.py +280 -281
hud/cli/interactive.py +353 -353
hud/cli/mcp_server.py +764 -756
hud/cli/pull.py +330 -336
hud/cli/push.py +404 -370
hud/cli/remote_runner.py +311 -311
hud/cli/runner.py +160 -160
hud/cli/tests/__init__.py +3 -3
hud/cli/tests/test_analyze.py +284 -284
hud/cli/tests/test_cli_init.py +265 -265
hud/cli/tests/test_cli_main.py +27 -27
hud/cli/tests/test_clone.py +142 -142
hud/cli/tests/test_cursor.py +253 -253
hud/cli/tests/test_debug.py +453 -453
hud/cli/tests/test_mcp_server.py +139 -139
hud/cli/tests/test_utils.py +388 -388
hud/cli/utils.py +263 -263
hud/clients/README.md +143 -143
hud/clients/__init__.py +16 -16
hud/clients/base.py +378 -379
hud/clients/fastmcp.py +222 -222
hud/clients/mcp_use.py +298 -278
hud/clients/tests/__init__.py +1 -1
hud/clients/tests/test_client_integration.py +111 -111
hud/clients/tests/test_fastmcp.py +342 -342
hud/clients/tests/test_protocol.py +188 -188
hud/clients/utils/__init__.py +1 -1
hud/clients/utils/retry_transport.py +160 -160
hud/datasets.py +327 -322
hud/misc/__init__.py +1 -1
hud/misc/claude_plays_pokemon.py +292 -292
hud/otel/__init__.py +35 -35
hud/otel/collector.py +142 -142
hud/otel/config.py +164 -164
hud/otel/context.py +536 -536
hud/otel/exporters.py +366 -366
hud/otel/instrumentation.py +97 -97
hud/otel/processors.py +118 -118
hud/otel/tests/__init__.py +1 -1
hud/otel/tests/test_processors.py +197 -197
hud/server/__init__.py +5 -5
hud/server/context.py +114 -114
hud/server/helper/__init__.py +5 -5
hud/server/low_level.py +132 -132
hud/server/server.py +170 -166
hud/server/tests/__init__.py +3 -3
hud/settings.py +73 -73
hud/shared/__init__.py +5 -5
hud/shared/exceptions.py +180 -180
hud/shared/requests.py +264 -264
hud/shared/tests/test_exceptions.py +157 -157
hud/shared/tests/test_requests.py +275 -275
hud/telemetry/__init__.py +25 -25
hud/telemetry/instrument.py +379 -379
hud/telemetry/job.py +309 -309
hud/telemetry/replay.py +74 -74
hud/telemetry/trace.py +83 -83
hud/tools/__init__.py +33 -33
hud/tools/base.py +365 -365
hud/tools/bash.py +161 -161
hud/tools/computer/__init__.py +15 -15
hud/tools/computer/anthropic.py +437 -437
hud/tools/computer/hud.py +376 -376
hud/tools/computer/openai.py +295 -295
hud/tools/computer/settings.py +82 -82
hud/tools/edit.py +314 -314
hud/tools/executors/__init__.py +30 -30
hud/tools/executors/base.py +539 -539
hud/tools/executors/pyautogui.py +621 -621
hud/tools/executors/tests/__init__.py +1 -1
hud/tools/executors/tests/test_base_executor.py +338 -338
hud/tools/executors/tests/test_pyautogui_executor.py +165 -165
hud/tools/executors/xdo.py +511 -511
hud/tools/playwright.py +412 -412
hud/tools/tests/__init__.py +3 -3
hud/tools/tests/test_base.py +282 -282
hud/tools/tests/test_bash.py +158 -158
hud/tools/tests/test_bash_extended.py +197 -197
hud/tools/tests/test_computer.py +425 -425
hud/tools/tests/test_computer_actions.py +34 -34
hud/tools/tests/test_edit.py +259 -259
hud/tools/tests/test_init.py +27 -27
hud/tools/tests/test_playwright_tool.py +183 -183
hud/tools/tests/test_tools.py +145 -145
hud/tools/tests/test_utils.py +156 -156
hud/tools/types.py +72 -72
hud/tools/utils.py +50 -50
hud/types.py +136 -136
hud/utils/__init__.py +10 -10
hud/utils/async_utils.py +65 -65
hud/utils/design.py +236 -168
hud/utils/mcp.py +55 -55
hud/utils/progress.py +149 -149
hud/utils/telemetry.py +66 -66
hud/utils/tests/test_async_utils.py +173 -173
hud/utils/tests/test_init.py +17 -17
hud/utils/tests/test_progress.py +261 -261
hud/utils/tests/test_telemetry.py +82 -82
hud/utils/tests/test_version.py +8 -8
hud/version.py +7 -7
{hud_python-0.4.1.dist-info → hud_python-0.4.3.dist-info}/METADATA +10 -8
hud_python-0.4.3.dist-info/RECORD +131 -0
{hud_python-0.4.1.dist-info → hud_python-0.4.3.dist-info}/licenses/LICENSE +21 -21
hud/agents/art.py +0 -101
hud_python-0.4.1.dist-info/RECORD +0 -132
{hud_python-0.4.1.dist-info → hud_python-0.4.3.dist-info}/WHEEL +0 -0
{hud_python-0.4.1.dist-info → hud_python-0.4.3.dist-info}/entry_points.txt +0 -0

hud/cli/tests/test_debug.py CHANGED Viewed

@@ -1,453 +1,453 @@
-"""Tests for hud.cli.debug module."""
-from __future__ import annotations
-import json
-from unittest.mock import AsyncMock, MagicMock, Mock, patch
-import pytest
-from hud.cli.debug import debug_mcp_stdio
-from hud.cli.utils import CaptureLogger
-class TestDebugMCPStdio:
-    """Test the debug_mcp_stdio function."""
-    @pytest.mark.asyncio
-    async def test_phase_1_command_not_found(self) -> None:
-        """Test Phase 1 failure when command not found."""
-        logger = CaptureLogger(print_output=False)
-        with patch("subprocess.run", side_effect=FileNotFoundError()):
-            phases = await debug_mcp_stdio(["nonexistent"], logger, max_phase=5)
-            assert phases == 0
-            output = logger.get_output()
-            assert "Command not found: nonexistent" in output
-    @pytest.mark.asyncio
-    async def test_phase_1_command_fails(self) -> None:
-        """Test Phase 1 failure when command returns error."""
-        logger = CaptureLogger(print_output=False)
-        mock_result = Mock()
-        mock_result.returncode = 1
-        mock_result.stderr = "Command failed with error"
-        with patch("subprocess.run", return_value=mock_result):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            assert phases == 0
-            output = logger.get_output()
-            assert "Command failed with exit code 1" in output
-            assert "Command failed with error" in output
-    @pytest.mark.asyncio
-    async def test_phase_1_success(self) -> None:
-        """Test Phase 1 success."""
-        logger = CaptureLogger(print_output=False)
-        mock_result = Mock()
-        mock_result.returncode = 0
-        mock_result.stderr = ""
-        with patch("subprocess.run", return_value=mock_result):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
-            assert phases == 1
-            output = logger.get_output()
-            assert "Command executable found" in output
-            assert "Stopping at phase 1 as requested" in output
-    @pytest.mark.asyncio
-    async def test_phase_1_usage_in_stderr(self) -> None:
-        """Test Phase 1 success when usage info in stderr."""
-        logger = CaptureLogger(print_output=False)
-        mock_result = Mock()
-        mock_result.returncode = 1
-        mock_result.stderr = "usage: test-cmd [options]"
-        with patch("subprocess.run", return_value=mock_result):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
-            assert phases == 1
-            output = logger.get_output()
-            assert "Command executable found" in output
-    @pytest.mark.asyncio
-    async def test_phase_2_mcp_initialize_success(self) -> None:
-        """Test Phase 2 MCP initialization success."""
-        logger = CaptureLogger(print_output=False)
-        # Mock Phase 1 success
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        # Mock subprocess.Popen for Phase 2
-        mock_proc = MagicMock()
-        mock_proc.stdin = MagicMock()
-        mock_proc.stdout = MagicMock()
-        mock_proc.stderr = MagicMock()
-        # Mock successful MCP response
-        init_response = {
-            "jsonrpc": "2.0",
-            "id": 1,
-            "result": {
-                "serverInfo": {"name": "TestServer", "version": "1.0"},
-                "capabilities": {"tools": {}, "resources": {}},
-            },
-        }
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])  # No stderr output
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-        ):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=2)
-            assert phases == 2
-            output = logger.get_output()
-            assert "MCP server initialized successfully" in output
-            assert "Server: TestServer v1.0" in output
-    @pytest.mark.asyncio
-    async def test_phase_2_no_response(self) -> None:
-        """Test Phase 2 failure when no MCP response."""
-        logger = CaptureLogger(print_output=False)
-        # Mock Phase 1 success
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        # Mock subprocess.Popen for Phase 2
-        mock_proc = MagicMock()
-        mock_proc.stdin = MagicMock()
-        mock_proc.stdout = MagicMock()
-        mock_proc.stderr = MagicMock()
-        # No stdout response
-        mock_proc.stdout.readline.return_value = ""
-        mock_proc.stderr.__iter__ = lambda x: iter(["[ERROR] Server failed to start"])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("time.time", side_effect=[0, 0, 20]),
-        ):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            assert phases == 1
-            output = logger.get_output()
-            assert "No valid MCP response received" in output
-    @pytest.mark.asyncio
-    async def test_phase_2_invalid_json_response(self) -> None:
-        """Test Phase 2 handling of invalid JSON response."""
-        logger = CaptureLogger(print_output=False)
-        # Mock Phase 1 success
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        # Mock subprocess.Popen
-        mock_proc = MagicMock()
-        mock_proc.stdin = MagicMock()
-        mock_proc.stdout = MagicMock()
-        mock_proc.stderr = MagicMock()
-        # Invalid JSON response
-        mock_proc.stdout.readline.return_value = "Invalid JSON\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-        ):
-            # Simulate timeout - time.time() is called multiple times in the loop
-            # Return increasing values to simulate time passing
-            time_values = list(range(20))
-            with patch("time.time", side_effect=time_values):
-                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-                assert phases == 1
-                output = logger.get_output()
-                # The error message might vary, but should indicate no valid response
-                assert (
-                    "Failed to parse MCP response" in output
-                    or "No valid MCP response received" in output
-                )
-    @pytest.mark.asyncio
-    async def test_phase_3_tool_discovery(self) -> None:
-        """Test Phase 3 tool discovery."""
-        logger = CaptureLogger(print_output=False)
-        # Mock Phase 1 & 2 success
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        mock_proc.stdin = MagicMock()
-        mock_proc.stdout = MagicMock()
-        mock_proc.stderr = MagicMock()
-        init_response = {
-            "jsonrpc": "2.0",
-            "id": 1,
-            "result": {"serverInfo": {"name": "TestServer", "version": "1.0"}},
-        }
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        # Mock tool discovery - create proper mock tools
-        mock_tools = []
-        for tool_name in ["setup", "evaluate", "computer", "custom_tool"]:
-            tool = Mock()
-            tool.name = tool_name
-            mock_tools.append(tool)
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            mock_client = MockClient.return_value
-            mock_client.initialize = AsyncMock()
-            mock_client.list_tools = AsyncMock(return_value=mock_tools)
-            mock_client.list_resources = AsyncMock(return_value=[])
-            mock_client.shutdown = AsyncMock()
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=3)
-            assert phases == 3
-            output = logger.get_output()
-            assert "Found 4 tools" in output
-            assert "Lifecycle tools: setup=✅, evaluate=✅" in output
-            assert "Interaction tools: computer" in output
-            assert "All tools: setup, evaluate, computer, custom_tool" in output
-    @pytest.mark.asyncio
-    async def test_phase_3_no_tools(self) -> None:
-        """Test Phase 3 when no tools found."""
-        logger = CaptureLogger(print_output=False)
-        # Mock Phase 1 & 2 success
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            mock_client = MockClient.return_value
-            mock_client.initialize = AsyncMock()
-            mock_client.list_tools = AsyncMock(return_value=[])
-            mock_client.shutdown = AsyncMock()
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            assert phases == 2
-            output = logger.get_output()
-            assert "No tools found" in output
-            assert "@mcp.tool() decorator" in output
-    @pytest.mark.asyncio
-    async def test_phase_4_remote_deployment(self) -> None:
-        """Test Phase 4 remote deployment readiness."""
-        logger = CaptureLogger(print_output=False)
-        # Setup mocks for phases 1-3
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        # Create proper mock tools
-        mock_tools = []
-        for tool_name in ["setup", "evaluate"]:
-            tool = Mock()
-            tool.name = tool_name
-            mock_tools.append(tool)
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            mock_client = MockClient.return_value
-            mock_client.initialize = AsyncMock()
-            mock_client.list_tools = AsyncMock(return_value=mock_tools)
-            mock_client.list_resources = AsyncMock(return_value=[])
-            mock_client.call_tool = AsyncMock()
-            mock_client.shutdown = AsyncMock()
-            with patch("time.time", side_effect=[0, 5, 5, 5, 5]):  # Start at 0, then 5 for the rest
-                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=4)
-                assert phases == 4
-                output = logger.get_output()
-                assert "Total initialization time: 5.00s" in output
-                # Should have tested setup and evaluate tools
-                assert mock_client.call_tool.call_count == 2
-    @pytest.mark.asyncio
-    async def test_phase_4_slow_initialization(self) -> None:
-        """Test Phase 4 with slow initialization warning."""
-        logger = CaptureLogger(print_output=False)
-        # Setup basic mocks
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            mock_client = MockClient.return_value
-            mock_client.initialize = AsyncMock()
-            # Create proper mock tool
-            test_tool = Mock()
-            test_tool.name = "test"
-            mock_client.list_tools = AsyncMock(return_value=[test_tool])
-            mock_client.list_resources = AsyncMock(return_value=[])
-            mock_client.shutdown = AsyncMock()
-            # Simulate slow init (>30s)
-            # time.time() is called at start and after phase 3
-            with patch("time.time", side_effect=[0, 0, 0, 35, 35, 35]):
-                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-                output = logger.get_output()
-                # Check if we got to phase 4 where the timing check happens
-                if phases >= 4:
-                    assert "Initialization took >30s" in output
-                    assert "Consider optimizing startup time" in output
-    @pytest.mark.asyncio
-    async def test_phase_5_concurrent_clients(self) -> None:
-        """Test Phase 5 concurrent clients."""
-        logger = CaptureLogger(print_output=False)
-        # Setup mocks for all phases
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            # Create different mock instances for each client
-            mock_clients = []
-            for i in range(4):  # 1 main + 3 concurrent
-                mock_client = MagicMock()
-                mock_client.initialize = AsyncMock()
-                # Create proper mock tool
-                test_tool = Mock()
-                test_tool.name = "test"
-                mock_client.list_tools = AsyncMock(return_value=[test_tool])
-                mock_client.list_resources = AsyncMock(return_value=[])
-                mock_client.shutdown = AsyncMock()
-                mock_clients.append(mock_client)
-            MockClient.side_effect = mock_clients
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            assert phases == 5
-            output = logger.get_output()
-            assert "Creating 3 concurrent MCP clients" in output
-            assert "All concurrent clients connected" in output
-            # Verify all clients were shut down
-            for client in mock_clients:
-                client.shutdown.assert_called()
-    @pytest.mark.asyncio
-    async def test_phase_5_concurrent_failure(self) -> None:
-        """Test Phase 5 handling concurrent client failures."""
-        logger = CaptureLogger(print_output=False)
-        # Setup basic mocks
-        mock_run_result = Mock()
-        mock_run_result.returncode = 0
-        mock_proc = MagicMock()
-        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
-        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
-        mock_proc.stderr.__iter__ = lambda x: iter([])
-        with (
-            patch("subprocess.run", return_value=mock_run_result),
-            patch("subprocess.Popen", return_value=mock_proc),
-            patch("hud.cli.debug.MCPClient") as MockClient,
-        ):
-            # Set up for phase 1-4 success first
-            test_tool = Mock()
-            test_tool.name = "test"
-            # Phase 1-4 client
-            phase_client = MagicMock()
-            phase_client.initialize = AsyncMock()
-            phase_client.list_tools = AsyncMock(return_value=[test_tool])
-            phase_client.list_resources = AsyncMock(return_value=[])
-            phase_client.shutdown = AsyncMock()
-            # Phase 5 clients - first succeeds, second fails
-            mock_client1 = MagicMock()
-            mock_client1.initialize = AsyncMock()
-            mock_client1.list_tools = AsyncMock(return_value=[test_tool])
-            mock_client1.list_resources = AsyncMock(return_value=[])
-            mock_client1.shutdown = AsyncMock()
-            mock_client2 = MagicMock()
-            mock_client2.initialize = AsyncMock(side_effect=Exception("Connection failed"))
-            mock_client2.shutdown = AsyncMock()
-            MockClient.side_effect = [phase_client, mock_client1, mock_client2]
-            await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            output = logger.get_output()
-            assert "Concurrent test failed: Connection failed" in output
-    @pytest.mark.asyncio
-    async def test_docker_command_handling(self) -> None:
-        """Test special handling of Docker commands."""
-        logger = CaptureLogger(print_output=False)
-        mock_result = Mock()
-        mock_result.returncode = 0
-        with patch("subprocess.run", return_value=mock_result) as mock_run:
-            await debug_mcp_stdio(["docker", "run", "--rm", "image:latest"], logger, max_phase=1)
-            # Should add echo command for Docker
-            call_args = mock_run.call_args[0][0]
-            assert call_args == ["docker"]
-    @pytest.mark.asyncio
-    async def test_phase_exception_handling(self) -> None:
-        """Test general exception handling in phases."""
-        logger = CaptureLogger(print_output=False)
-        with patch("subprocess.run", side_effect=Exception("Unexpected error")):
-            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
-            assert phases == 0
-            output = logger.get_output()
-            assert "Startup test failed: Unexpected error" in output
-if __name__ == "__main__":
-    pytest.main([__file__])
+"""Tests for hud.cli.debug module."""
+from __future__ import annotations
+import json
+from unittest.mock import AsyncMock, MagicMock, Mock, patch
+import pytest
+from hud.cli.debug import debug_mcp_stdio
+from hud.cli.utils import CaptureLogger
+class TestDebugMCPStdio:
+    """Test the debug_mcp_stdio function."""
+    @pytest.mark.asyncio
+    async def test_phase_1_command_not_found(self) -> None:
+        """Test Phase 1 failure when command not found."""
+        logger = CaptureLogger(print_output=False)
+        with patch("subprocess.run", side_effect=FileNotFoundError()):
+            phases = await debug_mcp_stdio(["nonexistent"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Command not found: nonexistent" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_command_fails(self) -> None:
+        """Test Phase 1 failure when command returns error."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 1
+        mock_result.stderr = "Command failed with error"
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Command failed with exit code 1" in output
+            assert "Command failed with error" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_success(self) -> None:
+        """Test Phase 1 success."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 0
+        mock_result.stderr = ""
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
+            assert phases == 1
+            output = logger.get_output()
+            assert "Command executable found" in output
+            assert "Stopping at phase 1 as requested" in output
+    @pytest.mark.asyncio
+    async def test_phase_1_usage_in_stderr(self) -> None:
+        """Test Phase 1 success when usage info in stderr."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 1
+        mock_result.stderr = "usage: test-cmd [options]"
+        with patch("subprocess.run", return_value=mock_result):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=1)
+            assert phases == 1
+            output = logger.get_output()
+            assert "Command executable found" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_mcp_initialize_success(self) -> None:
+        """Test Phase 2 MCP initialization success."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen for Phase 2
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # Mock successful MCP response
+        init_response = {
+            "jsonrpc": "2.0",
+            "id": 1,
+            "result": {
+                "serverInfo": {"name": "TestServer", "version": "1.0"},
+                "capabilities": {"tools": {}, "resources": {}},
+            },
+        }
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])  # No stderr output
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+        ):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=2)
+            assert phases == 2
+            output = logger.get_output()
+            assert "MCP server initialized successfully" in output
+            assert "Server: TestServer v1.0" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_no_response(self) -> None:
+        """Test Phase 2 failure when no MCP response."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen for Phase 2
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # No stdout response
+        mock_proc.stdout.readline.return_value = ""
+        mock_proc.stderr.__iter__ = lambda x: iter(["[ERROR] Server failed to start"])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("time.time", side_effect=[0, 0, 20]),
+        ):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 1
+            output = logger.get_output()
+            assert "No valid MCP response received" in output
+    @pytest.mark.asyncio
+    async def test_phase_2_invalid_json_response(self) -> None:
+        """Test Phase 2 handling of invalid JSON response."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        # Mock subprocess.Popen
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        # Invalid JSON response
+        mock_proc.stdout.readline.return_value = "Invalid JSON\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+        ):
+            # Simulate timeout - time.time() is called multiple times in the loop
+            # Return increasing values to simulate time passing
+            time_values = list(range(20))
+            with patch("time.time", side_effect=time_values):
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+                assert phases == 1
+                output = logger.get_output()
+                # The error message might vary, but should indicate no valid response
+                assert (
+                    "Failed to parse MCP response" in output
+                    or "No valid MCP response received" in output
+                )
+    @pytest.mark.asyncio
+    async def test_phase_3_tool_discovery(self) -> None:
+        """Test Phase 3 tool discovery."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 & 2 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        mock_proc.stdin = MagicMock()
+        mock_proc.stdout = MagicMock()
+        mock_proc.stderr = MagicMock()
+        init_response = {
+            "jsonrpc": "2.0",
+            "id": 1,
+            "result": {"serverInfo": {"name": "TestServer", "version": "1.0"}},
+        }
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        # Mock tool discovery - create proper mock tools
+        mock_tools = []
+        for tool_name in ["setup", "evaluate", "computer", "custom_tool"]:
+            tool = Mock()
+            tool.name = tool_name
+            mock_tools.append(tool)
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=mock_tools)
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=3)
+            assert phases == 3
+            output = logger.get_output()
+            assert "Found 4 tools" in output
+            assert "Lifecycle tools: setup=✅, evaluate=✅" in output
+            assert "Interaction tools: computer" in output
+            assert "All tools: setup, evaluate, computer, custom_tool" in output
+    @pytest.mark.asyncio
+    async def test_phase_3_no_tools(self) -> None:
+        """Test Phase 3 when no tools found."""
+        logger = CaptureLogger(print_output=False)
+        # Mock Phase 1 & 2 success
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 2
+            output = logger.get_output()
+            assert "No tools found" in output
+            assert "@mcp.tool() decorator" in output
+    @pytest.mark.asyncio
+    async def test_phase_4_remote_deployment(self) -> None:
+        """Test Phase 4 remote deployment readiness."""
+        logger = CaptureLogger(print_output=False)
+        # Setup mocks for phases 1-3
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        # Create proper mock tools
+        mock_tools = []
+        for tool_name in ["setup", "evaluate"]:
+            tool = Mock()
+            tool.name = tool_name
+            mock_tools.append(tool)
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            mock_client.list_tools = AsyncMock(return_value=mock_tools)
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.call_tool = AsyncMock()
+            mock_client.shutdown = AsyncMock()
+            with patch("time.time", side_effect=[0, 5, 5, 5, 5]):  # Start at 0, then 5 for the rest
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=4)
+                assert phases == 4
+                output = logger.get_output()
+                assert "Total initialization time: 5.00s" in output
+                # Should have tested setup and evaluate tools
+                assert mock_client.call_tool.call_count == 2
+    @pytest.mark.asyncio
+    async def test_phase_4_slow_initialization(self) -> None:
+        """Test Phase 4 with slow initialization warning."""
+        logger = CaptureLogger(print_output=False)
+        # Setup basic mocks
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            mock_client = MockClient.return_value
+            mock_client.initialize = AsyncMock()
+            # Create proper mock tool
+            test_tool = Mock()
+            test_tool.name = "test"
+            mock_client.list_tools = AsyncMock(return_value=[test_tool])
+            mock_client.list_resources = AsyncMock(return_value=[])
+            mock_client.shutdown = AsyncMock()
+            # Simulate slow init (>30s)
+            # time.time() is called at start and after phase 3
+            with patch("time.time", side_effect=[0, 0, 0, 35, 35, 35]):
+                phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+                output = logger.get_output()
+                # Check if we got to phase 4 where the timing check happens
+                if phases >= 4:
+                    assert "Initialization took >30s" in output
+                    assert "Consider optimizing startup time" in output
+    @pytest.mark.asyncio
+    async def test_phase_5_concurrent_clients(self) -> None:
+        """Test Phase 5 concurrent clients."""
+        logger = CaptureLogger(print_output=False)
+        # Setup mocks for all phases
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            # Create different mock instances for each client
+            mock_clients = []
+            for i in range(4):  # 1 main + 3 concurrent
+                mock_client = MagicMock()
+                mock_client.initialize = AsyncMock()
+                # Create proper mock tool
+                test_tool = Mock()
+                test_tool.name = "test"
+                mock_client.list_tools = AsyncMock(return_value=[test_tool])
+                mock_client.list_resources = AsyncMock(return_value=[])
+                mock_client.shutdown = AsyncMock()
+                mock_clients.append(mock_client)
+            MockClient.side_effect = mock_clients
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 5
+            output = logger.get_output()
+            assert "Creating 3 concurrent MCP clients" in output
+            assert "All concurrent clients connected" in output
+            # Verify all clients were shut down
+            for client in mock_clients:
+                client.shutdown.assert_called()
+    @pytest.mark.asyncio
+    async def test_phase_5_concurrent_failure(self) -> None:
+        """Test Phase 5 handling concurrent client failures."""
+        logger = CaptureLogger(print_output=False)
+        # Setup basic mocks
+        mock_run_result = Mock()
+        mock_run_result.returncode = 0
+        mock_proc = MagicMock()
+        init_response = {"jsonrpc": "2.0", "id": 1, "result": {}}
+        mock_proc.stdout.readline.return_value = json.dumps(init_response) + "\n"
+        mock_proc.stderr.__iter__ = lambda x: iter([])
+        with (
+            patch("subprocess.run", return_value=mock_run_result),
+            patch("subprocess.Popen", return_value=mock_proc),
+            patch("hud.cli.debug.MCPClient") as MockClient,
+        ):
+            # Set up for phase 1-4 success first
+            test_tool = Mock()
+            test_tool.name = "test"
+            # Phase 1-4 client
+            phase_client = MagicMock()
+            phase_client.initialize = AsyncMock()
+            phase_client.list_tools = AsyncMock(return_value=[test_tool])
+            phase_client.list_resources = AsyncMock(return_value=[])
+            phase_client.shutdown = AsyncMock()
+            # Phase 5 clients - first succeeds, second fails
+            mock_client1 = MagicMock()
+            mock_client1.initialize = AsyncMock()
+            mock_client1.list_tools = AsyncMock(return_value=[test_tool])
+            mock_client1.list_resources = AsyncMock(return_value=[])
+            mock_client1.shutdown = AsyncMock()
+            mock_client2 = MagicMock()
+            mock_client2.initialize = AsyncMock(side_effect=Exception("Connection failed"))
+            mock_client2.shutdown = AsyncMock()
+            MockClient.side_effect = [phase_client, mock_client1, mock_client2]
+            await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            output = logger.get_output()
+            assert "Concurrent test failed: Connection failed" in output
+    @pytest.mark.asyncio
+    async def test_docker_command_handling(self) -> None:
+        """Test special handling of Docker commands."""
+        logger = CaptureLogger(print_output=False)
+        mock_result = Mock()
+        mock_result.returncode = 0
+        with patch("subprocess.run", return_value=mock_result) as mock_run:
+            await debug_mcp_stdio(["docker", "run", "--rm", "image:latest"], logger, max_phase=1)
+            # Should add echo command for Docker
+            call_args = mock_run.call_args[0][0]
+            assert call_args == ["docker"]
+    @pytest.mark.asyncio
+    async def test_phase_exception_handling(self) -> None:
+        """Test general exception handling in phases."""
+        logger = CaptureLogger(print_output=False)
+        with patch("subprocess.run", side_effect=Exception("Unexpected error")):
+            phases = await debug_mcp_stdio(["test-cmd"], logger, max_phase=5)
+            assert phases == 0
+            output = logger.get_output()
+            assert "Startup test failed: Unexpected error" in output
+if __name__ == "__main__":
+    pytest.main([__file__])

hud-python 0.4.1__py3-none-any.whl → 0.4.3__py3-none-any.whl

Potentially problematic release.

hud-python 0.4.1py3-none-any.whl → 0.4.3py3-none-any.whl