PyPI - amd-gaia - Versions diffs - 0.15.0__py3-none-any.whl → 0.15.2__py3-none-any.whl - Mend

amd-gaia 0.15.0py3-none-any.whl → 0.15.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (185) hide show

{amd_gaia-0.15.0.dist-info → amd_gaia-0.15.2.dist-info}/METADATA +222 -223
amd_gaia-0.15.2.dist-info/RECORD +182 -0
{amd_gaia-0.15.0.dist-info → amd_gaia-0.15.2.dist-info}/WHEEL +1 -1
{amd_gaia-0.15.0.dist-info → amd_gaia-0.15.2.dist-info}/entry_points.txt +1 -0
{amd_gaia-0.15.0.dist-info → amd_gaia-0.15.2.dist-info}/licenses/LICENSE.md +20 -20
gaia/__init__.py +29 -29
gaia/agents/__init__.py +19 -19
gaia/agents/base/__init__.py +9 -9
gaia/agents/base/agent.py +2132 -2177
gaia/agents/base/api_agent.py +119 -120
gaia/agents/base/console.py +1967 -1841
gaia/agents/base/errors.py +237 -237
gaia/agents/base/mcp_agent.py +86 -86
gaia/agents/base/tools.py +88 -83
gaia/agents/blender/__init__.py +7 -0
gaia/agents/blender/agent.py +553 -556
gaia/agents/blender/agent_simple.py +133 -135
gaia/agents/blender/app.py +211 -211
gaia/agents/blender/app_simple.py +41 -41
gaia/agents/blender/core/__init__.py +16 -16
gaia/agents/blender/core/materials.py +506 -506
gaia/agents/blender/core/objects.py +316 -316
gaia/agents/blender/core/rendering.py +225 -225
gaia/agents/blender/core/scene.py +220 -220
gaia/agents/blender/core/view.py +146 -146
gaia/agents/chat/__init__.py +9 -9
gaia/agents/chat/agent.py +809 -835
gaia/agents/chat/app.py +1065 -1058
gaia/agents/chat/session.py +508 -508
gaia/agents/chat/tools/__init__.py +15 -15
gaia/agents/chat/tools/file_tools.py +96 -96
gaia/agents/chat/tools/rag_tools.py +1744 -1729
gaia/agents/chat/tools/shell_tools.py +437 -436
gaia/agents/code/__init__.py +7 -7
gaia/agents/code/agent.py +549 -549
gaia/agents/code/cli.py +377 -0
gaia/agents/code/models.py +135 -135
gaia/agents/code/orchestration/__init__.py +24 -24
gaia/agents/code/orchestration/checklist_executor.py +1763 -1763
gaia/agents/code/orchestration/checklist_generator.py +713 -713
gaia/agents/code/orchestration/factories/__init__.py +9 -9
gaia/agents/code/orchestration/factories/base.py +63 -63
gaia/agents/code/orchestration/factories/nextjs_factory.py +118 -118
gaia/agents/code/orchestration/factories/python_factory.py +106 -106
gaia/agents/code/orchestration/orchestrator.py +841 -841
gaia/agents/code/orchestration/project_analyzer.py +391 -391
gaia/agents/code/orchestration/steps/__init__.py +67 -67
gaia/agents/code/orchestration/steps/base.py +188 -188
gaia/agents/code/orchestration/steps/error_handler.py +314 -314
gaia/agents/code/orchestration/steps/nextjs.py +828 -828
gaia/agents/code/orchestration/steps/python.py +307 -307
gaia/agents/code/orchestration/template_catalog.py +469 -469
gaia/agents/code/orchestration/workflows/__init__.py +14 -14
gaia/agents/code/orchestration/workflows/base.py +80 -80
gaia/agents/code/orchestration/workflows/nextjs.py +186 -186
gaia/agents/code/orchestration/workflows/python.py +94 -94
gaia/agents/code/prompts/__init__.py +11 -11
gaia/agents/code/prompts/base_prompt.py +77 -77
gaia/agents/code/prompts/code_patterns.py +2034 -2036
gaia/agents/code/prompts/nextjs_prompt.py +40 -40
gaia/agents/code/prompts/python_prompt.py +109 -109
gaia/agents/code/schema_inference.py +365 -365
gaia/agents/code/system_prompt.py +41 -41
gaia/agents/code/tools/__init__.py +42 -42
gaia/agents/code/tools/cli_tools.py +1138 -1138
gaia/agents/code/tools/code_formatting.py +319 -319
gaia/agents/code/tools/code_tools.py +769 -769
gaia/agents/code/tools/error_fixing.py +1347 -1347
gaia/agents/code/tools/external_tools.py +180 -180
gaia/agents/code/tools/file_io.py +845 -845
gaia/agents/code/tools/prisma_tools.py +190 -190
gaia/agents/code/tools/project_management.py +1016 -1016
gaia/agents/code/tools/testing.py +321 -321
gaia/agents/code/tools/typescript_tools.py +122 -122
gaia/agents/code/tools/validation_parsing.py +461 -461
gaia/agents/code/tools/validation_tools.py +806 -806
gaia/agents/code/tools/web_dev_tools.py +1758 -1758
gaia/agents/code/validators/__init__.py +16 -16
gaia/agents/code/validators/antipattern_checker.py +241 -241
gaia/agents/code/validators/ast_analyzer.py +197 -197
gaia/agents/code/validators/requirements_validator.py +145 -145
gaia/agents/code/validators/syntax_validator.py +171 -171
gaia/agents/docker/__init__.py +7 -7
gaia/agents/docker/agent.py +643 -642
gaia/agents/emr/__init__.py +8 -8
gaia/agents/emr/agent.py +1504 -1506
gaia/agents/emr/cli.py +1322 -1322
gaia/agents/emr/constants.py +475 -475
gaia/agents/emr/dashboard/__init__.py +4 -4
gaia/agents/emr/dashboard/server.py +1972 -1974
gaia/agents/jira/__init__.py +11 -11
gaia/agents/jira/agent.py +894 -894
gaia/agents/jira/jql_templates.py +299 -299
gaia/agents/routing/__init__.py +7 -7
gaia/agents/routing/agent.py +567 -570
gaia/agents/routing/system_prompt.py +75 -75
gaia/agents/summarize/__init__.py +11 -0
gaia/agents/summarize/agent.py +885 -0
gaia/agents/summarize/prompts.py +129 -0
gaia/api/__init__.py +23 -23
gaia/api/agent_registry.py +238 -238
gaia/api/app.py +305 -305
gaia/api/openai_server.py +575 -575
gaia/api/schemas.py +186 -186
gaia/api/sse_handler.py +373 -373
gaia/apps/__init__.py +4 -4
gaia/apps/llm/__init__.py +6 -6
gaia/apps/llm/app.py +184 -169
gaia/apps/summarize/app.py +116 -633
gaia/apps/summarize/html_viewer.py +133 -133
gaia/apps/summarize/pdf_formatter.py +284 -284
gaia/audio/__init__.py +2 -2
gaia/audio/audio_client.py +439 -439
gaia/audio/audio_recorder.py +269 -269
gaia/audio/kokoro_tts.py +599 -599
gaia/audio/whisper_asr.py +432 -432
gaia/chat/__init__.py +16 -16
gaia/chat/app.py +428 -430
gaia/chat/prompts.py +522 -522
gaia/chat/sdk.py +1228 -1225
gaia/cli.py +5659 -5632
gaia/database/__init__.py +10 -10
gaia/database/agent.py +176 -176
gaia/database/mixin.py +290 -290
gaia/database/testing.py +64 -64
gaia/eval/batch_experiment.py +2332 -2332
gaia/eval/claude.py +542 -542
gaia/eval/config.py +37 -37
gaia/eval/email_generator.py +512 -512
gaia/eval/eval.py +3179 -3179
gaia/eval/groundtruth.py +1130 -1130
gaia/eval/transcript_generator.py +582 -582
gaia/eval/webapp/README.md +167 -167
gaia/eval/webapp/package-lock.json +875 -875
gaia/eval/webapp/package.json +20 -20
gaia/eval/webapp/public/app.js +3402 -3402
gaia/eval/webapp/public/index.html +87 -87
gaia/eval/webapp/public/styles.css +3661 -3661
gaia/eval/webapp/server.js +415 -415
gaia/eval/webapp/test-setup.js +72 -72
gaia/installer/__init__.py +23 -0
gaia/installer/init_command.py +1275 -0
gaia/installer/lemonade_installer.py +619 -0
gaia/llm/__init__.py +10 -2
gaia/llm/base_client.py +60 -0
gaia/llm/exceptions.py +12 -0
gaia/llm/factory.py +70 -0
gaia/llm/lemonade_client.py +3421 -3221
gaia/llm/lemonade_manager.py +294 -294
gaia/llm/providers/__init__.py +9 -0
gaia/llm/providers/claude.py +108 -0
gaia/llm/providers/lemonade.py +118 -0
gaia/llm/providers/openai_provider.py +79 -0
gaia/llm/vlm_client.py +382 -382
gaia/logger.py +189 -189
gaia/mcp/agent_mcp_server.py +245 -245
gaia/mcp/blender_mcp_client.py +138 -138
gaia/mcp/blender_mcp_server.py +648 -648
gaia/mcp/context7_cache.py +332 -332
gaia/mcp/external_services.py +518 -518
gaia/mcp/mcp_bridge.py +811 -550
gaia/mcp/servers/__init__.py +6 -6
gaia/mcp/servers/docker_mcp.py +83 -83
gaia/perf_analysis.py +361 -0
gaia/rag/__init__.py +10 -10
gaia/rag/app.py +293 -293
gaia/rag/demo.py +304 -304
gaia/rag/pdf_utils.py +235 -235
gaia/rag/sdk.py +2194 -2194
gaia/security.py +183 -163
gaia/talk/app.py +287 -289
gaia/talk/sdk.py +538 -538
gaia/testing/__init__.py +87 -87
gaia/testing/assertions.py +330 -330
gaia/testing/fixtures.py +333 -333
gaia/testing/mocks.py +493 -493
gaia/util.py +46 -46
gaia/utils/__init__.py +33 -33
gaia/utils/file_watcher.py +675 -675
gaia/utils/parsing.py +223 -223
gaia/version.py +100 -100
amd_gaia-0.15.0.dist-info/RECORD +0 -168
gaia/agents/code/app.py +0 -266
gaia/llm/llm_client.py +0 -723
{amd_gaia-0.15.0.dist-info → amd_gaia-0.15.2.dist-info}/top_level.txt +0 -0

gaia/testing/assertions.py CHANGED Viewed

@@ -1,330 +1,330 @@
-# Copyright(C) 2025-2026 Advanced Micro Devices, Inc. All rights reserved.
-# SPDX-License-Identifier: MIT
-"""Assertion helpers for testing GAIA agents."""
-from typing import Any, Dict, List, Optional, Union
-from gaia.testing.mocks import MockLLMProvider, MockToolExecutor, MockVLMClient
-def assert_llm_called(
-    mock_llm: MockLLMProvider,
-    times: Optional[int] = None,
-    min_times: Optional[int] = None,
-    max_times: Optional[int] = None,
-) -> None:
-    """
-    Assert that the mock LLM was called.
-    Args:
-        mock_llm: MockLLMProvider instance
-        times: Exact number of expected calls (optional)
-        min_times: Minimum number of calls (optional)
-        max_times: Maximum number of calls (optional)
-    Raises:
-        AssertionError: If call count doesn't match expectations
-    Example:
-        from gaia.testing import MockLLMProvider, assert_llm_called
-        mock_llm = MockLLMProvider(responses=["Hello"])
-        mock_llm.generate("Test")
-        assert_llm_called(mock_llm)  # At least once
-        assert_llm_called(mock_llm, times=1)  # Exactly once
-        assert_llm_called(mock_llm, min_times=1, max_times=5)  # Range
-    """
-    call_count = mock_llm.call_count
-    if times is not None:
-        assert call_count == times, (
-            f"Expected LLM to be called {times} time(s), "
-            f"but was called {call_count} time(s)"
-        )
-    else:
-        if min_times is None and max_times is None:
-            # Just check it was called at least once
-            assert call_count > 0, "Expected LLM to be called at least once"
-        if min_times is not None:
-            assert call_count >= min_times, (
-                f"Expected LLM to be called at least {min_times} time(s), "
-                f"but was called {call_count} time(s)"
-            )
-        if max_times is not None:
-            assert call_count <= max_times, (
-                f"Expected LLM to be called at most {max_times} time(s), "
-                f"but was called {call_count} time(s)"
-            )
-def assert_llm_prompt_contains(
-    mock_llm: MockLLMProvider,
-    text: str,
-    call_index: int = -1,
-) -> None:
-    """
-    Assert that an LLM prompt contains specific text.
-    Args:
-        mock_llm: MockLLMProvider instance
-        text: Text that should be in the prompt
-        call_index: Which call to check (-1 = last call, 0 = first call)
-    Raises:
-        AssertionError: If text not found in prompt
-    Example:
-        assert_llm_prompt_contains(mock_llm, "customer")
-        assert_llm_prompt_contains(mock_llm, "search", call_index=0)
-    """
-    assert mock_llm.call_history, "LLM was never called"
-    call = mock_llm.call_history[call_index]
-    prompt = call.get("prompt", "")
-    assert (
-        text in prompt
-    ), f"Expected prompt to contain '{text}', but prompt was:\n{prompt[:500]}"
-def assert_vlm_called(
-    mock_vlm: MockVLMClient,
-    times: Optional[int] = None,
-) -> None:
-    """
-    Assert that the mock VLM was called.
-    Args:
-        mock_vlm: MockVLMClient instance
-        times: Exact number of expected calls (optional)
-    Raises:
-        AssertionError: If call count doesn't match
-    Example:
-        assert_vlm_called(mock_vlm)  # At least once
-        assert_vlm_called(mock_vlm, times=2)  # Exactly twice
-    """
-    call_count = mock_vlm.call_count
-    if times is not None:
-        assert call_count == times, (
-            f"Expected VLM to be called {times} time(s), "
-            f"but was called {call_count} time(s)"
-        )
-    else:
-        assert call_count > 0, "Expected VLM to be called at least once"
-def assert_tool_called(
-    executor: MockToolExecutor,
-    tool_name: str,
-    times: Optional[int] = None,
-) -> None:
-    """
-    Assert that a specific tool was called.
-    Args:
-        executor: MockToolExecutor instance
-        tool_name: Name of the tool
-        times: Exact number of expected calls (optional)
-    Raises:
-        AssertionError: If tool wasn't called or count doesn't match
-    Example:
-        from gaia.testing import MockToolExecutor, assert_tool_called
-        executor = MockToolExecutor()
-        executor.execute("search", {"query": "test"})
-        assert_tool_called(executor, "search")
-        assert_tool_called(executor, "search", times=1)
-    """
-    calls = executor.get_tool_calls(tool_name)
-    if times is not None:
-        assert len(calls) == times, (
-            f"Expected tool '{tool_name}' to be called {times} time(s), "
-            f"but was called {len(calls)} time(s)"
-        )
-    else:
-        assert len(calls) > 0, (
-            f"Expected tool '{tool_name}' to be called, but it was never called. "
-            f"Tools called: {executor.tool_names_called}"
-        )
-def assert_tool_args(
-    executor: MockToolExecutor,
-    tool_name: str,
-    expected_args: Dict[str, Any],
-    call_index: int = 0,
-) -> None:
-    """
-    Assert that a tool was called with specific arguments.
-    Args:
-        executor: MockToolExecutor instance
-        tool_name: Name of the tool
-        expected_args: Expected arguments (subset matching)
-        call_index: Which call to check (0 = first call)
-    Raises:
-        AssertionError: If arguments don't match
-    Example:
-        executor.execute("search", {"query": "test", "limit": 10})
-        assert_tool_args(executor, "search", {"query": "test"})
-    """
-    actual_args = executor.get_tool_args(tool_name, call_index)
-    assert (
-        actual_args is not None
-    ), f"Tool '{tool_name}' was not called (or call_index {call_index} out of range)"
-    for key, expected_value in expected_args.items():
-        assert key in actual_args, (
-            f"Expected argument '{key}' not found in tool call. "
-            f"Actual args: {actual_args}"
-        )
-        assert actual_args[key] == expected_value, (
-            f"Argument '{key}' mismatch. "
-            f"Expected: {expected_value}, Actual: {actual_args[key]}"
-        )
-def assert_result_has_keys(
-    result: Dict[str, Any],
-    keys: List[str],
-) -> None:
-    """
-    Assert that a result dictionary has specific keys.
-    Args:
-        result: Result dictionary to check
-        keys: List of required keys
-    Raises:
-        AssertionError: If any key is missing
-    Example:
-        result = agent.process_query("test")
-        assert_result_has_keys(result, ["answer", "steps_taken"])
-    """
-    assert isinstance(
-        result, dict
-    ), f"Expected result to be dict, got {type(result).__name__}"
-    missing_keys = [key for key in keys if key not in result]
-    if missing_keys:
-        raise AssertionError(
-            f"Result missing required keys: {missing_keys}. "
-            f"Available keys: {list(result.keys())}"
-        )
-def assert_result_value(
-    result: Dict[str, Any],
-    key: str,
-    expected: Any,
-) -> None:
-    """
-    Assert that a result has a specific value for a key.
-    Args:
-        result: Result dictionary
-        key: Key to check
-        expected: Expected value
-    Raises:
-        AssertionError: If value doesn't match
-    Example:
-        assert_result_value(result, "status", "success")
-    """
-    assert key in result, f"Key '{key}' not found in result: {list(result.keys())}"
-    actual = result[key]
-    assert (
-        actual == expected
-    ), f"Value mismatch for key '{key}'. Expected: {expected}, Actual: {actual}"
-def assert_agent_completed(
-    result: Union[Dict[str, Any], str],
-    has_answer: bool = True,
-) -> None:
-    """
-    Assert that an agent completed processing successfully.
-    Args:
-        result: Result from agent.process_query()
-        has_answer: Whether to check for an 'answer' key
-    Raises:
-        AssertionError: If agent didn't complete properly
-    Example:
-        result = agent.process_query("test")
-        assert_agent_completed(result)
-    """
-    # Handle string results (some agents return strings directly)
-    if isinstance(result, str):
-        assert len(result) > 0, "Agent returned empty string"
-        return
-    assert isinstance(
-        result, dict
-    ), f"Expected result to be dict or str, got {type(result).__name__}"
-    # Check for error indicators
-    if "error" in result and result["error"]:
-        raise AssertionError(f"Agent returned error: {result['error']}")
-    if "status" in result and result["status"] == "error":
-        error_msg = result.get("message", result.get("error", "Unknown error"))
-        raise AssertionError(f"Agent returned error status: {error_msg}")
-    # Check for answer if required
-    if has_answer:
-        assert "answer" in result or "response" in result or "result" in result, (
-            "Agent result missing answer/response/result key. "
-            f"Keys present: {list(result.keys())}"
-        )
-def assert_no_errors(result: Dict[str, Any]) -> None:
-    """
-    Assert that a result contains no errors.
-    Args:
-        result: Result dictionary
-    Raises:
-        AssertionError: If result contains error indicators
-    Example:
-        result = agent.process_query("test")
-        assert_no_errors(result)
-    """
-    if not isinstance(result, dict):
-        return  # Non-dict results don't have error keys
-    # Check various error patterns
-    if "error" in result and result["error"]:
-        raise AssertionError(f"Result contains error: {result['error']}")
-    if "errors" in result and result["errors"]:
-        raise AssertionError(f"Result contains errors: {result['errors']}")
-    if result.get("status") == "error":
-        msg = result.get("message", result.get("error", "Unknown"))
-        raise AssertionError(f"Result has error status: {msg}")
-    if result.get("success") is False:
-        msg = result.get("message", result.get("error", "Unknown"))
-        raise AssertionError(f"Result indicates failure: {msg}")
+# Copyright(C) 2025-2026 Advanced Micro Devices, Inc. All rights reserved.
+# SPDX-License-Identifier: MIT
+"""Assertion helpers for testing GAIA agents."""
+from typing import Any, Dict, List, Optional, Union
+from gaia.testing.mocks import MockLLMProvider, MockToolExecutor, MockVLMClient
+def assert_llm_called(
+    mock_llm: MockLLMProvider,
+    times: Optional[int] = None,
+    min_times: Optional[int] = None,
+    max_times: Optional[int] = None,
+) -> None:
+    """
+    Assert that the mock LLM was called.
+    Args:
+        mock_llm: MockLLMProvider instance
+        times: Exact number of expected calls (optional)
+        min_times: Minimum number of calls (optional)
+        max_times: Maximum number of calls (optional)
+    Raises:
+        AssertionError: If call count doesn't match expectations
+    Example:
+        from gaia.testing import MockLLMProvider, assert_llm_called
+        mock_llm = MockLLMProvider(responses=["Hello"])
+        mock_llm.generate("Test")
+        assert_llm_called(mock_llm)  # At least once
+        assert_llm_called(mock_llm, times=1)  # Exactly once
+        assert_llm_called(mock_llm, min_times=1, max_times=5)  # Range
+    """
+    call_count = mock_llm.call_count
+    if times is not None:
+        assert call_count == times, (
+            f"Expected LLM to be called {times} time(s), "
+            f"but was called {call_count} time(s)"
+        )
+    else:
+        if min_times is None and max_times is None:
+            # Just check it was called at least once
+            assert call_count > 0, "Expected LLM to be called at least once"
+        if min_times is not None:
+            assert call_count >= min_times, (
+                f"Expected LLM to be called at least {min_times} time(s), "
+                f"but was called {call_count} time(s)"
+            )
+        if max_times is not None:
+            assert call_count <= max_times, (
+                f"Expected LLM to be called at most {max_times} time(s), "
+                f"but was called {call_count} time(s)"
+            )
+def assert_llm_prompt_contains(
+    mock_llm: MockLLMProvider,
+    text: str,
+    call_index: int = -1,
+) -> None:
+    """
+    Assert that an LLM prompt contains specific text.
+    Args:
+        mock_llm: MockLLMProvider instance
+        text: Text that should be in the prompt
+        call_index: Which call to check (-1 = last call, 0 = first call)
+    Raises:
+        AssertionError: If text not found in prompt
+    Example:
+        assert_llm_prompt_contains(mock_llm, "customer")
+        assert_llm_prompt_contains(mock_llm, "search", call_index=0)
+    """
+    assert mock_llm.call_history, "LLM was never called"
+    call = mock_llm.call_history[call_index]
+    prompt = call.get("prompt", "")
+    assert (
+        text in prompt
+    ), f"Expected prompt to contain '{text}', but prompt was:\n{prompt[:500]}"
+def assert_vlm_called(
+    mock_vlm: MockVLMClient,
+    times: Optional[int] = None,
+) -> None:
+    """
+    Assert that the mock VLM was called.
+    Args:
+        mock_vlm: MockVLMClient instance
+        times: Exact number of expected calls (optional)
+    Raises:
+        AssertionError: If call count doesn't match
+    Example:
+        assert_vlm_called(mock_vlm)  # At least once
+        assert_vlm_called(mock_vlm, times=2)  # Exactly twice
+    """
+    call_count = mock_vlm.call_count
+    if times is not None:
+        assert call_count == times, (
+            f"Expected VLM to be called {times} time(s), "
+            f"but was called {call_count} time(s)"
+        )
+    else:
+        assert call_count > 0, "Expected VLM to be called at least once"
+def assert_tool_called(
+    executor: MockToolExecutor,
+    tool_name: str,
+    times: Optional[int] = None,
+) -> None:
+    """
+    Assert that a specific tool was called.
+    Args:
+        executor: MockToolExecutor instance
+        tool_name: Name of the tool
+        times: Exact number of expected calls (optional)
+    Raises:
+        AssertionError: If tool wasn't called or count doesn't match
+    Example:
+        from gaia.testing import MockToolExecutor, assert_tool_called
+        executor = MockToolExecutor()
+        executor.execute("search", {"query": "test"})
+        assert_tool_called(executor, "search")
+        assert_tool_called(executor, "search", times=1)
+    """
+    calls = executor.get_tool_calls(tool_name)
+    if times is not None:
+        assert len(calls) == times, (
+            f"Expected tool '{tool_name}' to be called {times} time(s), "
+            f"but was called {len(calls)} time(s)"
+        )
+    else:
+        assert len(calls) > 0, (
+            f"Expected tool '{tool_name}' to be called, but it was never called. "
+            f"Tools called: {executor.tool_names_called}"
+        )
+def assert_tool_args(
+    executor: MockToolExecutor,
+    tool_name: str,
+    expected_args: Dict[str, Any],
+    call_index: int = 0,
+) -> None:
+    """
+    Assert that a tool was called with specific arguments.
+    Args:
+        executor: MockToolExecutor instance
+        tool_name: Name of the tool
+        expected_args: Expected arguments (subset matching)
+        call_index: Which call to check (0 = first call)
+    Raises:
+        AssertionError: If arguments don't match
+    Example:
+        executor.execute("search", {"query": "test", "limit": 10})
+        assert_tool_args(executor, "search", {"query": "test"})
+    """
+    actual_args = executor.get_tool_args(tool_name, call_index)
+    assert (
+        actual_args is not None
+    ), f"Tool '{tool_name}' was not called (or call_index {call_index} out of range)"
+    for key, expected_value in expected_args.items():
+        assert key in actual_args, (
+            f"Expected argument '{key}' not found in tool call. "
+            f"Actual args: {actual_args}"
+        )
+        assert actual_args[key] == expected_value, (
+            f"Argument '{key}' mismatch. "
+            f"Expected: {expected_value}, Actual: {actual_args[key]}"
+        )
+def assert_result_has_keys(
+    result: Dict[str, Any],
+    keys: List[str],
+) -> None:
+    """
+    Assert that a result dictionary has specific keys.
+    Args:
+        result: Result dictionary to check
+        keys: List of required keys
+    Raises:
+        AssertionError: If any key is missing
+    Example:
+        result = agent.process_query("test")
+        assert_result_has_keys(result, ["answer", "steps_taken"])
+    """
+    assert isinstance(
+        result, dict
+    ), f"Expected result to be dict, got {type(result).__name__}"
+    missing_keys = [key for key in keys if key not in result]
+    if missing_keys:
+        raise AssertionError(
+            f"Result missing required keys: {missing_keys}. "
+            f"Available keys: {list(result.keys())}"
+        )
+def assert_result_value(
+    result: Dict[str, Any],
+    key: str,
+    expected: Any,
+) -> None:
+    """
+    Assert that a result has a specific value for a key.
+    Args:
+        result: Result dictionary
+        key: Key to check
+        expected: Expected value
+    Raises:
+        AssertionError: If value doesn't match
+    Example:
+        assert_result_value(result, "status", "success")
+    """
+    assert key in result, f"Key '{key}' not found in result: {list(result.keys())}"
+    actual = result[key]
+    assert (
+        actual == expected
+    ), f"Value mismatch for key '{key}'. Expected: {expected}, Actual: {actual}"
+def assert_agent_completed(
+    result: Union[Dict[str, Any], str],
+    has_answer: bool = True,
+) -> None:
+    """
+    Assert that an agent completed processing successfully.
+    Args:
+        result: Result from agent.process_query()
+        has_answer: Whether to check for an 'answer' key
+    Raises:
+        AssertionError: If agent didn't complete properly
+    Example:
+        result = agent.process_query("test")
+        assert_agent_completed(result)
+    """
+    # Handle string results (some agents return strings directly)
+    if isinstance(result, str):
+        assert len(result) > 0, "Agent returned empty string"
+        return
+    assert isinstance(
+        result, dict
+    ), f"Expected result to be dict or str, got {type(result).__name__}"
+    # Check for error indicators
+    if "error" in result and result["error"]:
+        raise AssertionError(f"Agent returned error: {result['error']}")
+    if "status" in result and result["status"] == "error":
+        error_msg = result.get("message", result.get("error", "Unknown error"))
+        raise AssertionError(f"Agent returned error status: {error_msg}")
+    # Check for answer if required
+    if has_answer:
+        assert "answer" in result or "response" in result or "result" in result, (
+            "Agent result missing answer/response/result key. "
+            f"Keys present: {list(result.keys())}"
+        )
+def assert_no_errors(result: Dict[str, Any]) -> None:
+    """
+    Assert that a result contains no errors.
+    Args:
+        result: Result dictionary
+    Raises:
+        AssertionError: If result contains error indicators
+    Example:
+        result = agent.process_query("test")
+        assert_no_errors(result)
+    """
+    if not isinstance(result, dict):
+        return  # Non-dict results don't have error keys
+    # Check various error patterns
+    if "error" in result and result["error"]:
+        raise AssertionError(f"Result contains error: {result['error']}")
+    if "errors" in result and result["errors"]:
+        raise AssertionError(f"Result contains errors: {result['errors']}")
+    if result.get("status") == "error":
+        msg = result.get("message", result.get("error", "Unknown"))
+        raise AssertionError(f"Result has error status: {msg}")
+    if result.get("success") is False:
+        msg = result.get("message", result.get("error", "Unknown"))
+        raise AssertionError(f"Result indicates failure: {msg}")

amd-gaia 0.15.0__py3-none-any.whl → 0.15.2__py3-none-any.whl

amd-gaia 0.15.0py3-none-any.whl → 0.15.2py3-none-any.whl