PyPI - massgen - Versions diffs - 0.0.3__py3-none-any.whl → 0.1.0__py3-none-any.whl - Mend

massgen 0.0.3py3-none-any.whl → 0.1.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of massgen might be problematic. Click here for more details.

Files changed (268) hide show

massgen/__init__.py +142 -8
massgen/adapters/__init__.py +29 -0
massgen/adapters/ag2_adapter.py +483 -0
massgen/adapters/base.py +183 -0
massgen/adapters/tests/__init__.py +0 -0
massgen/adapters/tests/test_ag2_adapter.py +439 -0
massgen/adapters/tests/test_agent_adapter.py +128 -0
massgen/adapters/utils/__init__.py +2 -0
massgen/adapters/utils/ag2_utils.py +236 -0
massgen/adapters/utils/tests/__init__.py +0 -0
massgen/adapters/utils/tests/test_ag2_utils.py +138 -0
massgen/agent_config.py +329 -55
massgen/api_params_handler/__init__.py +10 -0
massgen/api_params_handler/_api_params_handler_base.py +99 -0
massgen/api_params_handler/_chat_completions_api_params_handler.py +176 -0
massgen/api_params_handler/_claude_api_params_handler.py +113 -0
massgen/api_params_handler/_response_api_params_handler.py +130 -0
massgen/backend/__init__.py +39 -4
massgen/backend/azure_openai.py +385 -0
massgen/backend/base.py +341 -69
massgen/backend/base_with_mcp.py +1102 -0
massgen/backend/capabilities.py +386 -0
massgen/backend/chat_completions.py +577 -130
massgen/backend/claude.py +1033 -537
massgen/backend/claude_code.py +1203 -0
massgen/backend/cli_base.py +209 -0
massgen/backend/docs/BACKEND_ARCHITECTURE.md +126 -0
massgen/backend/{CLAUDE_API_RESEARCH.md → docs/CLAUDE_API_RESEARCH.md} +18 -18
massgen/backend/{GEMINI_API_DOCUMENTATION.md → docs/GEMINI_API_DOCUMENTATION.md} +9 -9
massgen/backend/docs/Gemini MCP Integration Analysis.md +1050 -0
massgen/backend/docs/MCP_IMPLEMENTATION_CLAUDE_BACKEND.md +177 -0
massgen/backend/docs/MCP_INTEGRATION_RESPONSE_BACKEND.md +352 -0
massgen/backend/docs/OPENAI_GPT5_MODELS.md +211 -0
massgen/backend/{OPENAI_RESPONSES_API_FORMAT.md → docs/OPENAI_RESPONSE_API_TOOL_CALLS.md} +3 -3
massgen/backend/docs/OPENAI_response_streaming.md +20654 -0
massgen/backend/docs/inference_backend.md +257 -0
massgen/backend/docs/permissions_and_context_files.md +1085 -0
massgen/backend/external.py +126 -0
massgen/backend/gemini.py +1850 -241
massgen/backend/grok.py +40 -156
massgen/backend/inference.py +156 -0
massgen/backend/lmstudio.py +171 -0
massgen/backend/response.py +1095 -322
massgen/chat_agent.py +131 -113
massgen/cli.py +1560 -275
massgen/config_builder.py +2396 -0
massgen/configs/BACKEND_CONFIGURATION.md +458 -0
massgen/configs/README.md +559 -216
massgen/configs/ag2/ag2_case_study.yaml +27 -0
massgen/configs/ag2/ag2_coder.yaml +34 -0
massgen/configs/ag2/ag2_coder_case_study.yaml +36 -0
massgen/configs/ag2/ag2_gemini.yaml +27 -0
massgen/configs/ag2/ag2_groupchat.yaml +108 -0
massgen/configs/ag2/ag2_groupchat_gpt.yaml +118 -0
massgen/configs/ag2/ag2_single_agent.yaml +21 -0
massgen/configs/basic/multi/fast_timeout_example.yaml +37 -0
massgen/configs/basic/multi/gemini_4o_claude.yaml +31 -0
massgen/configs/basic/multi/gemini_gpt5nano_claude.yaml +36 -0
massgen/configs/{gemini_4o_claude.yaml → basic/multi/geminicode_4o_claude.yaml} +3 -3
massgen/configs/basic/multi/geminicode_gpt5nano_claude.yaml +36 -0
massgen/configs/basic/multi/glm_gemini_claude.yaml +25 -0
massgen/configs/basic/multi/gpt4o_audio_generation.yaml +30 -0
massgen/configs/basic/multi/gpt4o_image_generation.yaml +31 -0
massgen/configs/basic/multi/gpt5nano_glm_qwen.yaml +26 -0
massgen/configs/basic/multi/gpt5nano_image_understanding.yaml +26 -0
massgen/configs/{three_agents_default.yaml → basic/multi/three_agents_default.yaml} +8 -4
massgen/configs/basic/multi/three_agents_opensource.yaml +27 -0
massgen/configs/basic/multi/three_agents_vllm.yaml +20 -0
massgen/configs/basic/multi/two_agents_gemini.yaml +19 -0
massgen/configs/{two_agents.yaml → basic/multi/two_agents_gpt5.yaml} +14 -6
massgen/configs/basic/multi/two_agents_opensource_lmstudio.yaml +31 -0
massgen/configs/basic/multi/two_qwen_vllm_sglang.yaml +28 -0
massgen/configs/{single_agent.yaml → basic/single/single_agent.yaml} +1 -1
massgen/configs/{single_flash2.5.yaml → basic/single/single_flash2.5.yaml} +1 -2
massgen/configs/basic/single/single_gemini2.5pro.yaml +16 -0
massgen/configs/basic/single/single_gpt4o_audio_generation.yaml +22 -0
massgen/configs/basic/single/single_gpt4o_image_generation.yaml +22 -0
massgen/configs/basic/single/single_gpt4o_video_generation.yaml +24 -0
massgen/configs/basic/single/single_gpt5nano.yaml +20 -0
massgen/configs/basic/single/single_gpt5nano_file_search.yaml +18 -0
massgen/configs/basic/single/single_gpt5nano_image_understanding.yaml +17 -0
massgen/configs/basic/single/single_gptoss120b.yaml +15 -0
massgen/configs/basic/single/single_openrouter_audio_understanding.yaml +15 -0
massgen/configs/basic/single/single_qwen_video_understanding.yaml +15 -0
massgen/configs/debug/code_execution/command_filtering_blacklist.yaml +29 -0
massgen/configs/debug/code_execution/command_filtering_whitelist.yaml +28 -0
massgen/configs/debug/code_execution/docker_verification.yaml +29 -0
massgen/configs/debug/skip_coordination_test.yaml +27 -0
massgen/configs/debug/test_sdk_migration.yaml +17 -0
massgen/configs/docs/DISCORD_MCP_SETUP.md +208 -0
massgen/configs/docs/TWITTER_MCP_ENESCINAR_SETUP.md +82 -0
massgen/configs/providers/azure/azure_openai_multi.yaml +21 -0
massgen/configs/providers/azure/azure_openai_single.yaml +19 -0
massgen/configs/providers/claude/claude.yaml +14 -0
massgen/configs/providers/gemini/gemini_gpt5nano.yaml +28 -0
massgen/configs/providers/local/lmstudio.yaml +11 -0
massgen/configs/providers/openai/gpt5.yaml +46 -0
massgen/configs/providers/openai/gpt5_nano.yaml +46 -0
massgen/configs/providers/others/grok_single_agent.yaml +19 -0
massgen/configs/providers/others/zai_coding_team.yaml +108 -0
massgen/configs/providers/others/zai_glm45.yaml +12 -0
massgen/configs/{creative_team.yaml → teams/creative/creative_team.yaml} +16 -6
massgen/configs/{travel_planning.yaml → teams/creative/travel_planning.yaml} +16 -6
massgen/configs/{news_analysis.yaml → teams/research/news_analysis.yaml} +16 -6
massgen/configs/{research_team.yaml → teams/research/research_team.yaml} +15 -7
massgen/configs/{technical_analysis.yaml → teams/research/technical_analysis.yaml} +16 -6
massgen/configs/tools/code-execution/basic_command_execution.yaml +25 -0
massgen/configs/tools/code-execution/code_execution_use_case_simple.yaml +41 -0
massgen/configs/tools/code-execution/docker_claude_code.yaml +32 -0
massgen/configs/tools/code-execution/docker_multi_agent.yaml +32 -0
massgen/configs/tools/code-execution/docker_simple.yaml +29 -0
massgen/configs/tools/code-execution/docker_with_resource_limits.yaml +32 -0
massgen/configs/tools/code-execution/multi_agent_playwright_automation.yaml +57 -0
massgen/configs/tools/filesystem/cc_gpt5_gemini_filesystem.yaml +34 -0
massgen/configs/tools/filesystem/claude_code_context_sharing.yaml +68 -0
massgen/configs/tools/filesystem/claude_code_flash2.5.yaml +43 -0
massgen/configs/tools/filesystem/claude_code_flash2.5_gptoss.yaml +49 -0
massgen/configs/tools/filesystem/claude_code_gpt5nano.yaml +31 -0
massgen/configs/tools/filesystem/claude_code_single.yaml +40 -0
massgen/configs/tools/filesystem/fs_permissions_test.yaml +87 -0
massgen/configs/tools/filesystem/gemini_gemini_workspace_cleanup.yaml +54 -0
massgen/configs/tools/filesystem/gemini_gpt5_filesystem_casestudy.yaml +30 -0
massgen/configs/tools/filesystem/gemini_gpt5nano_file_context_path.yaml +43 -0
massgen/configs/tools/filesystem/gemini_gpt5nano_protected_paths.yaml +45 -0
massgen/configs/tools/filesystem/gpt5mini_cc_fs_context_path.yaml +31 -0
massgen/configs/tools/filesystem/grok4_gpt5_gemini_filesystem.yaml +32 -0
massgen/configs/tools/filesystem/multiturn/grok4_gpt5_claude_code_filesystem_multiturn.yaml +58 -0
massgen/configs/tools/filesystem/multiturn/grok4_gpt5_gemini_filesystem_multiturn.yaml +58 -0
massgen/configs/tools/filesystem/multiturn/two_claude_code_filesystem_multiturn.yaml +47 -0
massgen/configs/tools/filesystem/multiturn/two_gemini_flash_filesystem_multiturn.yaml +48 -0
massgen/configs/tools/mcp/claude_code_discord_mcp_example.yaml +27 -0
massgen/configs/tools/mcp/claude_code_simple_mcp.yaml +35 -0
massgen/configs/tools/mcp/claude_code_twitter_mcp_example.yaml +32 -0
massgen/configs/tools/mcp/claude_mcp_example.yaml +24 -0
massgen/configs/tools/mcp/claude_mcp_test.yaml +27 -0
massgen/configs/tools/mcp/five_agents_travel_mcp_test.yaml +157 -0
massgen/configs/tools/mcp/five_agents_weather_mcp_test.yaml +103 -0
massgen/configs/tools/mcp/gemini_mcp_example.yaml +24 -0
massgen/configs/tools/mcp/gemini_mcp_filesystem_test.yaml +23 -0
massgen/configs/tools/mcp/gemini_mcp_filesystem_test_sharing.yaml +23 -0
massgen/configs/tools/mcp/gemini_mcp_filesystem_test_single_agent.yaml +17 -0
massgen/configs/tools/mcp/gemini_mcp_filesystem_test_with_claude_code.yaml +24 -0
massgen/configs/tools/mcp/gemini_mcp_test.yaml +27 -0
massgen/configs/tools/mcp/gemini_notion_mcp.yaml +52 -0
massgen/configs/tools/mcp/gpt5_nano_mcp_example.yaml +24 -0
massgen/configs/tools/mcp/gpt5_nano_mcp_test.yaml +27 -0
massgen/configs/tools/mcp/gpt5mini_claude_code_discord_mcp_example.yaml +38 -0
massgen/configs/tools/mcp/gpt_oss_mcp_example.yaml +25 -0
massgen/configs/tools/mcp/gpt_oss_mcp_test.yaml +28 -0
massgen/configs/tools/mcp/grok3_mini_mcp_example.yaml +24 -0
massgen/configs/tools/mcp/grok3_mini_mcp_test.yaml +27 -0
massgen/configs/tools/mcp/multimcp_gemini.yaml +111 -0
massgen/configs/tools/mcp/qwen_api_mcp_example.yaml +25 -0
massgen/configs/tools/mcp/qwen_api_mcp_test.yaml +28 -0
massgen/configs/tools/mcp/qwen_local_mcp_example.yaml +24 -0
massgen/configs/tools/mcp/qwen_local_mcp_test.yaml +27 -0
massgen/configs/tools/planning/five_agents_discord_mcp_planning_mode.yaml +140 -0
massgen/configs/tools/planning/five_agents_filesystem_mcp_planning_mode.yaml +151 -0
massgen/configs/tools/planning/five_agents_notion_mcp_planning_mode.yaml +151 -0
massgen/configs/tools/planning/five_agents_twitter_mcp_planning_mode.yaml +155 -0
massgen/configs/tools/planning/gpt5_mini_case_study_mcp_planning_mode.yaml +73 -0
massgen/configs/tools/web-search/claude_streamable_http_test.yaml +43 -0
massgen/configs/tools/web-search/gemini_streamable_http_test.yaml +43 -0
massgen/configs/tools/web-search/gpt5_mini_streamable_http_test.yaml +43 -0
massgen/configs/tools/web-search/gpt_oss_streamable_http_test.yaml +44 -0
massgen/configs/tools/web-search/grok3_mini_streamable_http_test.yaml +43 -0
massgen/configs/tools/web-search/qwen_api_streamable_http_test.yaml +44 -0
massgen/configs/tools/web-search/qwen_local_streamable_http_test.yaml +43 -0
massgen/coordination_tracker.py +708 -0
massgen/docker/README.md +462 -0
massgen/filesystem_manager/__init__.py +21 -0
massgen/filesystem_manager/_base.py +9 -0
massgen/filesystem_manager/_code_execution_server.py +545 -0
massgen/filesystem_manager/_docker_manager.py +477 -0
massgen/filesystem_manager/_file_operation_tracker.py +248 -0
massgen/filesystem_manager/_filesystem_manager.py +813 -0
massgen/filesystem_manager/_path_permission_manager.py +1261 -0
massgen/filesystem_manager/_workspace_tools_server.py +1815 -0
massgen/formatter/__init__.py +10 -0
massgen/formatter/_chat_completions_formatter.py +284 -0
massgen/formatter/_claude_formatter.py +235 -0
massgen/formatter/_formatter_base.py +156 -0
massgen/formatter/_response_formatter.py +263 -0
massgen/frontend/__init__.py +1 -2
massgen/frontend/coordination_ui.py +471 -286
massgen/frontend/displays/base_display.py +56 -11
massgen/frontend/displays/create_coordination_table.py +1956 -0
massgen/frontend/displays/rich_terminal_display.py +1259 -619
massgen/frontend/displays/simple_display.py +9 -4
massgen/frontend/displays/terminal_display.py +27 -68
massgen/logger_config.py +681 -0
massgen/mcp_tools/README.md +232 -0
massgen/mcp_tools/__init__.py +105 -0
massgen/mcp_tools/backend_utils.py +1035 -0
massgen/mcp_tools/circuit_breaker.py +195 -0
massgen/mcp_tools/client.py +894 -0
massgen/mcp_tools/config_validator.py +138 -0
massgen/mcp_tools/docs/circuit_breaker.md +646 -0
massgen/mcp_tools/docs/client.md +950 -0
massgen/mcp_tools/docs/config_validator.md +478 -0
massgen/mcp_tools/docs/exceptions.md +1165 -0
massgen/mcp_tools/docs/security.md +854 -0
massgen/mcp_tools/exceptions.py +338 -0
massgen/mcp_tools/hooks.py +212 -0
massgen/mcp_tools/security.py +780 -0
massgen/message_templates.py +342 -64
massgen/orchestrator.py +1515 -241
massgen/stream_chunk/__init__.py +35 -0
massgen/stream_chunk/base.py +92 -0
massgen/stream_chunk/multimodal.py +237 -0
massgen/stream_chunk/text.py +162 -0
massgen/tests/mcp_test_server.py +150 -0
massgen/tests/multi_turn_conversation_design.md +0 -8
massgen/tests/test_azure_openai_backend.py +156 -0
massgen/tests/test_backend_capabilities.py +262 -0
massgen/tests/test_backend_event_loop_all.py +179 -0
massgen/tests/test_chat_completions_refactor.py +142 -0
massgen/tests/test_claude_backend.py +15 -28
massgen/tests/test_claude_code.py +268 -0
massgen/tests/test_claude_code_context_sharing.py +233 -0
massgen/tests/test_claude_code_orchestrator.py +175 -0
massgen/tests/test_cli_backends.py +180 -0
massgen/tests/test_code_execution.py +679 -0
massgen/tests/test_external_agent_backend.py +134 -0
massgen/tests/test_final_presentation_fallback.py +237 -0
massgen/tests/test_gemini_planning_mode.py +351 -0
massgen/tests/test_grok_backend.py +7 -10
massgen/tests/test_http_mcp_server.py +42 -0
massgen/tests/test_integration_simple.py +198 -0
massgen/tests/test_mcp_blocking.py +125 -0
massgen/tests/test_message_context_building.py +29 -47
massgen/tests/test_orchestrator_final_presentation.py +48 -0
massgen/tests/test_path_permission_manager.py +2087 -0
massgen/tests/test_rich_terminal_display.py +14 -13
massgen/tests/test_timeout.py +133 -0
massgen/tests/test_v3_3agents.py +11 -12
massgen/tests/test_v3_simple.py +8 -13
massgen/tests/test_v3_three_agents.py +11 -18
massgen/tests/test_v3_two_agents.py +8 -13
massgen/token_manager/__init__.py +7 -0
massgen/token_manager/token_manager.py +400 -0
massgen/utils.py +52 -16
massgen/v1/agent.py +45 -91
massgen/v1/agents.py +18 -53
massgen/v1/backends/gemini.py +50 -153
massgen/v1/backends/grok.py +21 -54
massgen/v1/backends/oai.py +39 -111
massgen/v1/cli.py +36 -93
massgen/v1/config.py +8 -12
massgen/v1/logging.py +43 -127
massgen/v1/main.py +18 -32
massgen/v1/orchestrator.py +68 -209
massgen/v1/streaming_display.py +62 -163
massgen/v1/tools.py +8 -12
massgen/v1/types.py +9 -23
massgen/v1/utils.py +5 -23
massgen-0.1.0.dist-info/METADATA +1245 -0
massgen-0.1.0.dist-info/RECORD +273 -0
massgen-0.1.0.dist-info/entry_points.txt +2 -0
massgen/frontend/logging/__init__.py +0 -9
massgen/frontend/logging/realtime_logger.py +0 -197
massgen-0.0.3.dist-info/METADATA +0 -568
massgen-0.0.3.dist-info/RECORD +0 -76
massgen-0.0.3.dist-info/entry_points.txt +0 -2
/massgen/backend/{Function calling openai responses.md → docs/Function calling openai responses.md} +0 -0
{massgen-0.0.3.dist-info → massgen-0.1.0.dist-info}/WHEEL +0 -0
{massgen-0.0.3.dist-info → massgen-0.1.0.dist-info}/licenses/LICENSE +0 -0
{massgen-0.0.3.dist-info → massgen-0.1.0.dist-info}/top_level.txt +0 -0

massgen/backend/chat_completions.py CHANGED Viewed

@@ -1,67 +1,411 @@
-from __future__ import annotations
+# -*- coding: utf-8 -*-
 """
 Base class for backends using OpenAI Chat Completions API format.
 Handles common message processing, tool conversion, and streaming patterns.
+Supported Providers and Environment Variables:
+- OpenAI: OPENAI_API_KEY
+- Cerebras AI: CEREBRAS_API_KEY
+- Together AI: TOGETHER_API_KEY
+- Fireworks AI: FIREWORKS_API_KEY
+- Groq: GROQ_API_KEY
+- Kimi/Moonshot: MOONSHOT_API_KEY or KIMI_API_KEY
+- Nebius AI Studio: NEBIUS_API_KEY
+- OpenRouter: OPENROUTER_API_KEY
+- ZAI: ZAI_API_KEY
+- POE: POE_API_KEY
+- Qwen: QWEN_API_KEY
 """
-import os
-from typing import Dict, List, Any, AsyncGenerator, Optional
-from .base import LLMBackend, StreamChunk
+from __future__ import annotations
+# Standard library imports
+from typing import Any, AsyncGenerator, Dict, List, Optional
+# Third-party imports
+from openai import AsyncOpenAI
+from ..api_params_handler import ChatCompletionsAPIParamsHandler
+from ..formatter import ChatCompletionsFormatter
+from ..logger_config import log_backend_agent_message, log_stream_chunk, logger
+# Local imports
+from .base import FilesystemSupport, StreamChunk
+from .base_with_mcp import MCPBackend
+class ChatCompletionsBackend(MCPBackend):
+    """Complete OpenAI-compatible Chat Completions API backend.
-class ChatCompletionsBackend(LLMBackend):
-    """Base class for backends using Chat Completions API with shared streaming logic."""
+    Can be used directly with any OpenAI-compatible provider by setting provider name.
+    Supports Cerebras AI, Together AI, Fireworks AI, DeepInfra, and other compatible providers.
+    Environment Variables:
+        Provider-specific API keys are automatically detected based on provider name.
+        See ProviderRegistry.PROVIDERS for the complete list.
+    """
     def __init__(self, api_key: Optional[str] = None, **kwargs):
         super().__init__(api_key, **kwargs)
+        # Backend name is already set in MCPBackend, but we may need to override it
+        self.backend_name = self.get_provider_name()
+        self.formatter = ChatCompletionsFormatter()
+        self.api_params_handler = ChatCompletionsAPIParamsHandler(self)
+    def supports_upload_files(self) -> bool:
+        """Chat Completions backend supports upload_files preprocessing."""
+        return True
+    async def stream_with_tools(
+        self,
+        messages: List[Dict[str, Any]],
+        tools: List[Dict[str, Any]],
+        **kwargs,
+    ) -> AsyncGenerator[StreamChunk, None]:
+        """Stream response using OpenAI Response API with unified MCP/non-MCP processing."""
+        async for chunk in super().stream_with_tools(messages, tools, **kwargs):
+            yield chunk
+    async def _stream_with_mcp_tools(
+        self,
+        current_messages: List[Dict[str, Any]],
+        tools: List[Dict[str, Any]],
+        client,
+        **kwargs,
+    ) -> AsyncGenerator[StreamChunk, None]:
+        """Recursively stream MCP responses, executing function calls as needed."""
+        # Build API params for this iteration
+        all_params = {**self.config, **kwargs}
+        api_params = await self.api_params_handler.build_api_params(current_messages, tools, all_params)
+        # Add provider tools (web search, code interpreter) if enabled
+        provider_tools = self.api_params_handler.get_provider_tools(all_params)
+        if provider_tools:
+            if "tools" not in api_params:
+                api_params["tools"] = []
+            api_params["tools"].extend(provider_tools)
+        # Start streaming
+        stream = await client.chat.completions.create(**api_params)
+        # Track function calls in this iteration
+        captured_function_calls = []
+        current_tool_calls = {}
+        response_completed = False
+        content = ""
+        async for chunk in stream:
+            try:
+                if hasattr(chunk, "choices") and chunk.choices:
+                    choice = chunk.choices[0]
+                    # Handle content delta
+                    if hasattr(choice, "delta") and choice.delta:
+                        delta = choice.delta
+                        # Plain text content
+                        if getattr(delta, "content", None):
+                            content_chunk = delta.content
+                            content += content_chunk
+                            yield StreamChunk(type="content", content=content_chunk)
+                        # Tool calls streaming (OpenAI-style)
+                        if getattr(delta, "tool_calls", None):
+                            for tool_call_delta in delta.tool_calls:
+                                index = getattr(tool_call_delta, "index", 0)
+                                if index not in current_tool_calls:
+                                    current_tool_calls[index] = {
+                                        "id": "",
+                                        "function": {
+                                            "name": "",
+                                            "arguments": "",
+                                        },
+                                    }
+                                # Accumulate id
+                                if getattr(tool_call_delta, "id", None):
+                                    current_tool_calls[index]["id"] = tool_call_delta.id
+                                # Function name
+                                if hasattr(tool_call_delta, "function") and tool_call_delta.function:
+                                    if getattr(tool_call_delta.function, "name", None):
+                                        current_tool_calls[index]["function"]["name"] = tool_call_delta.function.name
+                                    # Accumulate arguments (as string chunks)
+                                    if getattr(tool_call_delta.function, "arguments", None):
+                                        current_tool_calls[index]["function"]["arguments"] += tool_call_delta.function.arguments
+                    # Handle finish reason
+                    if getattr(choice, "finish_reason", None):
+                        if choice.finish_reason == "tool_calls" and current_tool_calls:
+                            final_tool_calls = []
+                            for index in sorted(current_tool_calls.keys()):
+                                call = current_tool_calls[index]
+                                function_name = call["function"]["name"]
+                                arguments_str = call["function"]["arguments"]
+                                # Providers expect arguments to be a JSON string
+                                arguments_str_sanitized = arguments_str if arguments_str.strip() else "{}"
+                                final_tool_calls.append(
+                                    {
+                                        "id": call["id"],
+                                        "type": "function",
+                                        "function": {
+                                            "name": function_name,
+                                            "arguments": arguments_str_sanitized,
+                                        },
+                                    },
+                                )
+                            # Convert to captured format for processing (ensure arguments is a JSON string)
+                            for tool_call in final_tool_calls:
+                                args_value = tool_call["function"]["arguments"]
+                                if not isinstance(args_value, str):
+                                    args_value = self.formatter._serialize_tool_arguments(args_value)
+                                captured_function_calls.append(
+                                    {
+                                        "call_id": tool_call["id"],
+                                        "name": tool_call["function"]["name"],
+                                        "arguments": args_value,
+                                    },
+                                )
+                            yield StreamChunk(type="tool_calls", tool_calls=final_tool_calls)
+                            response_completed = True
+                            break  # Exit chunk loop to execute functions
+                        elif choice.finish_reason in ["stop", "length"]:
+                            response_completed = True
+                            # No function calls, we're done (base case)
+                            yield StreamChunk(type="done")
+                            return
+            except Exception as chunk_error:
+                yield StreamChunk(type="error", error=f"Chunk processing error: {chunk_error}")
+                continue
-    def convert_tools_to_chat_completions_format(
-        self, tools: List[Dict[str, Any]]
-    ) -> List[Dict[str, Any]]:
-        """Convert tools from Response API format to Chat Completions format if needed.
-        Response API format: {"type": "function", "name": ..., "description": ..., "parameters": ...}
-        Chat Completions format: {"type": "function", "function": {"name": ..., "description": ..., "parameters": ...}}
-        """
-        if not tools:
-            return tools
-        converted_tools = []
-        for tool in tools:
-            if tool.get("type") == "function":
-                if "function" in tool:
-                    # Already in Chat Completions format
-                    converted_tools.append(tool)
-                elif "name" in tool and "description" in tool:
-                    # Response API format - convert to Chat Completions format
-                    converted_tools.append(
+        # Execute any captured function calls
+        if captured_function_calls and response_completed:
+            # Check if any of the function calls are NOT MCP functions
+            non_mcp_functions = [call for call in captured_function_calls if call["name"] not in self._mcp_functions]
+            if non_mcp_functions:
+                logger.info(f"Non-MCP function calls detected (will be ignored in MCP execution): {[call['name'] for call in non_mcp_functions]}")
+            # Check circuit breaker status before executing MCP functions
+            if not await self._check_circuit_breaker_before_execution():
+                yield StreamChunk(
+                    type="mcp_status",
+                    status="mcp_blocked",
+                    content="⚠️ [MCP] All servers blocked by circuit breaker",
+                    source="circuit_breaker",
+                )
+                yield StreamChunk(type="done")
+                return
+            # Execute only MCP function calls
+            mcp_functions_executed = False
+            updated_messages = current_messages.copy()
+            # Check if planning mode is enabled - block MCP tool execution during planning
+            if self.is_planning_mode_enabled():
+                logger.info("[MCP] Planning mode enabled - blocking all MCP tool execution")
+                yield StreamChunk(
+                    type="mcp_status",
+                    status="planning_mode_blocked",
+                    content="🚫 [MCP] Planning mode active - MCP tools blocked during coordination",
+                    source="planning_mode",
+                )
+                # Skip all MCP tool execution but still continue with workflow
+                yield StreamChunk(type="done")
+                return
+            # Create single assistant message with all tool calls
+            if captured_function_calls:
+                # First add the assistant message with ALL tool_calls (both MCP and non-MCP)
+                all_tool_calls = []
+                for call in captured_function_calls:
+                    all_tool_calls.append(
                         {
+                            "id": call["call_id"],
                             "type": "function",
                             "function": {
-                                "name": tool["name"],
-                                "description": tool["description"],
-                                "parameters": tool.get("parameters", {}),
+                                "name": call["name"],
+                                "arguments": self.formatter._serialize_tool_arguments(call["arguments"]),
+                            },
+                        },
+                    )
+                # Add assistant message with all tool calls
+                if all_tool_calls:
+                    assistant_message = {
+                        "role": "assistant",
+                        "content": content.strip() if content.strip() else None,
+                        "tool_calls": all_tool_calls,
+                    }
+                    updated_messages.append(assistant_message)
+            # Execute functions and collect results
+            tool_results = []
+            for call in captured_function_calls:
+                function_name = call["name"]
+                if self.is_mcp_tool_call(function_name):
+                    yield StreamChunk(
+                        type="mcp_status",
+                        status="mcp_tool_called",
+                        content=f"🔧 [MCP Tool] Calling {function_name}...",
+                        source=f"mcp_{function_name}",
+                    )
+                    # Yield detailed MCP status as StreamChunk (similar to gemini.py)
+                    tools_info = f" ({len(self._mcp_functions)} tools available)" if self._mcp_functions else ""
+                    yield StreamChunk(
+                        type="mcp_status",
+                        status="mcp_tools_initiated",
+                        content=f"MCP tool call initiated (call #{self._mcp_tool_calls_count}){tools_info}: {function_name}",
+                        source=f"mcp_{function_name}",
+                    )
+                    try:
+                        # Execute MCP function with retry and exponential backoff
+                        (
+                            result_str,
+                            result_obj,
+                        ) = await self._execute_mcp_function_with_retry(function_name, call["arguments"])
+                        # Check if function failed after all retries
+                        if isinstance(result_str, str) and result_str.startswith("Error:"):
+                            # Log failure but still create tool response
+                            logger.warning(f"MCP function {function_name} failed after retries: {result_str}")
+                            tool_results.append(
+                                {
+                                    "tool_call_id": call["call_id"],
+                                    "content": result_str,
+                                    "success": False,
+                                },
+                            )
+                        else:
+                            # Yield MCP success status as StreamChunk (similar to gemini.py)
+                            yield StreamChunk(
+                                type="mcp_status",
+                                status="mcp_tools_success",
+                                content=f"MCP tool call succeeded (call #{self._mcp_tool_calls_count})",
+                                source=f"mcp_{function_name}",
+                            )
+                            tool_results.append(
+                                {
+                                    "tool_call_id": call["call_id"],
+                                    "content": result_str,
+                                    "success": True,
+                                    "result_obj": result_obj,
+                                },
+                            )
+                    except Exception as e:
+                        # Only catch unexpected non-MCP system errors
+                        logger.error(f"Unexpected error in MCP function execution: {e}")
+                        error_msg = f"Error executing {function_name}: {str(e)}"
+                        tool_results.append(
+                            {
+                                "tool_call_id": call["call_id"],
+                                "content": error_msg,
+                                "success": False,
                             },
-                        }
+                        )
+                        continue
+                    # Yield function_call status
+                    yield StreamChunk(
+                        type="mcp_status",
+                        status="function_call",
+                        content=f"Arguments for Calling {function_name}: {call['arguments']}",
+                        source=f"mcp_{function_name}",
                     )
+                    logger.info(f"Executed MCP function {function_name} (stdio/streamable-http)")
+                    mcp_functions_executed = True
                 else:
-                    # Unknown format - keep as-is
-                    converted_tools.append(tool)
+                    # For non-MCP functions, add a dummy tool result to maintain message consistency
+                    logger.info(f"Non-MCP function {function_name} detected, creating placeholder response")
+                    tool_results.append(
+                        {
+                            "tool_call_id": call["call_id"],
+                            "content": f"Function {function_name} is not available in this MCP session.",
+                            "success": False,
+                        },
+                    )
+            # Add all tool response messages after the assistant message
+            for result in tool_results:
+                # Yield function_call_output status with preview
+                result_text = str(result["content"])
+                if result.get("success") and hasattr(result.get("result_obj"), "content") and result["result_obj"].content:
+                    obj = result["result_obj"]
+                    if isinstance(obj.content, list) and len(obj.content) > 0:
+                        first_item = obj.content[0]
+                        if hasattr(first_item, "text"):
+                            result_text = first_item.text
+                yield StreamChunk(
+                    type="mcp_status",
+                    status="function_call_output",
+                    content=f"Results for Calling {function_name}: {result_text}",
+                    source=f"mcp_{function_name}",
+                )
+                function_output_msg = {
+                    "role": "tool",
+                    "tool_call_id": result["tool_call_id"],
+                    "content": result["content"],
+                }
+                updated_messages.append(function_output_msg)
+                yield StreamChunk(
+                    type="mcp_status",
+                    status="mcp_tool_response",
+                    content=f"✅ [MCP Tool] {function_name} completed",
+                    source=f"mcp_{function_name}",
+                )
+            # Trim history after function executions to bound memory usage
+            if mcp_functions_executed:
+                updated_messages = self._trim_message_history(updated_messages)
+                # Recursive call with updated messages
+                async for chunk in self._stream_with_mcp_tools(updated_messages, tools, client, **kwargs):
+                    yield chunk
             else:
-                # Non-function tool - keep as-is
-                converted_tools.append(tool)
+                # No MCP functions were executed, we're done
+                yield StreamChunk(type="done")
+                return
-        return converted_tools
+        elif response_completed:
+            # Response completed with no function calls - we're done (base case)
+            yield StreamChunk(
+                type="mcp_status",
+                status="mcp_session_complete",
+                content="✅ [MCP] Session completed",
+                source="mcp_session",
+            )
+            return
+    async def _process_stream(self, stream, all_params, agent_id) -> AsyncGenerator[StreamChunk, None]:
+        """Handle standard Chat Completions API streaming format with logging."""
-    async def handle_chat_completions_stream(
-        self, stream, enable_web_search: bool = False
-    ) -> AsyncGenerator[StreamChunk, None]:
-        """Handle standard Chat Completions API streaming format."""
         content = ""
         current_tool_calls = {}
         search_sources_used = 0
-        citations = []
+        provider_name = self.get_provider_name()
+        enable_web_search = all_params.get("enable_web_search", False)
+        log_prefix = f"backend.{provider_name.lower().replace(' ', '_')}"
         async for chunk in stream:
             try:
@@ -70,122 +414,135 @@ class ChatCompletionsBackend(LLMBackend):
                     # Handle content delta
                     if hasattr(choice, "delta") and choice.delta:
-                        if hasattr(choice.delta, "content") and choice.delta.content:
-                            content_chunk = choice.delta.content
+                        delta = choice.delta
+                        # Plain text content
+                        if getattr(delta, "content", None):
+                            # handle reasoning first
+                            reasoning_chunk = self._handle_reasoning_transition(log_prefix, agent_id)
+                            if reasoning_chunk:
+                                yield reasoning_chunk
+                            content_chunk = delta.content
                             content += content_chunk
+                            log_backend_agent_message(
+                                agent_id or "default",
+                                "RECV",
+                                {"content": content_chunk},
+                                backend_name=provider_name,
+                            )
+                            log_stream_chunk(log_prefix, "content", content_chunk, agent_id)
                             yield StreamChunk(type="content", content=content_chunk)
-                        # Handle tool calls streaming
-                        if (
-                            hasattr(choice.delta, "tool_calls")
-                            and choice.delta.tool_calls
-                        ):
-                            for tool_call_delta in choice.delta.tool_calls:
+                        # Provider-specific reasoning/thinking streams (non-standard OpenAI fields)
+                        if getattr(delta, "reasoning_content", None):
+                            reasoning_active_key = "_reasoning_active"
+                            setattr(self, reasoning_active_key, True)
+                            thinking_delta = getattr(delta, "reasoning_content")
+                            if thinking_delta:
+                                log_stream_chunk(log_prefix, "reasoning", thinking_delta, agent_id)
+                                yield StreamChunk(
+                                    type="reasoning",
+                                    content=thinking_delta,
+                                    reasoning_delta=thinking_delta,
+                                )
+                        # Tool calls streaming (OpenAI-style)
+                        if getattr(delta, "tool_calls", None):
+                            # handle reasoning first
+                            reasoning_chunk = self._handle_reasoning_transition(log_prefix, agent_id)
+                            if reasoning_chunk:
+                                yield reasoning_chunk
+                            for tool_call_delta in delta.tool_calls:
                                 index = getattr(tool_call_delta, "index", 0)
                                 if index not in current_tool_calls:
                                     current_tool_calls[index] = {
                                         "id": "",
-                                        "name": "",
-                                        "arguments": "",
+                                        "function": {
+                                            "name": "",
+                                            "arguments": "",
+                                        },
                                     }
-                                if (
-                                    hasattr(tool_call_delta, "id")
-                                    and tool_call_delta.id
-                                ):
+                                # Accumulate id
+                                if getattr(tool_call_delta, "id", None):
                                     current_tool_calls[index]["id"] = tool_call_delta.id
-                                if (
-                                    hasattr(tool_call_delta, "function")
-                                    and tool_call_delta.function
-                                ):
-                                    if (
-                                        hasattr(tool_call_delta.function, "name")
-                                        and tool_call_delta.function.name
-                                    ):
-                                        current_tool_calls[index][
-                                            "name"
-                                        ] = tool_call_delta.function.name
-                                    if (
-                                        hasattr(tool_call_delta.function, "arguments")
-                                        and tool_call_delta.function.arguments
-                                    ):
-                                        current_tool_calls[index][
-                                            "arguments"
-                                        ] += tool_call_delta.function.arguments
+                                # Function name
+                                if hasattr(tool_call_delta, "function") and tool_call_delta.function:
+                                    if getattr(tool_call_delta.function, "name", None):
+                                        current_tool_calls[index]["function"]["name"] = tool_call_delta.function.name
+                                    # Accumulate arguments (as string chunks)
+                                    if getattr(tool_call_delta.function, "arguments", None):
+                                        current_tool_calls[index]["function"]["arguments"] += tool_call_delta.function.arguments
                     # Handle finish reason
-                    if hasattr(choice, "finish_reason") and choice.finish_reason:
+                    if getattr(choice, "finish_reason", None):
+                        # handle reasoning first
+                        reasoning_chunk = self._handle_reasoning_transition(log_prefix, agent_id)
+                        if reasoning_chunk:
+                            yield reasoning_chunk
                         if choice.finish_reason == "tool_calls" and current_tool_calls:
-                            # Convert accumulated tool calls to final format
                             final_tool_calls = []
                             for index in sorted(current_tool_calls.keys()):
-                                tool_call = current_tool_calls[index]
-                                # Parse arguments as JSON
-                                arguments = tool_call["arguments"]
-                                if isinstance(arguments, str):
-                                    try:
-                                        import json
-                                        arguments = (
-                                            json.loads(arguments)
-                                            if arguments.strip()
-                                            else {}
-                                        )
-                                    except json.JSONDecodeError:
-                                        arguments = {}
+                                call = current_tool_calls[index]
+                                function_name = call["function"]["name"]
+                                arguments_str = call["function"]["arguments"]
+                                # Providers expect arguments to be a JSON string
+                                arguments_str_sanitized = arguments_str if arguments_str.strip() else "{}"
                                 final_tool_calls.append(
                                     {
-                                        "id": tool_call["id"] or f"call_{index}",
+                                        "id": call["id"],
                                         "type": "function",
                                         "function": {
-                                            "name": tool_call["name"],
-                                            "arguments": arguments,
+                                            "name": function_name,
+                                            "arguments": arguments_str_sanitized,
                                         },
-                                    }
+                                    },
                                 )
-                            yield StreamChunk(
-                                type="tool_calls", tool_calls=final_tool_calls
-                            )
+                            log_stream_chunk(log_prefix, "tool_calls", final_tool_calls, agent_id)
+                            yield StreamChunk(type="tool_calls", tool_calls=final_tool_calls)
-                            # Build and yield complete message
                             complete_message = {
                                 "role": "assistant",
                                 "content": content.strip(),
+                                "tool_calls": final_tool_calls,
                             }
-                            if final_tool_calls:
-                                complete_message["tool_calls"] = final_tool_calls
                             yield StreamChunk(
                                 type="complete_message",
                                 complete_message=complete_message,
                             )
+                            log_stream_chunk(log_prefix, "done", None, agent_id)
+                            yield StreamChunk(type="done")
+                            return
                         elif choice.finish_reason in ["stop", "length"]:
                             if search_sources_used > 0:
+                                search_complete_msg = f"\n✅ [Live Search Complete] Used {search_sources_used} sources\n"
+                                log_stream_chunk(log_prefix, "content", search_complete_msg, agent_id)
                                 yield StreamChunk(
                                     type="content",
-                                    content=f"\n✅ [Live Search Complete] Used {search_sources_used} sources\n",
+                                    content=search_complete_msg,
                                 )
-                            # Check for citations before building complete message
-                            if (
-                                hasattr(chunk, "citations")
-                                and chunk.citations
-                                and len(chunk.citations) > 0
-                            ):
+                            # Handle citations if present
+                            if hasattr(chunk, "citations") and chunk.citations:
                                 if enable_web_search:
                                     citation_text = "\n📚 **Citations:**\n"
                                     for i, citation in enumerate(chunk.citations, 1):
                                         citation_text += f"{i}. {citation}\n"
-                                    yield StreamChunk(
-                                        type="content", content=citation_text
-                                    )
+                                    log_stream_chunk(log_prefix, "content", citation_text, agent_id)
+                                    yield StreamChunk(type="content", content=citation_text)
-                            # Build and yield complete message (no tool calls)
+                            # Return final message
                             complete_message = {
                                 "role": "assistant",
                                 "content": content.strip(),
@@ -194,35 +551,125 @@ class ChatCompletionsBackend(LLMBackend):
                                 type="complete_message",
                                 complete_message=complete_message,
                             )
+                            log_stream_chunk(log_prefix, "done", None, agent_id)
                             yield StreamChunk(type="done")
-                        return
+                            return
-                # Check for usage information (search sources) and citations
+                # Optionally handle usage metadata
                 if hasattr(chunk, "usage") and chunk.usage:
-                    if (
-                        hasattr(chunk.usage, "num_sources_used")
-                        and chunk.usage.num_sources_used
-                    ):
+                    if getattr(chunk.usage, "num_sources_used", 0) > 0:
                         search_sources_used = chunk.usage.num_sources_used
-                        if enable_web_search and search_sources_used > 0:
+                        if enable_web_search:
+                            search_msg = f"\n📊 [Live Search] Using {search_sources_used} sources for real-time data\n"
+                            log_stream_chunk(log_prefix, "content", search_msg, agent_id)
                             yield StreamChunk(
                                 type="content",
-                                content=f"\n📊 [Live Search] Using {search_sources_used} sources for real-time data\n",
+                                content=search_msg,
                             )
             except Exception as chunk_error:
-                yield StreamChunk(
-                    type="error", error=f"Chunk processing error: {chunk_error}"
-                )
+                error_msg = f"Chunk processing error: {chunk_error}"
+                log_stream_chunk(log_prefix, "error", error_msg, agent_id)
+                yield StreamChunk(type="error", error=error_msg)
                 continue
+        # Fallback in case stream ends without finish_reason
+        log_stream_chunk(log_prefix, "done", None, agent_id)
         yield StreamChunk(type="done")
-    def extract_tool_name(self, tool_call: Dict[str, Any]) -> str:
-        """Extract tool name from Chat Completions format."""
-        return tool_call.get("function", {}).get("name", "unknown")
+    def create_tool_result_message(self, tool_call: Dict[str, Any], result_content: str) -> Dict[str, Any]:
+        """Create tool result message for Chat Completions format."""
+        tool_call_id = self.extract_tool_call_id(tool_call)
+        return {
+            "role": "tool",
+            "tool_call_id": tool_call_id,
+            "content": result_content,
+        }
+    def extract_tool_result_content(self, tool_result_message: Dict[str, Any]) -> str:
+        """Extract content from Chat Completions tool result message."""
+        return tool_result_message.get("content", "")
+    def _convert_messages_for_mcp_chat_completions(self, messages: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        """Convert messages for MCP Chat Completions format if needed."""
+        # For Chat Completions, messages are already in the correct format
+        # Just ensure tool result messages use the correct format
+        converted_messages = []
+        for message in messages:
+            if message.get("type") == "function_call_output":
+                # Convert Response API format to Chat Completions format
+                converted_message = {
+                    "role": "tool",
+                    "tool_call_id": message.get("call_id"),
+                    "content": message.get("output", ""),
+                }
+                converted_messages.append(converted_message)
+            else:
+                # Pass through other messages as-is
+                converted_messages.append(message.copy())
+        return converted_messages
+    def get_provider_name(self) -> str:
+        """Get the name of this provider."""
+        # Check if provider name was explicitly set in config
+        if "provider" in self.config:
+            return self.config["provider"]
+        elif "provider_name" in self.config:
+            return self.config["provider_name"]
+        # Try to infer from base_url
+        base_url = self.config.get("base_url", "")
+        if "openai.com" in base_url:
+            return "OpenAI"
+        elif "cerebras.ai" in base_url:
+            return "Cerebras AI"
+        elif "together.xyz" in base_url:
+            return "Together AI"
+        elif "fireworks.ai" in base_url:
+            return "Fireworks AI"
+        elif "groq.com" in base_url:
+            return "Groq"
+        elif "openrouter.ai" in base_url:
+            return "OpenRouter"
+        elif "z.ai" in base_url or "bigmodel.cn" in base_url:
+            return "ZAI"
+        elif "nebius.com" in base_url:
+            return "Nebius AI Studio"
+        elif "moonshot.ai" in base_url or "moonshot.cn" in base_url:
+            return "Kimi"
+        elif "poe.com" in base_url:
+            return "POE"
+        elif "aliyuncs.com" in base_url:
+            return "Qwen"
+        else:
+            return "ChatCompletion"
+    def get_filesystem_support(self) -> FilesystemSupport:
+        """Chat Completions supports filesystem through MCP servers."""
+        return FilesystemSupport.MCP
+    def get_supported_builtin_tools(self) -> List[str]:
+        """Get list of builtin tools supported by this provider."""
+        # Chat Completions API doesn't typically support builtin tools like web_search
+        # But some providers might - this can be overridden in subclasses
+        return []
+    def _create_client(self, **kwargs) -> AsyncOpenAI:
+        """Create OpenAI client with consistent configuration."""
+        import openai
+        all_params = {**self.config, **kwargs}
+        base_url = all_params.get("base_url", "https://api.openai.com/v1")
+        return openai.AsyncOpenAI(api_key=self.api_key, base_url=base_url)
-    def extract_tool_arguments(self, tool_call: Dict[str, Any]) -> Dict[str, Any]:
-        """Extract tool arguments from Chat Completions format."""
-        return tool_call.get("function", {}).get("arguments", {})
+    def _handle_reasoning_transition(self, log_prefix: str, agent_id: Optional[str]) -> Optional[StreamChunk]:
+        """Handle reasoning state transition and return StreamChunk if transition occurred."""
+        reasoning_active_key = "_reasoning_active"
+        if hasattr(self, reasoning_active_key):
+            if getattr(self, reasoning_active_key) is True:
+                setattr(self, reasoning_active_key, False)
+                log_stream_chunk(log_prefix, "reasoning_done", "", agent_id)
+                return StreamChunk(type="reasoning_done", content="")
+        return None

massgen 0.0.3__py3-none-any.whl → 0.1.0__py3-none-any.whl

Potentially problematic release.

massgen 0.0.3py3-none-any.whl → 0.1.0py3-none-any.whl