PyPI - loom-agent - Versions diffs - 0.0.1__py3-none-any.whl → 0.0.2__py3-none-any.whl - Mend

loom-agent 0.0.1py3-none-any.whl → 0.0.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of loom-agent might be problematic. Click here for more details.

Files changed (38) hide show

loom/builtin/tools/calculator.py +4 -0
loom/builtin/tools/document_search.py +5 -0
loom/builtin/tools/glob.py +4 -0
loom/builtin/tools/grep.py +4 -0
loom/builtin/tools/http_request.py +5 -0
loom/builtin/tools/python_repl.py +5 -0
loom/builtin/tools/read_file.py +4 -0
loom/builtin/tools/task.py +5 -0
loom/builtin/tools/web_search.py +4 -0
loom/builtin/tools/write_file.py +4 -0
loom/components/agent.py +121 -5
loom/core/agent_executor.py +505 -320
loom/core/compression_manager.py +17 -10
loom/core/context_assembly.py +329 -0
loom/core/events.py +414 -0
loom/core/execution_context.py +119 -0
loom/core/tool_orchestrator.py +383 -0
loom/core/turn_state.py +188 -0
loom/core/types.py +15 -4
loom/interfaces/event_producer.py +172 -0
loom/interfaces/tool.py +22 -1
loom/security/__init__.py +13 -0
loom/security/models.py +85 -0
loom/security/path_validator.py +128 -0
loom/security/validator.py +346 -0
loom/tasks/PHASE_1_FOUNDATION/task_1.1_agent_events.md +121 -0
loom/tasks/PHASE_1_FOUNDATION/task_1.2_streaming_api.md +521 -0
loom/tasks/PHASE_1_FOUNDATION/task_1.3_context_assembler.md +606 -0
loom/tasks/PHASE_2_CORE_FEATURES/task_2.1_tool_orchestrator.md +743 -0
loom/tasks/PHASE_2_CORE_FEATURES/task_2.2_security_validator.md +676 -0
loom/tasks/README.md +109 -0
loom/tasks/__init__.py +11 -0
loom/tasks/sql_placeholder.py +100 -0
loom_agent-0.0.2.dist-info/METADATA +295 -0
{loom_agent-0.0.1.dist-info → loom_agent-0.0.2.dist-info}/RECORD +37 -19
loom_agent-0.0.1.dist-info/METADATA +0 -457
{loom_agent-0.0.1.dist-info → loom_agent-0.0.2.dist-info}/WHEEL +0 -0
{loom_agent-0.0.1.dist-info → loom_agent-0.0.2.dist-info}/licenses/LICENSE +0 -0

loom/core/agent_executor.py CHANGED Viewed

@@ -1,23 +1,35 @@
+"""
+Agent Executor with tt (Tail-Recursive) Control Loop
+Core execution engine implementing recursive conversation management,
+inspired by Claude Code's tt function design.
+"""
 from __future__ import annotations
 import asyncio
+import json
+import time
+from pathlib import Path
 from typing import AsyncGenerator, Dict, List, Optional
 from uuid import uuid4
+from loom.callbacks.base import BaseCallback
+from loom.callbacks.metrics import MetricsCollector
+from loom.core.context_assembly import ComponentPriority, ContextAssembler
+from loom.core.events import AgentEvent, AgentEventType, ToolResult
+from loom.core.execution_context import ExecutionContext
+from loom.core.permissions import PermissionManager
 from loom.core.steering_control import SteeringControl
+from loom.core.tool_orchestrator import ToolOrchestrator
 from loom.core.tool_pipeline import ToolExecutionPipeline
-from loom.core.types import Message, StreamEvent, ToolCall
-from loom.core.system_prompt import build_system_prompt
+from loom.core.turn_state import TurnState
+from loom.core.types import Message, ToolCall
 from loom.interfaces.compressor import BaseCompressor
 from loom.interfaces.llm import BaseLLM
 from loom.interfaces.memory import BaseMemory
 from loom.interfaces.tool import BaseTool
-from loom.core.permissions import PermissionManager
-from loom.callbacks.metrics import MetricsCollector
-import time
 from loom.utils.token_counter import count_messages_tokens
-from loom.callbacks.base import BaseCallback
-from loom.core.errors import ExecutionAbortedError
 # RAG support
 try:
@@ -27,7 +39,29 @@ except ImportError:
 class AgentExecutor:
-    """Agent 执行器：封装主循环，连接 LLM、内存、工具流水线与事件流。"""
+    """
+    Agent Executor with tt Recursive Control Loop.
+    Core Design:
+    - tt() is the only execution method (tail-recursive)
+    - All other methods are thin wrappers around tt()
+    - No iteration loops - only recursion
+    - Immutable state (TurnState)
+    Example:
+        ```python
+        executor = AgentExecutor(llm=llm, tools=tools)
+        # Initialize state
+        turn_state = TurnState.initial(max_iterations=10)
+        context = ExecutionContext.create()
+        messages = [Message(role="user", content="Hello")]
+        # Execute with tt recursion
+        async for event in executor.tt(messages, turn_state, context):
+            print(event)
+        ```
+    """
     def __init__(
         self,
@@ -35,7 +69,7 @@ class AgentExecutor:
         tools: Dict[str, BaseTool] | None = None,
         memory: BaseMemory | None = None,
         compressor: BaseCompressor | None = None,
-        context_retriever: Optional["ContextRetriever"] = None,  # 🆕 RAG support
+        context_retriever: Optional["ContextRetriever"] = None,
         steering_control: SteeringControl | None = None,
         max_iterations: int = 50,
         max_context_tokens: int = 16000,
@@ -43,325 +77,407 @@ class AgentExecutor:
         metrics: MetricsCollector | None = None,
         system_instructions: Optional[str] = None,
         callbacks: Optional[List[BaseCallback]] = None,
-        enable_steering: bool = False,  # 🆕 US1: Real-time steering
+        enable_steering: bool = False,
     ) -> None:
         self.llm = llm
         self.tools = tools or {}
         self.memory = memory
         self.compressor = compressor
-        self.context_retriever = context_retriever  # 🆕 RAG support
+        self.context_retriever = context_retriever
         self.steering_control = steering_control or SteeringControl()
         self.max_iterations = max_iterations
         self.max_context_tokens = max_context_tokens
         self.metrics = metrics or MetricsCollector()
-        self.permission_manager = permission_manager or PermissionManager(policy={"default": "allow"})
+        self.permission_manager = permission_manager or PermissionManager(
+            policy={"default": "allow"}
+        )
         self.system_instructions = system_instructions
         self.callbacks = callbacks or []
-        self.enable_steering = enable_steering  # 🆕 US1
+        self.enable_steering = enable_steering
+        # Tool execution (legacy pipeline for backward compatibility)
         self.tool_pipeline = ToolExecutionPipeline(
-            self.tools, permission_manager=self.permission_manager, metrics=self.metrics
+            self.tools,
+            permission_manager=self.permission_manager,
+            metrics=self.metrics,
         )
-    async def _emit(self, event_type: str, payload: Dict) -> None:
-        if not self.callbacks:
-            return
-        enriched = dict(payload)
-        enriched.setdefault("ts", time.time())
-        enriched.setdefault("type", event_type)
-        for cb in self.callbacks:
-            try:
-                await cb.on_event(event_type, enriched)
-            except Exception:
-                # best-effort; don't fail agent execution on callback errors
-                pass
+        # Tool orchestration (Loom 2.0 - intelligent parallel/sequential execution)
+        self.tool_orchestrator = ToolOrchestrator(
+            tools=self.tools,
+            permission_manager=self.permission_manager,
+            max_parallel=5,
+        )
-    async def execute(
+    # ==========================================
+    # CORE METHOD: tt (Tail-Recursive Control Loop)
+    # ==========================================
+    async def tt(
         self,
-        user_input: str,
-        cancel_token: Optional[asyncio.Event] = None,  # 🆕 US1: Cancellation support
-        correlation_id: Optional[str] = None,  # 🆕 US1: Request tracing
-    ) -> str:
-        """非流式执行，包含工具调用的 ReAct 循环（最小实现）。
+        messages: List[Message],
+        turn_state: TurnState,
+        context: ExecutionContext,
+    ) -> AsyncGenerator[AgentEvent, None]:
+        """
+        Tail-recursive control loop (inspired by Claude Code).
-        Args:
-            user_input: User query/instruction
-            cancel_token: Optional Event to signal cancellation (US1)
-            correlation_id: Optional correlation ID for request tracing (US1)
+        This is the ONLY core execution method. It processes one turn of the
+        conversation, then recursively calls itself if tools were used.
-        Returns:
-            Final agent response (or partial results if cancelled)
+        Recursion Flow:
+            tt(messages, state_0, ctx)
+              → LLM generates tool calls
+              → Execute tools
+              → tt(messages + tool_results, state_1, ctx)  # Recursive call
+                  → LLM generates final answer
+                  → return (base case)
+        Base Cases (recursion terminates):
+        1. LLM returns final answer (no tools)
+        2. Maximum recursion depth reached
+        3. Execution cancelled
+        4. Error occurred
+        Args:
+            messages: New messages for this turn (not full history)
+            turn_state: Immutable turn state
+            context: Shared execution context
+        Yields:
+            AgentEvent: Events representing execution progress
+        Example:
+            ```python
+            # Initial turn
+            state = TurnState.initial(max_iterations=10)
+            context = ExecutionContext.create()
+            messages = [Message(role="user", content="Search files")]
+            async for event in executor.tt(messages, state, context):
+                if event.type == AgentEventType.AGENT_FINISH:
+                    print(f"Done: {event.content}")
+            ```
         """
-        # Generate correlation_id if not provided
-        if correlation_id is None:
-            correlation_id = str(uuid4())
-        await self._emit("request_start", {
-            "input": user_input,
-            "source": "execute",
-            "iteration": 0,
-            "correlation_id": correlation_id,  # 🆕 US1
-        })
-        # Check cancellation before starting
-        if cancel_token and cancel_token.is_set():
-            await self._emit("agent_finish", {
-                "content": "Request cancelled before execution",
-                "source": "execute",
-                "correlation_id": correlation_id,
-            })
-            return "Request cancelled before execution"
+        # ==========================================
+        # Phase 0: Recursion Control
+        # ==========================================
+        yield AgentEvent(
+            type=AgentEventType.ITERATION_START,
+            iteration=turn_state.turn_counter,
+            turn_id=turn_state.turn_id,
+            metadata={"parent_turn_id": turn_state.parent_turn_id},
+        )
+        # Base case 1: Maximum recursion depth reached
+        if turn_state.is_final:
+            yield AgentEvent(
+                type=AgentEventType.MAX_ITERATIONS_REACHED,
+                metadata={
+                    "turn_counter": turn_state.turn_counter,
+                    "max_iterations": turn_state.max_iterations,
+                },
+            )
+            await self._emit(
+                "max_iterations_reached",
+                {
+                    "turn_counter": turn_state.turn_counter,
+                    "max_iterations": turn_state.max_iterations,
+                },
+            )
+            return
+        # Base case 2: Execution cancelled
+        if context.is_cancelled():
+            yield AgentEvent(
+                type=AgentEventType.EXECUTION_CANCELLED,
+                metadata={"correlation_id": context.correlation_id},
+            )
+            await self._emit(
+                "execution_cancelled",
+                {"correlation_id": context.correlation_id},
+            )
+            return
+        # ==========================================
+        # Phase 1: Context Assembly
+        # ==========================================
+        yield AgentEvent.phase_start("context_assembly")
+        # Load conversation history from memory
         history = await self._load_history()
-        # 🆕 Step 1: RAG - 自动检索相关文档（如果配置了 context_retriever）
-        retrieved_docs = []
+        # RAG retrieval (if configured)
+        rag_context = None
         if self.context_retriever:
-            retrieved_docs = await self.context_retriever.retrieve_for_query(user_input)
-            if retrieved_docs:
-                # 注入检索到的文档上下文
-                if self.context_retriever.inject_as == "system":
-                    doc_context = self.context_retriever.format_documents(retrieved_docs)
-                    history.append(Message(
-                        role="system",
-                        content=doc_context,
-                        metadata={"type": "retrieved_context", "doc_count": len(retrieved_docs)}
-                    ))
-                # 记录检索指标
-                self.metrics.metrics.retrievals = getattr(self.metrics.metrics, "retrievals", 0) + 1
-                await self._emit("retrieval_complete", {"doc_count": len(retrieved_docs), "source": "execute"})
-        # Step 2: 添加用户消息
-        history.append(Message(role="user", content=user_input))
-        # Step 3: 压缩检查
-        history = await self._maybe_compress(history)
-        # Step 4: 动态生成系统提示
-        context = {"retrieved_docs_count": len(retrieved_docs)} if retrieved_docs else None
-        system_prompt = build_system_prompt(self.tools, self.system_instructions, context)
-        history = self._inject_system_prompt(history, system_prompt)
-        if not self.llm.supports_tools or not self.tools:
-            try:
-                # Create LLM task that can be cancelled
-                llm_task = asyncio.create_task(self.llm.generate([m.__dict__ for m in history]))
-                # Poll for cancellation while waiting for LLM
-                while not llm_task.done():
-                    if cancel_token and cancel_token.is_set():
-                        llm_task.cancel()
-                        try:
-                            await llm_task
-                        except asyncio.CancelledError:
-                            pass
-                        partial_result = "Execution interrupted during LLM call"
-                        await self._emit("agent_finish", {
-                            "content": partial_result,
-                            "source": "execute",
-                            "correlation_id": correlation_id,
-                            "interrupted": True,
-                        })
-                        return partial_result
-                    await asyncio.sleep(0.1)  # Check every 100ms
-                text = await llm_task
-            except asyncio.CancelledError:
-                partial_result = "Execution interrupted during LLM call"
-                await self._emit("agent_finish", {
-                    "content": partial_result,
-                    "source": "execute",
-                    "correlation_id": correlation_id,
-                    "interrupted": True,
-                })
-                return partial_result
-            except Exception as e:
-                self.metrics.metrics.total_errors += 1
-                await self._emit("error", {"stage": "llm_generate", "message": str(e)})
-                raise
-            self.metrics.metrics.llm_calls += 1
-            if self.memory:
-                await self.memory.add_message(Message(role="assistant", content=text))
-            await self._emit("agent_finish", {"content": text, "source": "execute"})
-            return text
-        tools_spec = self._serialize_tools()
-        iterations = 0
-        final_text = ""
-        while iterations < self.max_iterations:
-            # 🆕 US1: Check cancellation before each iteration
-            if cancel_token and cancel_token.is_set():
-                partial_result = f"Execution interrupted after {iterations} iterations. Partial progress: {final_text or '(in progress)'}"
-                await self._emit("agent_finish", {
-                    "content": partial_result,
-                    "source": "execute",
-                    "correlation_id": correlation_id,
-                    "interrupted": True,
-                    "iterations_completed": iterations,
-                })
-                return partial_result
+            yield AgentEvent(type=AgentEventType.RETRIEVAL_START)
             try:
-                resp = await self.llm.generate_with_tools([m.__dict__ for m in history], tools_spec)
+                # Extract user query from last message
+                user_query = ""
+                for msg in reversed(messages):
+                    if msg.role == "user":
+                        user_query = msg.content
+                        break
+                if user_query:
+                    retrieved_docs = await self.context_retriever.retrieve_for_query(
+                        user_query
+                    )
+                    if retrieved_docs:
+                        rag_context = self.context_retriever.format_documents(
+                            retrieved_docs
+                        )
+                        # Emit retrieval progress
+                        for doc in retrieved_docs:
+                            yield AgentEvent(
+                                type=AgentEventType.RETRIEVAL_PROGRESS,
+                                metadata={
+                                    "doc_title": doc.metadata.get("title", "Unknown"),
+                                    "relevance_score": doc.metadata.get("score", 0.0),
+                                },
+                            )
+                    yield AgentEvent(
+                        type=AgentEventType.RETRIEVAL_COMPLETE,
+                        metadata={"doc_count": len(retrieved_docs)},
+                    )
+                    self.metrics.metrics.retrievals = (
+                        getattr(self.metrics.metrics, "retrievals", 0) + 1
+                    )
             except Exception as e:
-                self.metrics.metrics.total_errors += 1
-                await self._emit("error", {
-                    "stage": "llm_generate_with_tools",
-                    "message": str(e),
-                    "source": "execute",
-                    "iteration": iterations,
-                    "correlation_id": correlation_id,  # 🆕 US1
-                })
-                raise
-            self.metrics.metrics.llm_calls += 1
-            tool_calls = resp.get("tool_calls") or []
-            content = resp.get("content") or ""
-            if tool_calls:
-                # 广播工具调用开始（非流式路径）
-                try:
-                    meta = [
-                        {"id": str(tc.get("id", "")), "name": str(tc.get("name", ""))}
-                        for tc in tool_calls
-                    ]
-                    await self._emit("tool_calls_start", {"tool_calls": meta, "source": "execute", "iteration": iterations})
-                except Exception:
-                    pass
-                # 执行工具并把结果写回消息
-                try:
-                    for tr in await self._execute_tool_batch(tool_calls):
-                        tool_msg = Message(role="tool", content=tr.content, tool_call_id=tr.tool_call_id)
-                        history.append(tool_msg)
-                        if self.memory:
-                            await self.memory.add_message(tool_msg)
-                        await self._emit("tool_result", {"tool_call_id": tr.tool_call_id, "content": tr.content, "source": "execute", "iteration": iterations})
-                except Exception as e:
-                    self.metrics.metrics.total_errors += 1
-                    await self._emit("error", {"stage": "tool_execute", "message": str(e), "source": "execute", "iteration": iterations})
-                    raise
-                iterations += 1
-                self.metrics.metrics.total_iterations += 1
-                history = await self._maybe_compress(history)
-                continue
-            # 无工具调用：认为生成最终答案
-            final_text = content
-            if self.memory:
-                await self.memory.add_message(Message(role="assistant", content=final_text))
-            await self._emit("agent_finish", {
-                "content": final_text,
-                "source": "execute",
-                "correlation_id": correlation_id,  # 🆕 US1
-            })
-            break
-        return final_text
-    async def stream(self, user_input: str) -> AsyncGenerator[StreamEvent, None]:
-        """流式执行：输出 text_delta/agent_finish 事件。后续可接入 tool_calls。"""
-        yield StreamEvent(type="request_start")
-        await self._emit("request_start", {"input": user_input, "source": "stream", "iteration": 0})
-        history = await self._load_history()
+                yield AgentEvent.error(e, retrieval_failed=True)
+        # Add new messages to history
+        history.extend(messages)
+        # Compression check
+        old_len = len(history)
+        history_compacted = await self._maybe_compress(history)
+        compacted_this_turn = len(history_compacted) < old_len
+        if compacted_this_turn:
+            history = history_compacted
+            yield AgentEvent(
+                type=AgentEventType.COMPRESSION_APPLIED,
+                metadata={
+                    "messages_before": old_len,
+                    "messages_after": len(history),
+                },
+            )
-        # 🆕 RAG - 自动检索文档
-        retrieved_docs = []
-        if self.context_retriever:
-            retrieved_docs = await self.context_retriever.retrieve_for_query(user_input)
-            if retrieved_docs:
-                if self.context_retriever.inject_as == "system":
-                    doc_context = self.context_retriever.format_documents(retrieved_docs)
-                    history.append(Message(
-                        role="system",
-                        content=doc_context,
-                        metadata={"type": "retrieved_context", "doc_count": len(retrieved_docs)}
-                    ))
-                self.metrics.metrics.retrievals = getattr(self.metrics.metrics, "retrievals", 0) + 1
-                # 🆕 广播检索事件
-                yield StreamEvent(type="retrieval_complete", metadata={"doc_count": len(retrieved_docs)})
-                await self._emit("retrieval_complete", {"doc_count": len(retrieved_docs), "source": "stream"})
-        history.append(Message(role="user", content=user_input))
-        # 压缩检查
-        compressed = await self._maybe_compress(history)
-        if compressed is not history:
-            history = compressed
-            yield StreamEvent(type="compression_applied")
-        # 动态生成系统提示
-        context = {"retrieved_docs_count": len(retrieved_docs)} if retrieved_docs else None
-        system_prompt = build_system_prompt(self.tools, self.system_instructions, context)
-        history = self._inject_system_prompt(history, system_prompt)
-        if not self.llm.supports_tools or not self.tools:
-            try:
+        # Assemble system prompt using ContextAssembler
+        assembler = ContextAssembler(max_tokens=self.max_context_tokens)
+        # Add base instructions (critical priority)
+        if self.system_instructions:
+            assembler.add_component(
+                name="base_instructions",
+                content=self.system_instructions,
+                priority=ComponentPriority.CRITICAL,
+                truncatable=False,
+            )
+        # Add RAG context (high priority)
+        if rag_context:
+            assembler.add_component(
+                name="retrieved_context",
+                content=rag_context,
+                priority=ComponentPriority.HIGH,
+                truncatable=True,
+            )
+        # Add tool definitions (medium priority)
+        if self.tools:
+            tools_spec = self._serialize_tools()
+            tools_prompt = f"Available tools:\n{json.dumps(tools_spec, indent=2)}"
+            assembler.add_component(
+                name="tool_definitions",
+                content=tools_prompt,
+                priority=ComponentPriority.MEDIUM,
+                truncatable=False,
+            )
+        # Assemble final system prompt
+        final_system_prompt = assembler.assemble()
+        # Inject system prompt into history
+        if history and history[0].role == "system":
+            history[0] = Message(role="system", content=final_system_prompt)
+        else:
+            history.insert(0, Message(role="system", content=final_system_prompt))
+        # Emit context assembly summary
+        summary = assembler.get_summary()
+        yield AgentEvent.phase_end(
+            "context_assembly",
+            tokens_used=summary["total_tokens"],
+            metadata={
+                "components": len(summary["components"]),
+                "utilization": summary["utilization"],
+            },
+        )
+        # ==========================================
+        # Phase 2: LLM Call
+        # ==========================================
+        yield AgentEvent(type=AgentEventType.LLM_START)
+        try:
+            if self.llm.supports_tools and self.tools:
+                # LLM with tool support
+                tools_spec = self._serialize_tools()
+                response = await self.llm.generate_with_tools(
+                    [m.__dict__ for m in history], tools_spec
+                )
+                content = response.get("content", "")
+                tool_calls = response.get("tool_calls", [])
+                # Emit LLM content if available
+                if content:
+                    yield AgentEvent(type=AgentEventType.LLM_DELTA, content=content)
+            else:
+                # Simple LLM generation (streaming)
+                content_parts = []
                 async for delta in self.llm.stream([m.__dict__ for m in history]):
-                    yield StreamEvent(type="text_delta", content=delta)
-            except Exception as e:
-                self.metrics.metrics.total_errors += 1
-                await self._emit("error", {"stage": "llm_stream", "message": str(e), "source": "stream"})
-                raise
-            yield StreamEvent(type="agent_finish")
+                    content_parts.append(delta)
+                    yield AgentEvent(type=AgentEventType.LLM_DELTA, content=delta)
+                content = "".join(content_parts)
+                tool_calls = []
+            yield AgentEvent(type=AgentEventType.LLM_COMPLETE)
+        except Exception as e:
+            self.metrics.metrics.total_errors += 1
+            yield AgentEvent.error(e, llm_failed=True)
+            await self._emit("error", {"stage": "llm_call", "message": str(e)})
             return
-        tools_spec = self._serialize_tools()
-        iterations = 0
-        while iterations < self.max_iterations:
-            try:
-                resp = await self.llm.generate_with_tools([m.__dict__ for m in history], tools_spec)
-            except Exception as e:
-                self.metrics.metrics.total_errors += 1
-                await self._emit("error", {"stage": "llm_generate_with_tools", "message": str(e), "source": "stream", "iteration": iterations})
-                raise
-            self.metrics.metrics.llm_calls += 1
-            tool_calls = resp.get("tool_calls") or []
-            content = resp.get("content") or ""
-            if tool_calls:
-                # 广播工具调用开始
-                tc_models = [self._to_tool_call(tc) for tc in tool_calls]
-                yield StreamEvent(type="tool_calls_start", tool_calls=tc_models)
-                await self._emit(
-                    "tool_calls_start",
-                    {"tool_calls": [{"id": t.id, "name": t.name} for t in tc_models], "source": "stream", "iteration": iterations},
+        self.metrics.metrics.llm_calls += 1
+        # ==========================================
+        # Phase 3: Decision Point (Base Case or Recurse)
+        # ==========================================
+        if not tool_calls:
+            # Base case: No tools → Conversation complete
+            yield AgentEvent(
+                type=AgentEventType.AGENT_FINISH,
+                content=content,
+                metadata={
+                    "turn_counter": turn_state.turn_counter,
+                    "total_llm_calls": self.metrics.metrics.llm_calls,
+                },
+            )
+            # Save to memory
+            if self.memory and content:
+                await self.memory.add_message(
+                    Message(role="assistant", content=content)
                 )
-                # 执行工具
-                try:
-                    async for tr in self._execute_tool_calls_async(tc_models):
-                        yield StreamEvent(type="tool_result", result=tr)
-                        await self._emit("tool_result", {"tool_call_id": tr.tool_call_id, "content": tr.content, "source": "stream", "iteration": iterations})
-                        tool_msg = Message(role="tool", content=tr.content, tool_call_id=tr.tool_call_id)
-                        history.append(tool_msg)
-                        if self.memory:
-                            await self.memory.add_message(tool_msg)
-                except Exception as e:
-                    self.metrics.metrics.total_errors += 1
-                    await self._emit("error", {"stage": "tool_execute", "message": str(e), "source": "stream", "iteration": iterations})
-                    raise
-                iterations += 1
-                self.metrics.metrics.total_iterations += 1
-                # 每轮结束后做压缩检查
-                history = await self._maybe_compress(history)
-                continue
-            # 无工具调用：输出最终文本并结束
-            if content:
-                yield StreamEvent(type="text_delta", content=content)
-            yield StreamEvent(type="agent_finish")
             await self._emit("agent_finish", {"content": content})
-            if self.memory and content:
-                await self.memory.add_message(Message(role="assistant", content=content))
-            break
+            return
+        # ==========================================
+        # Phase 4: Tool Execution
+        # ==========================================
+        yield AgentEvent(
+            type=AgentEventType.LLM_TOOL_CALLS,
+            metadata={
+                "tool_count": len(tool_calls),
+                "tool_names": [tc.get("name") for tc in tool_calls],
+            },
+        )
+        # Convert to ToolCall models
+        tc_models = [self._to_tool_call(tc) for tc in tool_calls]
+        # Execute tools using ToolOrchestrator
+        tool_results: List[ToolResult] = []
+        try:
+            async for event in self.tool_orchestrator.execute_batch(tc_models):
+                yield event  # Forward all tool events
+                if event.type == AgentEventType.TOOL_RESULT:
+                    tool_results.append(event.tool_result)
+                    # Add to memory
+                    tool_msg = Message(
+                        role="tool",
+                        content=event.tool_result.content,
+                        tool_call_id=event.tool_result.tool_call_id,
+                    )
+                    if self.memory:
+                        await self.memory.add_message(tool_msg)
+                elif event.type == AgentEventType.TOOL_ERROR:
+                    # Collect error results too
+                    if event.tool_result:
+                        tool_results.append(event.tool_result)
+        except Exception as e:
+            self.metrics.metrics.total_errors += 1
+            yield AgentEvent.error(e, tool_execution_failed=True)
+            await self._emit("error", {"stage": "tool_execution", "message": str(e)})
+            return
+        yield AgentEvent(
+            type=AgentEventType.TOOL_CALLS_COMPLETE,
+            metadata={"results_count": len(tool_results)},
+        )
+        self.metrics.metrics.total_iterations += 1
+        # ==========================================
+        # Phase 5: Recursive Call (Tail Recursion)
+        # ==========================================
+        # Prepare next turn state
+        next_state = turn_state.next_turn(compacted=compacted_this_turn)
+        # Prepare next turn messages (only new messages, not full history)
+        next_messages = [
+            Message(
+                role="tool",
+                content=r.content,
+                tool_call_id=r.tool_call_id,
+            )
+            for r in tool_results
+        ]
+        # Emit recursion event
+        yield AgentEvent(
+            type=AgentEventType.RECURSION,
+            metadata={
+                "from_turn": turn_state.turn_id,
+                "to_turn": next_state.turn_id,
+                "depth": next_state.turn_counter,
+            },
+        )
+        # 🔥 Tail-recursive call
+        async for event in self.tt(next_messages, next_state, context):
+            yield event
+    # ==========================================
+    # Helper Methods
+    # ==========================================
     async def _load_history(self) -> List[Message]:
+        """Load conversation history from memory."""
         if not self.memory:
             return []
         return await self.memory.get_messages()
     async def _maybe_compress(self, history: List[Message]) -> List[Message]:
-        """Check if compression needed and apply if threshold reached.
-        US2: Automatic compression at 92% threshold with 8-segment summarization.
-        """
+        """Check if compression needed and apply if threshold reached."""
         if not self.compressor:
             return history
@@ -369,16 +485,19 @@ class AgentExecutor:
         # Check if compression should be triggered (92% threshold)
         if self.compressor.should_compress(tokens_before, self.max_context_tokens):
-            # Attempt compression
             try:
                 compressed_messages, metadata = await self.compressor.compress(history)
                 # Update metrics
-                self.metrics.metrics.compressions = getattr(self.metrics.metrics, "compressions", 0) + 1
+                self.metrics.metrics.compressions = (
+                    getattr(self.metrics.metrics, "compressions", 0) + 1
+                )
                 if metadata.key_topics == ["fallback"]:
-                    self.metrics.metrics.compression_fallbacks = getattr(self.metrics.metrics, "compression_fallbacks", 0) + 1
+                    self.metrics.metrics.compression_fallbacks = (
+                        getattr(self.metrics.metrics, "compression_fallbacks", 0) + 1
+                    )
-                # Emit compression event with metadata
+                # Emit compression event
                 await self._emit(
                     "compression_applied",
                     {
@@ -395,17 +514,17 @@ class AgentExecutor:
                 return compressed_messages
             except Exception as e:
-                # Compression failed - continue without compression
                 self.metrics.metrics.total_errors += 1
-                await self._emit("error", {
-                    "stage": "compression",
-                    "message": str(e),
-                })
+                await self._emit(
+                    "error",
+                    {"stage": "compression", "message": str(e)},
+                )
                 return history
         return history
     def _serialize_tools(self) -> List[Dict]:
+        """Serialize tools to LLM-compatible format."""
         tools_spec: List[Dict] = []
         for t in self.tools.values():
             schema = {}
@@ -413,6 +532,7 @@ class AgentExecutor:
                 schema = t.args_schema.model_json_schema()  # type: ignore[attr-defined]
             except Exception:
                 schema = {"type": "object", "properties": {}}
             tools_spec.append(
                 {
                     "type": "function",
@@ -426,25 +546,90 @@ class AgentExecutor:
         return tools_spec
     def _to_tool_call(self, raw: Dict) -> ToolCall:
-        # 允许 Rule/Mock LLM 输出简单 dict
-        return ToolCall(id=str(raw.get("id", "call_0")), name=raw["name"], arguments=raw.get("arguments", {}))
-    async def _execute_tool_batch(self, tool_calls_raw: List[Dict]) -> List[ToolResult]:
-        tc_models = [self._to_tool_call(tc) for tc in tool_calls_raw]
-        results: List[ToolResult] = []
-        async for tr in self._execute_tool_calls_async(tc_models):
-            results.append(tr)
-        return results
-    async def _execute_tool_calls_async(self, tool_calls: List[ToolCall]):
-        async for tr in self.tool_pipeline.execute_calls(tool_calls):
-            yield tr
-    def _inject_system_prompt(self, history: List[Message], system_prompt: str) -> List[Message]:
-        """注入或更新系统提示消息"""
-        # 如果第一条是系统消息，则替换；否则在开头插入
-        if history and history[0].role == "system":
-            history[0] = Message(role="system", content=system_prompt)
-        else:
-            history.insert(0, Message(role="system", content=system_prompt))
-        return history
+        """Convert raw dict to ToolCall model."""
+        return ToolCall(
+            id=str(raw.get("id", "call_0")),
+            name=raw["name"],
+            arguments=raw.get("arguments", {}),
+        )
+    async def _emit(self, event_type: str, payload: Dict) -> None:
+        """Emit event to callbacks."""
+        if not self.callbacks:
+            return
+        enriched = dict(payload)
+        enriched.setdefault("ts", time.time())
+        enriched.setdefault("type", event_type)
+        for cb in self.callbacks:
+            try:
+                await cb.on_event(event_type, enriched)
+            except Exception:
+                # Best-effort; don't fail execution on callback errors
+                pass
+    # ==========================================
+    # Backward Compatibility Wrappers
+    # ==========================================
+    async def execute(
+        self,
+        user_input: str,
+        cancel_token: Optional[asyncio.Event] = None,
+        correlation_id: Optional[str] = None,
+    ) -> str:
+        """
+        Execute agent and return final response (backward compatible wrapper).
+        This method wraps the new tt() recursive API and extracts the final
+        response for backward compatibility with existing code.
+        Args:
+            user_input: User input text
+            cancel_token: Optional cancellation event
+            correlation_id: Optional correlation ID for tracing
+        Returns:
+            str: Final response text
+        Example:
+            ```python
+            executor = AgentExecutor(llm=llm, tools=tools)
+            response = await executor.execute("Hello")
+            print(response)
+            ```
+        """
+        # Initialize state and context
+        turn_state = TurnState.initial(max_iterations=self.max_iterations)
+        context = ExecutionContext.create(
+            correlation_id=correlation_id,
+            cancel_token=cancel_token,
+        )
+        messages = [Message(role="user", content=user_input)]
+        # Execute with tt and collect result
+        final_content = ""
+        async for event in self.tt(messages, turn_state, context):
+            # Accumulate LLM deltas
+            if event.type == AgentEventType.LLM_DELTA:
+                final_content += event.content or ""
+            # Return on finish
+            elif event.type == AgentEventType.AGENT_FINISH:
+                return event.content or final_content
+            # Handle cancellation
+            elif event.type == AgentEventType.EXECUTION_CANCELLED:
+                return "cancelled"
+            # Handle max iterations
+            elif event.type == AgentEventType.MAX_ITERATIONS_REACHED:
+                return final_content or "Max iterations reached"
+            # Raise on error
+            elif event.type == AgentEventType.ERROR:
+                if event.error:
+                    raise event.error
+        return final_content

loom-agent 0.0.1__py3-none-any.whl → 0.0.2__py3-none-any.whl

Potentially problematic release.

loom-agent 0.0.1py3-none-any.whl → 0.0.2py3-none-any.whl