PyPI - agentforge-harness - Versions diffs - 0.1.2__py3-none-any.whl - Mend

agentforge-harness 0.1.2__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (72) hide show

agentforge_harness/__init__.py +3 -0
agentforge_harness/agent/__init__.py +0 -0
agentforge_harness/agent/agent.py +332 -0
agentforge_harness/agent/events.py +106 -0
agentforge_harness/agent/modes.py +6 -0
agentforge_harness/agent/persistence.py +258 -0
agentforge_harness/agent/session.py +297 -0
agentforge_harness/cli/__init__.py +0 -0
agentforge_harness/cli/commands.py +860 -0
agentforge_harness/cli/doctor.py +819 -0
agentforge_harness/cli/models.py +146 -0
agentforge_harness/cli/report.py +249 -0
agentforge_harness/cli/run.py +163 -0
agentforge_harness/cli/setup.py +275 -0
agentforge_harness/client/__init__.py +0 -0
agentforge_harness/client/llm_client.py +410 -0
agentforge_harness/client/response.py +87 -0
agentforge_harness/config/__init__.py +0 -0
agentforge_harness/config/config.py +246 -0
agentforge_harness/config/loader.py +170 -0
agentforge_harness/context/__init__.py +0 -0
agentforge_harness/context/compaction.py +93 -0
agentforge_harness/context/loop_detector.py +51 -0
agentforge_harness/context/manager.py +290 -0
agentforge_harness/hooks/__init__.py +0 -0
agentforge_harness/hooks/hook_system.py +152 -0
agentforge_harness/prompts/__init__.py +0 -0
agentforge_harness/prompts/system.py +381 -0
agentforge_harness/safety/__init__.py +0 -0
agentforge_harness/safety/approval.py +187 -0
agentforge_harness/safety/circuit_breaker.py +78 -0
agentforge_harness/safety/output_hygiene.py +169 -0
agentforge_harness/safety/prompt_injection.py +58 -0
agentforge_harness/skills/__init__.py +0 -0
agentforge_harness/skills/manager.py +473 -0
agentforge_harness/tools/__init__.py +0 -0
agentforge_harness/tools/base.py +231 -0
agentforge_harness/tools/builtin/__init__.py +50 -0
agentforge_harness/tools/builtin/append_file.py +121 -0
agentforge_harness/tools/builtin/edit_file.py +241 -0
agentforge_harness/tools/builtin/git_diff.py +182 -0
agentforge_harness/tools/builtin/glob.py +68 -0
agentforge_harness/tools/builtin/grep.py +132 -0
agentforge_harness/tools/builtin/list_dir.py +76 -0
agentforge_harness/tools/builtin/memory.py +155 -0
agentforge_harness/tools/builtin/patch.py +566 -0
agentforge_harness/tools/builtin/read_file.py +169 -0
agentforge_harness/tools/builtin/shell.py +184 -0
agentforge_harness/tools/builtin/todo.py +92 -0
agentforge_harness/tools/builtin/web_fetch.py +68 -0
agentforge_harness/tools/builtin/web_search.py +72 -0
agentforge_harness/tools/builtin/write_file.py +120 -0
agentforge_harness/tools/discovery.py +74 -0
agentforge_harness/tools/mcp/__init__.py +0 -0
agentforge_harness/tools/mcp/client.py +103 -0
agentforge_harness/tools/mcp/mcp_manager.py +91 -0
agentforge_harness/tools/mcp/mcp_tool.py +54 -0
agentforge_harness/tools/registry.py +191 -0
agentforge_harness/tools/subagents.py +226 -0
agentforge_harness/ui/__init__.py +0 -0
agentforge_harness/ui/tui.py +1142 -0
agentforge_harness/utils/__init__.py +0 -0
agentforge_harness/utils/errors.py +49 -0
agentforge_harness/utils/paths.py +55 -0
agentforge_harness/utils/redaction.py +213 -0
agentforge_harness/utils/text.py +78 -0
agentforge_harness-0.1.2.dist-info/METADATA +1028 -0
agentforge_harness-0.1.2.dist-info/RECORD +72 -0
agentforge_harness-0.1.2.dist-info/WHEEL +5 -0
agentforge_harness-0.1.2.dist-info/entry_points.txt +2 -0
agentforge_harness-0.1.2.dist-info/licenses/LICENSE +21 -0
agentforge_harness-0.1.2.dist-info/top_level.txt +1 -0

agentforge_harness/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+"""AgentForge harness package."""
+__version__ = "0.1.0"

agentforge_harness/agent/__init__.py ADDED Viewed

File without changes

agentforge_harness/agent/agent.py ADDED Viewed

@@ -0,0 +1,332 @@
+from __future__ import annotations
+import asyncio
+import json
+import logging
+import random
+from typing import AsyncGenerator, Callable
+from agentforge_harness.agent.events import AgentEvent, AgentEventType
+from agentforge_harness.agent.modes import AgentMode
+from agentforge_harness.agent.session import Session
+from agentforge_harness.client.response import StreamEventType, TokenUsage, ToolCall, ToolResultMessage
+from agentforge_harness.config.config import Config
+from agentforge_harness.prompts.system import create_loop_breaker_prompt
+from agentforge_harness.tools.base import ToolConfirmation, ToolResult
+from agentforge_harness.utils.redaction import redact_tool_params
+logger = logging.getLogger(__name__)
+class Agent:
+    def __init__(self, config: Config, confirmation_callback: Callable[[ToolConfirmation], bool] | None = None):
+        self.config = config
+        self.session: Session | None = Session(self.config)
+        self.session.approval_manager.confirmation_callback = confirmation_callback
+    async def run(self, message: str):
+        await self.session.hook_system.trigger_before_agent(message)
+        yield AgentEvent.agents_start(message)
+        self.session.context_manager.add_user_message(message)
+        self.session.loop_detector.clear()
+        final_response: str | None = None
+        async for event in self._agentic_loop():
+            yield event
+            if event.type == AgentEventType.TEXT_COMPLETE:
+                final_response = event.data.get("content")
+        await self.session.hook_system.trigger_after_agent(message, final_response or "")
+        yield AgentEvent.agents_end(final_response)
+    async def _agentic_loop(self) -> AsyncGenerator[AgentEvent, None]:
+        max_turns = self.config.max_turns
+        if self.session.mode == AgentMode.PLAN:
+            max_turns = min(max_turns, 8)
+        max_llm_retries = 3
+        plan_tool_budget = 8
+        plan_tool_calls = 0
+        force_plan_response = False
+        model_chain = [
+            self.config.model_name,
+            *(self.config.model.fallbacks or []),
+        ]
+        circuit_breaker = self.session.circuit_breaker
+        try:
+            for turn_num in range(max_turns):
+                self.session.increment_turn()
+                # check context budget and auto-compress if needed
+                budget = self.session.context_manager.get_context_budget()
+                if budget["warning"]:
+                    if budget["total_tokens"] > 0:
+                        yield AgentEvent.text_delta(
+                            f"\n[Context: {budget['usage_pct']}% ({budget['total_tokens']}/{budget['context_window']} tokens)]"
+                        )
+                    if budget["critical"] or budget["usage_pct"] >= 80:
+                        summary, usage = await self.session.context_manager.compress_old_messages(
+                            self.session.chat_compactor
+                        )
+                        if summary and usage:
+                            self.session.context_manager.set_latest_usage(usage)
+                            self.session.context_manager.add_usage(usage)
+                tool_schemas = (
+                    []
+                    if force_plan_response
+                    else self.session.tool_registry.get_schemas(mode=self.session.mode)
+                )
+                # LLM call with circuit breaker + fallback chain
+                response_text = ""
+                tool_calls: list[ToolCall] = []
+                usage: TokenUsage | None = None
+                llm_success = False
+                selected_model = model_chain[0]
+                for model_idx, model_name in enumerate(model_chain):
+                    if circuit_breaker.is_open(model_name):
+                        yield AgentEvent.text_delta(
+                            f"\n[Skipping {model_name} (circuit open)]"
+                        )
+                        continue
+                    for attempt in range(max_llm_retries + 1):
+                        response_text = ""
+                        tool_calls = []
+                        usage = None
+                        saw_error = False
+                        async for event in self.session.client.chat_completion(
+                            self.session.context_manager.get_messages(),
+                            tools=tool_schemas if tool_schemas else None,
+                            model=model_name,
+                            max_retries=0,
+                        ):
+                            if event.type == StreamEventType.TEXT_DELTA:
+                                if event.text_delta:
+                                    content = event.text_delta.content
+                                    response_text += content
+                                    yield AgentEvent.text_delta(content)
+                            elif event.type == StreamEventType.TOOL_CALL_COMPLETE:
+                                if event.tool_call:
+                                    tool_calls.append(event.tool_call)
+                            elif event.type == StreamEventType.ERROR:
+                                circuit_breaker.record_failure(model_name)
+                                if attempt < max_llm_retries and circuit_breaker.can_try(model_name):
+                                    wait = 2 ** attempt + random.uniform(0, 1)
+                                    err_msg = event.error or "unknown error"
+                                    yield AgentEvent.text_delta(
+                                        f"\n[{model_name} error: {err_msg}, retrying in {wait:.1f}s...]"
+                                    )
+                                    await asyncio.sleep(wait)
+                                    saw_error = True
+                                    break
+                                elif attempt < max_llm_retries:
+                                    yield AgentEvent.text_delta(
+                                        f"\n[{model_name} circuit open after {circuit_breaker.failure_threshold} failures, trying fallback...]"
+                                    )
+                                    saw_error = True
+                                    break
+                                else:
+                                    yield AgentEvent.text_delta(
+                                        f"\n[{model_name} failed after {max_llm_retries + 1} attempts, trying fallback...]"
+                                    )
+                                    saw_error = True
+                                    break
+                            elif event.type == StreamEventType.MESSAGE_COMPLETE:
+                                usage = event.token_usage
+                        if saw_error:
+                            continue
+                        circuit_breaker.record_success(model_name)
+                        llm_success = True
+                        selected_model = model_name
+                        break
+                    if llm_success:
+                        break
+                if not llm_success:
+                    yield AgentEvent.agents_error(
+                        f"All models exhausted. Tried: {', '.join(model_chain)}. "
+                        "Check API keys and network connectivity."
+                    )
+                    return
+                if selected_model != model_chain[0]:
+                    yield AgentEvent.text_delta(
+                        f"\n[Failed over to {selected_model}]\n"
+                    )
+                self.session.context_manager.add_assistant_message(
+                    response_text or None,
+                    (
+                        [
+                            {
+                                "id": tc.call_id,
+                                "type": "function",
+                                "function": {
+                                    "name": tc.name,
+                                    "arguments": json.dumps(tc.arguments),
+                                },
+                            }
+                            for tc in tool_calls
+                        ]
+                        if tool_calls
+                        else None
+                    ),
+                )
+                yield AgentEvent.text_complete(response_text)
+                if response_text:
+                    self.session.loop_detector.record_action("response", text=response_text)
+                if not tool_calls:
+                    if usage:
+                        self.session.context_manager.set_latest_usage(usage)
+                        self.session.context_manager.add_usage(usage)
+                    self.session.context_manager.prune_tool_outputs()
+                    return
+                tool_call_results: list[ToolResultMessage] = []
+                for tool_call in tool_calls:
+                    display_arguments = self._display_tool_arguments(tool_call.arguments)
+                    yield AgentEvent.tool_call_start(
+                        tool_call.call_id,
+                        tool_call.name,
+                        display_arguments,
+                    )
+                    skip_tool_reason: str | None = None
+                    self.session.loop_detector.record_action(
+                        "tool_call",
+                        tool_name=tool_call.name,
+                        args=tool_call.arguments,
+                    )
+                    if self.session.mode == AgentMode.PLAN:
+                        plan_tool_calls += 1
+                        if plan_tool_calls > plan_tool_budget:
+                            skip_tool_reason = (
+                                f"Plan mode read-only exploration limit reached "
+                                f"({plan_tool_budget} tool call(s))."
+                            )
+                        elif loop_detection_error := self.session.loop_detector.check_for_loop():
+                            skip_tool_reason = (
+                                f"Plan mode stopped repeated tool exploration: "
+                                f"{loop_detection_error}."
+                            )
+                    if skip_tool_reason:
+                        result = ToolResult.error_result(
+                            f"{skip_tool_reason} Stop calling tools and provide the plan now."
+                        )
+                        force_plan_response = True
+                    else:
+                        try:
+                            result = await self.session.tool_registry.invoke(
+                                tool_call.name,
+                                tool_call.arguments,
+                                self.config.cwd,
+                                self.session.hook_system,
+                                self.session.approval_manager,
+                            )
+                        except Exception as e:
+                            logger.warning(
+                                "Tool '%s' crashed: %s",
+                                tool_call.name,
+                                e,
+                            )
+                            yield AgentEvent.text_delta(
+                                f"\n[Tool '{tool_call.name}' crashed: {e}]"
+                            )
+                            result = ToolResult.error_result(f"Tool crashed: {e}")
+                    if skip_tool_reason:
+                        yield AgentEvent.text_delta(
+                            f"\n[{skip_tool_reason} Preparing a plan now.]"
+                        )
+                    yield AgentEvent.tool_call_complete(
+                        tool_call.call_id,
+                        tool_call.name,
+                        result,
+                    )
+                    tool_call_results.append(
+                        ToolResultMessage(
+                            tool_call_id=tool_call.call_id,
+                            content=result.to_model_output(),
+                            is_error=not result.success,
+                        )
+                    )
+                for tool_result in tool_call_results:
+                    self.session.context_manager.add_tool_result(
+                        tool_result.tool_call_id,
+                        tool_result.content,
+                    )
+                if force_plan_response and self.session.mode == AgentMode.PLAN:
+                    self.session.context_manager.add_user_message(
+                        "SYSTEM NOTICE: Plan mode has enough context or is repeating tool exploration. "
+                        "Do not call more tools. Produce the final plan now, with goal, approach, steps, "
+                        "files to change, open questions, and the reminder to switch to /build for implementation."
+                    )
+                    self.session.loop_detector.clear()
+                    self.session.context_manager.prune_tool_outputs()
+                    continue
+                if usage:
+                    self.session.context_manager.set_latest_usage(usage)
+                    self.session.context_manager.add_usage(usage)
+                loop_detection_error = self.session.loop_detector.check_for_loop()
+                if loop_detection_error:
+                    loop_prompt = create_loop_breaker_prompt(loop_detection_error)
+                    self.session.context_manager.add_user_message(loop_prompt)
+                    self.session.loop_detector.clear()
+                    self.session.context_manager.prune_tool_outputs()
+                    continue
+                self.session.context_manager.prune_tool_outputs()
+            yield AgentEvent.agents_error(f"Maximum turns ({max_turns}) reached")
+        except Exception as e:
+            logger.exception("Unhandled exception in agent loop")
+            try:
+                self.session.save_checkpoint(mode="crash")
+            except Exception:
+                logger.warning("Failed to save crash checkpoint")
+            yield AgentEvent.agents_error(
+                f"Internal agent error: {str(e)}",
+                details={"turn": self.session._turn_count},
+            )
+            return
+    def _display_tool_arguments(self, arguments: dict) -> dict:
+        if not self.config.redaction_enabled:
+            return arguments
+        redacted, _ = redact_tool_params(arguments)
+        return redacted
+    async def __aenter__(self) -> Agent:
+        await self.session.initialize()
+        return self
+    async def __aexit__(
+        self,
+        exc_type,
+        exc_val,
+        exc_tb,
+    ) -> None:
+        if self.session and self.session.client and self.session.mcp_manager:
+            await self.session.client.close()
+            await self.session.mcp_manager.shutdown()
+            self.session = None

agentforge_harness/agent/events.py ADDED Viewed

@@ -0,0 +1,106 @@
+from __future__ import annotations
+from dataclasses import dataclass, field
+from enum import Enum
+from typing import Any
+from agentforge_harness.client.response import TokenUsage
+from agentforge_harness.tools.base import ToolResult
+class AgentEventType(str, Enum):
+    # Agent lifecycle events
+    AGENT_START = "agent_start"
+    AGENT_END = "agent_end"
+    AGENT_ERROR = "agent_error"
+    # Tool Calls
+    TOOL_CALL_START = "tool_call_start"
+    TOOL_CALL_COMPLETE = "tool_call_complete"
+    # Text Streaming Events
+    TEXT_DELTA = "text_delta"
+    TEXT_COMPLETE = "text_complete"
+@dataclass
+class AgentEvent:
+    type: AgentEventType
+    data: dict[str, Any] = field(default_factory=dict)
+    @classmethod
+    def agents_start(cls, message: str) -> AgentEvent:
+        return cls(
+            type=AgentEventType.AGENT_START,
+            data={"message": message},
+        )
+    @classmethod
+    def agents_end(
+        cls, response: str | None = None, usage: TokenUsage | None = None
+    ) -> AgentEvent:
+        return cls(
+            type=AgentEventType.AGENT_END,
+            data={
+                "response": response,
+                "usage": usage.__dict__ if usage else None,
+            },
+        )
+    @classmethod
+    def agents_error(
+        cls, error: str, details: dict[str, Any] | None = None
+    ) -> AgentEvent:
+        return cls(
+            type=AgentEventType.AGENT_ERROR,
+            data={
+                "error": error,
+                "details": details or {},
+            },
+        )
+    @classmethod
+    def text_delta(cls, content: str) -> AgentEvent:
+        return cls(
+            type=AgentEventType.TEXT_DELTA,
+            data={"content": content},
+        )
+    @classmethod
+    def text_complete(cls, content: str) -> AgentEvent:
+        return cls(
+            type=AgentEventType.TEXT_COMPLETE,
+            data={"content": content},
+        )
+    @classmethod
+    def tool_call_start(
+        cls, call_id: str, name: str, arguments: dict[str, Any]
+    ) -> AgentEvent:
+        return cls(
+            type=AgentEventType.TOOL_CALL_START,
+            data={
+                "call_id": call_id,
+                "name": name,
+                "arguments": arguments,
+            },
+        )
+    @classmethod
+    def tool_call_complete(
+        cls, call_id: str, name: str, result: ToolResult
+    ) -> AgentEvent:
+        return cls(
+            type=AgentEventType.TOOL_CALL_COMPLETE,
+            data={
+                "call_id": call_id,
+                "name": name,
+                "success": result.success,
+                "output": result.output,
+                "error": result.error,
+                "metadata": result.metadata,
+                "diff": result.diff_text,
+                "truncated": result.truncated,
+                "exit_code" : result.exit_code,
+            },
+        )

agentforge_harness/agent/modes.py ADDED Viewed

@@ -0,0 +1,6 @@
+from enum import Enum
+class AgentMode(str, Enum):
+    PLAN = "plan"
+    BUILD = "build"