PyPI - gobby - Versions diffs - 0.2.5__py3-none-any.whl → 0.2.6__py3-none-any.whl - Mend

gobby 0.2.5py3-none-any.whl → 0.2.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (148) hide show

gobby/adapters/claude_code.py +13 -4
gobby/adapters/codex.py +43 -3
gobby/agents/runner.py +8 -0
gobby/cli/__init__.py +6 -0
gobby/cli/clones.py +419 -0
gobby/cli/conductor.py +266 -0
gobby/cli/installers/antigravity.py +3 -9
gobby/cli/installers/claude.py +9 -9
gobby/cli/installers/codex.py +2 -8
gobby/cli/installers/gemini.py +2 -8
gobby/cli/installers/shared.py +71 -8
gobby/cli/skills.py +858 -0
gobby/cli/tasks/ai.py +0 -440
gobby/cli/tasks/crud.py +44 -6
gobby/cli/tasks/main.py +0 -4
gobby/cli/tui.py +2 -2
gobby/cli/utils.py +3 -3
gobby/clones/__init__.py +13 -0
gobby/clones/git.py +547 -0
gobby/conductor/__init__.py +16 -0
gobby/conductor/alerts.py +135 -0
gobby/conductor/loop.py +164 -0
gobby/conductor/monitors/__init__.py +11 -0
gobby/conductor/monitors/agents.py +116 -0
gobby/conductor/monitors/tasks.py +155 -0
gobby/conductor/pricing.py +234 -0
gobby/conductor/token_tracker.py +160 -0
gobby/config/app.py +63 -1
gobby/config/search.py +110 -0
gobby/config/servers.py +1 -1
gobby/config/skills.py +43 -0
gobby/config/tasks.py +6 -14
gobby/hooks/event_handlers.py +145 -2
gobby/hooks/hook_manager.py +48 -2
gobby/hooks/skill_manager.py +130 -0
gobby/install/claude/hooks/hook_dispatcher.py +4 -4
gobby/install/codex/hooks/hook_dispatcher.py +1 -1
gobby/install/gemini/hooks/hook_dispatcher.py +87 -12
gobby/llm/claude.py +22 -34
gobby/llm/claude_executor.py +46 -256
gobby/llm/codex_executor.py +59 -291
gobby/llm/executor.py +21 -0
gobby/llm/gemini.py +134 -110
gobby/llm/litellm_executor.py +143 -6
gobby/llm/resolver.py +95 -33
gobby/mcp_proxy/instructions.py +54 -0
gobby/mcp_proxy/models.py +15 -0
gobby/mcp_proxy/registries.py +68 -5
gobby/mcp_proxy/server.py +33 -3
gobby/mcp_proxy/services/tool_proxy.py +81 -1
gobby/mcp_proxy/stdio.py +2 -1
gobby/mcp_proxy/tools/__init__.py +0 -2
gobby/mcp_proxy/tools/agent_messaging.py +317 -0
gobby/mcp_proxy/tools/clones.py +903 -0
gobby/mcp_proxy/tools/memory.py +1 -24
gobby/mcp_proxy/tools/metrics.py +65 -1
gobby/mcp_proxy/tools/orchestration/__init__.py +3 -0
gobby/mcp_proxy/tools/orchestration/cleanup.py +151 -0
gobby/mcp_proxy/tools/orchestration/wait.py +467 -0
gobby/mcp_proxy/tools/session_messages.py +1 -2
gobby/mcp_proxy/tools/skills/__init__.py +631 -0
gobby/mcp_proxy/tools/task_orchestration.py +7 -0
gobby/mcp_proxy/tools/task_readiness.py +14 -0
gobby/mcp_proxy/tools/task_sync.py +1 -1
gobby/mcp_proxy/tools/tasks/_context.py +0 -20
gobby/mcp_proxy/tools/tasks/_crud.py +91 -4
gobby/mcp_proxy/tools/tasks/_expansion.py +348 -0
gobby/mcp_proxy/tools/tasks/_factory.py +6 -16
gobby/mcp_proxy/tools/tasks/_lifecycle.py +60 -29
gobby/mcp_proxy/tools/tasks/_lifecycle_validation.py +18 -29
gobby/mcp_proxy/tools/workflows.py +1 -1
gobby/mcp_proxy/tools/worktrees.py +5 -0
gobby/memory/backends/__init__.py +6 -1
gobby/memory/backends/mem0.py +6 -1
gobby/memory/extractor.py +477 -0
gobby/memory/manager.py +11 -2
gobby/prompts/defaults/handoff/compact.md +63 -0
gobby/prompts/defaults/handoff/session_end.md +57 -0
gobby/prompts/defaults/memory/extract.md +61 -0
gobby/runner.py +37 -16
gobby/search/__init__.py +48 -6
gobby/search/backends/__init__.py +159 -0
gobby/search/backends/embedding.py +225 -0
gobby/search/embeddings.py +238 -0
gobby/search/models.py +148 -0
gobby/search/unified.py +496 -0
gobby/servers/http.py +23 -8
gobby/servers/routes/admin.py +280 -0
gobby/servers/routes/mcp/tools.py +241 -52
gobby/servers/websocket.py +2 -2
gobby/sessions/analyzer.py +2 -0
gobby/sessions/transcripts/base.py +1 -0
gobby/sessions/transcripts/claude.py +64 -5
gobby/skills/__init__.py +91 -0
gobby/skills/loader.py +685 -0
gobby/skills/manager.py +384 -0
gobby/skills/parser.py +258 -0
gobby/skills/search.py +463 -0
gobby/skills/sync.py +119 -0
gobby/skills/updater.py +385 -0
gobby/skills/validator.py +368 -0
gobby/storage/clones.py +378 -0
gobby/storage/database.py +1 -1
gobby/storage/memories.py +43 -13
gobby/storage/migrations.py +180 -6
gobby/storage/sessions.py +73 -0
gobby/storage/skills.py +749 -0
gobby/storage/tasks/_crud.py +4 -4
gobby/storage/tasks/_lifecycle.py +41 -6
gobby/storage/tasks/_manager.py +14 -5
gobby/storage/tasks/_models.py +8 -3
gobby/sync/memories.py +39 -4
gobby/sync/tasks.py +83 -6
gobby/tasks/__init__.py +1 -2
gobby/tasks/validation.py +24 -15
gobby/tui/api_client.py +4 -7
gobby/tui/app.py +5 -3
gobby/tui/screens/orchestrator.py +1 -2
gobby/tui/screens/tasks.py +2 -4
gobby/tui/ws_client.py +1 -1
gobby/utils/daemon_client.py +2 -2
gobby/workflows/actions.py +84 -2
gobby/workflows/context_actions.py +43 -0
gobby/workflows/detection_helpers.py +115 -31
gobby/workflows/engine.py +13 -2
gobby/workflows/lifecycle_evaluator.py +29 -1
gobby/workflows/loader.py +19 -6
gobby/workflows/memory_actions.py +74 -0
gobby/workflows/summary_actions.py +17 -0
gobby/workflows/task_enforcement_actions.py +448 -6
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/METADATA +82 -21
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/RECORD +136 -107
gobby/install/codex/prompts/forget.md +0 -7
gobby/install/codex/prompts/memories.md +0 -7
gobby/install/codex/prompts/recall.md +0 -7
gobby/install/codex/prompts/remember.md +0 -13
gobby/llm/gemini_executor.py +0 -339
gobby/mcp_proxy/tools/task_expansion.py +0 -591
gobby/tasks/context.py +0 -747
gobby/tasks/criteria.py +0 -342
gobby/tasks/expansion.py +0 -626
gobby/tasks/prompts/expand.py +0 -327
gobby/tasks/research.py +0 -421
gobby/tasks/tdd.py +0 -352
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/WHEEL +0 -0
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/entry_points.txt +0 -0
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/licenses/LICENSE.md +0 -0
{gobby-0.2.5.dist-info → gobby-0.2.6.dist-info}/top_level.txt +0 -0

gobby/llm/resolver.py CHANGED Viewed

@@ -259,8 +259,13 @@ def create_executor(
     """
     Create an AgentExecutor for the given provider.
+    Routing strategy:
+    - api_key and adc auth modes: Route to LiteLLMExecutor for unified cost tracking
+    - subscription mode (Claude): Route to ClaudeExecutor (Claude Agent SDK)
+    - cli mode (Codex): Route to CodexExecutor (Codex CLI subprocess)
     Args:
-        provider: Provider name (claude, gemini, litellm).
+        provider: Provider name (claude, gemini, litellm, codex).
         config: Optional daemon config for provider settings.
         model: Optional model override.
@@ -279,19 +284,40 @@ def create_executor(
     if config and config.llm_providers:
         provider_config = getattr(config.llm_providers, provider, None)
+    # Determine auth_mode from config
+    auth_mode = "api_key"  # Default
+    if provider_config:
+        auth_mode = getattr(provider_config, "auth_mode", "api_key") or "api_key"
     try:
-        if provider == "claude":
+        # Route based on auth_mode:
+        # - subscription (Claude) -> ClaudeExecutor
+        # - cli (Codex) -> CodexExecutor
+        # - api_key/adc (all providers) -> LiteLLMExecutor
+        if provider == "claude" and auth_mode == "subscription":
+            # Subscription mode requires Claude Agent SDK
             return _create_claude_executor(provider_config, model)
-        elif provider == "gemini":
-            return _create_gemini_executor(provider_config, model)
+        elif provider == "codex" and auth_mode in ("subscription", "cli"):
+            # CLI mode requires Codex CLI subprocess
+            return _create_codex_executor(provider_config, model, auth_mode)
         elif provider == "litellm":
+            # Direct LiteLLM usage
             return _create_litellm_executor(provider_config, config, model)
-        elif provider == "codex":
-            return _create_codex_executor(provider_config, model)
+        elif auth_mode in ("api_key", "adc"):
+            # Route all api_key and adc modes through LiteLLM for unified cost tracking
+            return _create_litellm_executor_for_provider(
+                provider, auth_mode, provider_config, config, model
+            )
         else:
             raise ExecutorCreationError(
                 provider,
-                f"Unknown provider. Supported: {list(SUPPORTED_PROVIDERS)}",
+                f"Unknown provider/auth_mode combination: {provider}/{auth_mode}. "
+                f"Supported: {list(SUPPORTED_PROVIDERS)}",
             )
     except ProviderError:
         raise
@@ -303,15 +329,18 @@ def _create_claude_executor(
     provider_config: "LLMProviderConfig | None",
     model: str | None,
 ) -> AgentExecutor:
-    """Create ClaudeExecutor with appropriate auth mode."""
+    """
+    Create ClaudeExecutor for subscription mode only.
+    Note: api_key mode is now routed through LiteLLMExecutor for unified cost tracking.
+    This function should only be called when auth_mode is "subscription".
+    """
     from gobby.llm.claude_executor import ClaudeExecutor
-    # Determine auth mode and model from config
-    auth_mode = "api_key"
+    # Subscription mode only - api_key mode routes through LiteLLM
     default_model = "claude-sonnet-4-20250514"
     if provider_config:
-        auth_mode = getattr(provider_config, "auth_mode", "api_key") or "api_key"
         # Get first model from comma-separated list if set
         models_str = getattr(provider_config, "models", None)
         if models_str:
@@ -320,46 +349,71 @@ def _create_claude_executor(
                 default_model = models[0]
     return ClaudeExecutor(
-        auth_mode=auth_mode,  # type: ignore[arg-type]
+        auth_mode="subscription",
         default_model=model or default_model,
     )
-def _create_gemini_executor(
+def _create_litellm_executor(
     provider_config: "LLMProviderConfig | None",
+    config: "DaemonConfig | None",
     model: str | None,
 ) -> AgentExecutor:
-    """Create GeminiExecutor with appropriate auth mode."""
-    from gobby.llm.gemini_executor import GeminiExecutor
+    """Create LiteLLMExecutor with API keys from config (direct litellm usage)."""
+    from gobby.llm.litellm_executor import LiteLLMExecutor
-    # Determine auth mode and model from config
-    auth_mode = "api_key"
-    default_model = "gemini-2.0-flash"
+    # Determine model and API base from config
+    default_model = "gpt-4o-mini"
+    api_base = None
+    api_keys: dict[str, str] | None = None
     if provider_config:
-        auth_mode = getattr(provider_config, "auth_mode", "api_key") or "api_key"
         models_str = getattr(provider_config, "models", None)
         if models_str:
             models = [m.strip() for m in models_str.split(",") if m.strip()]
             if models:
                 default_model = models[0]
+        api_base = getattr(provider_config, "api_base", None)
-    return GeminiExecutor(
-        auth_mode=auth_mode,  # type: ignore[arg-type]
+    # Get API keys from llm_providers.api_keys
+    if config and config.llm_providers:
+        api_keys = config.llm_providers.api_keys or None
+    return LiteLLMExecutor(
         default_model=model or default_model,
+        api_base=api_base,
+        api_keys=api_keys,
     )
-def _create_litellm_executor(
+def _create_litellm_executor_for_provider(
+    provider: str,
+    auth_mode: str,
     provider_config: "LLMProviderConfig | None",
     config: "DaemonConfig | None",
     model: str | None,
 ) -> AgentExecutor:
-    """Create LiteLLMExecutor with API keys from config."""
+    """
+    Create LiteLLMExecutor configured for a specific provider's api_key/adc mode.
+    This routes provider-specific calls through LiteLLM for unified cost tracking:
+    - Claude (api_key) -> anthropic/model
+    - Gemini (api_key) -> gemini/model
+    - Gemini (adc) -> vertex_ai/model
+    - Codex/OpenAI (api_key) -> model (no prefix)
+    """
     from gobby.llm.litellm_executor import LiteLLMExecutor
-    # Determine model and API base from config
-    default_model = "gpt-4o-mini"
+    # Default models per provider
+    default_models = {
+        "claude": "claude-sonnet-4-20250514",
+        "gemini": "gemini-2.0-flash",
+        "codex": "gpt-4o",
+        "openai": "gpt-4o",
+    }
+    # Determine model from config
+    default_model = default_models.get(provider, "gpt-4o-mini")
     api_base = None
     api_keys: dict[str, str] | None = None
@@ -375,34 +429,42 @@ def _create_litellm_executor(
     if config and config.llm_providers:
         api_keys = config.llm_providers.api_keys or None
+    # Cast auth_mode to the expected literal type
+    litellm_auth_mode = auth_mode if auth_mode in ("api_key", "adc") else "api_key"
     return LiteLLMExecutor(
         default_model=model or default_model,
         api_base=api_base,
         api_keys=api_keys,
+        provider=provider,  # type: ignore[arg-type]
+        auth_mode=litellm_auth_mode,  # type: ignore[arg-type]
     )
 def _create_codex_executor(
     provider_config: "LLMProviderConfig | None",
     model: str | None,
+    auth_mode: str = "subscription",
 ) -> AgentExecutor:
     """
-    Create CodexExecutor with appropriate auth mode.
+    Create CodexExecutor for subscription/CLI mode only.
+    Note: api_key mode is now routed through LiteLLMExecutor for unified cost tracking.
+    This function should only be called when auth_mode is "subscription" or "cli".
-    Codex supports two modes with different capabilities:
-    - api_key: OpenAI API with function calling (full tool injection)
-    - subscription: Codex CLI with ChatGPT subscription (no custom tools)
+    CLI mode uses Codex CLI subprocess - no custom tool injection supported.
-    See CodexExecutor docstring for detailed mode differences.
+    Args:
+        provider_config: Provider configuration.
+        model: Optional model override.
+        auth_mode: Authentication mode - "subscription" or "cli".
     """
     from gobby.llm.codex_executor import CodexExecutor
-    # Determine auth mode and model from config
-    auth_mode = "api_key"
+    # CLI/subscription mode only - api_key mode routes through LiteLLM
     default_model = "gpt-4o"
     if provider_config:
-        auth_mode = getattr(provider_config, "auth_mode", "api_key") or "api_key"
         models_str = getattr(provider_config, "models", None)
         if models_str:
             models = [m.strip() for m in models_str.split(",") if m.strip()]

gobby/mcp_proxy/instructions.py ADDED Viewed

@@ -0,0 +1,54 @@
+"""Gobby MCP server instructions.
+Provides XML-structured instructions that teach agents how to use Gobby correctly.
+These instructions are injected into the MCP server via FastMCP's `instructions` parameter.
+"""
+def build_gobby_instructions() -> str:
+    """Build XML-structured instructions for Gobby MCP server.
+    These instructions teach agents how to use Gobby correctly.
+    Every agent connecting to Gobby receives these automatically.
+    The instructions cover:
+    - Session startup sequence
+    - Progressive tool disclosure pattern
+    - Progressive skill disclosure pattern
+    - Critical rules for task management
+    Returns:
+        XML-structured instructions string
+    """
+    return """<gobby_system>
+<startup>
+At the start of EVERY session:
+1. `list_mcp_servers()` — Discover available servers
+2. `list_skills()` — Discover available skills
+3. Session ID: Look for `session_id: <uuid>` in your context.
+   If missing, call:
+   `call_tool("gobby-sessions", "get_current", {"external_id": "<your-session-id>", "source": "claude"})`
+</startup>
+<tool_discovery>
+NEVER assume tool schemas. Use progressive disclosure:
+1. `list_tools(server="...")` — Lightweight metadata (~100 tokens/tool)
+2. `get_tool_schema(server, tool)` — Full schema when needed
+3. `call_tool(server, tool, args)` — Execute
+</tool_discovery>
+<skill_discovery>
+Skills provide detailed guidance. Use progressive disclosure:
+1. `list_skills()` — Already done at startup
+2. `get_skill(name="...")` — Full content when needed
+3. `search_skills(query="...")` — Find by task description
+</skill_discovery>
+<rules>
+- Create/claim a task before using Edit, Write, or NotebookEdit tools
+- Pass session_id to create_task (required), claim_task (required), and close_task (optional, for tracking)
+- NEVER load all tool schemas upfront — use progressive disclosure
+</rules>
+</gobby_system>"""

gobby/mcp_proxy/models.py CHANGED Viewed

@@ -31,6 +31,21 @@ class MCPError(Exception):
         self.code = code
+class ToolProxyErrorCode(str, Enum):
+    """Structured error codes for ToolProxyService responses.
+    Used by _process_tool_proxy_result to determine HTTP status codes
+    without fragile string matching.
+    """
+    SERVER_NOT_FOUND = "SERVER_NOT_FOUND"
+    SERVER_NOT_CONFIGURED = "SERVER_NOT_CONFIGURED"
+    TOOL_NOT_FOUND = "TOOL_NOT_FOUND"
+    INVALID_ARGUMENTS = "INVALID_ARGUMENTS"
+    EXECUTION_ERROR = "EXECUTION_ERROR"
+    CONNECTION_ERROR = "CONNECTION_ERROR"
 class HealthState(str, Enum):
     """Connection health state for monitoring."""

gobby/mcp_proxy/registries.py CHANGED Viewed

@@ -16,13 +16,14 @@ if TYPE_CHECKING:
     from gobby.mcp_proxy.services.tool_proxy import ToolProxyService
     from gobby.memory.manager import MemoryManager
     from gobby.sessions.manager import SessionManager
+    from gobby.storage.clones import LocalCloneManager
+    from gobby.storage.inter_session_messages import InterSessionMessageManager
     from gobby.storage.merge_resolutions import MergeResolutionManager
     from gobby.storage.session_messages import LocalSessionMessageManager
     from gobby.storage.sessions import LocalSessionManager
     from gobby.storage.tasks import LocalTaskManager
     from gobby.storage.worktrees import LocalWorktreeManager
     from gobby.sync.tasks import TaskSyncManager
-    from gobby.tasks.expansion import TaskExpander
     from gobby.tasks.validation import TaskValidator
     from gobby.worktrees.git import WorktreeGitManager
     from gobby.worktrees.merge import MergeResolver
@@ -36,7 +37,6 @@ def setup_internal_registries(
     memory_manager: MemoryManager | None = None,
     task_manager: LocalTaskManager | None = None,
     sync_manager: TaskSyncManager | None = None,
-    task_expander: TaskExpander | None = None,
     task_validator: TaskValidator | None = None,
     message_manager: LocalSessionMessageManager | None = None,
     local_session_manager: LocalSessionManager | None = None,
@@ -44,11 +44,13 @@ def setup_internal_registries(
     llm_service: LLMService | None = None,
     agent_runner: AgentRunner | None = None,
     worktree_storage: LocalWorktreeManager | None = None,
+    clone_storage: LocalCloneManager | None = None,
     git_manager: WorktreeGitManager | None = None,
     merge_storage: MergeResolutionManager | None = None,
     merge_resolver: MergeResolver | None = None,
     project_id: str | None = None,
     tool_proxy_getter: Callable[[], ToolProxyService | None] | None = None,
+    inter_session_message_manager: InterSessionMessageManager | None = None,
 ) -> InternalRegistryManager:
     """
     Setup internal MCP registries (tasks, messages, memory, metrics, agents, worktrees).
@@ -59,7 +61,6 @@ def setup_internal_registries(
         memory_manager: Memory manager for memory operations
         task_manager: Task storage manager
         sync_manager: Task sync manager for git sync
-        task_expander: Task expander for AI expansion
         task_validator: Task validator for validation
         message_manager: Message storage manager
         local_session_manager: Local session manager for session CRUD
@@ -73,6 +74,7 @@ def setup_internal_registries(
         project_id: Default project ID for worktree operations
         tool_proxy_getter: Callable that returns ToolProxyService for routing
             tool calls in in-process agents. Called lazily during agent execution.
+        inter_session_message_manager: Inter-session message manager for agent messaging
     Returns:
         InternalRegistryManager containing all registries
@@ -99,7 +101,6 @@ def setup_internal_registries(
             tasks_registry = create_task_registry(
                 task_manager=task_manager,
                 sync_manager=sync_manager,
-                task_expander=task_expander,
                 task_validator=task_validator,
                 config=_config,
                 agent_runner=agent_runner,
@@ -150,20 +151,42 @@ def setup_internal_registries(
     if metrics_manager is not None:
         from gobby.mcp_proxy.tools.metrics import create_metrics_registry
+        # Get daily budget from conductor config if available
+        daily_budget_usd = 50.0  # Default
+        if _config is not None:
+            conductor_config = _config.conductor
+            if conductor_config is not None:
+                daily_budget_usd = conductor_config.daily_budget_usd
         metrics_registry = create_metrics_registry(
             metrics_manager=metrics_manager,
+            session_storage=local_session_manager,
+            daily_budget_usd=daily_budget_usd,
         )
         manager.add_registry(metrics_registry)
-        logger.debug("Metrics registry initialized")
+        logger.debug("Metrics registry initialized with token tracking")
     # Initialize agents registry if agent_runner is available
     if agent_runner is not None:
+        from gobby.agents.registry import get_running_agent_registry
         from gobby.mcp_proxy.tools.agents import create_agents_registry
         agents_registry = create_agents_registry(
             runner=agent_runner,
             tool_proxy_getter=tool_proxy_getter,
         )
+        # Add inter-agent messaging tools if message manager is available
+        if inter_session_message_manager is not None:
+            from gobby.mcp_proxy.tools.agent_messaging import add_messaging_tools
+            add_messaging_tools(
+                registry=agents_registry,
+                message_manager=inter_session_message_manager,
+                agent_registry=get_running_agent_registry(),
+            )
+            logger.debug("Agent messaging tools added to agents registry")
         manager.add_registry(agents_registry)
         logger.debug("Agents registry initialized")
@@ -180,6 +203,32 @@ def setup_internal_registries(
         manager.add_registry(worktrees_registry)
         logger.debug("Worktrees registry initialized")
+    # Initialize clones registry if clone_storage is available
+    if clone_storage is not None:
+        from gobby.clones.git import CloneGitManager
+        from gobby.mcp_proxy.tools.clones import create_clones_registry
+        # Create CloneGitManager from the same repo path as WorktreeGitManager
+        clone_git_manager = None
+        if git_manager is not None:
+            try:
+                clone_git_manager = CloneGitManager(git_manager.repo_path)
+            except Exception as e:
+                logger.warning(f"Failed to create CloneGitManager: {e}")
+        # Only create clones registry if we have a git manager
+        if clone_git_manager is not None:
+            clones_registry = create_clones_registry(
+                clone_storage=clone_storage,
+                git_manager=clone_git_manager,
+                project_id=project_id or "",
+                agent_runner=agent_runner,
+            )
+            manager.add_registry(clones_registry)
+            logger.debug("Clones registry initialized")
+        else:
+            logger.debug("Clones registry not initialized: CloneGitManager not available")
     # Initialize merge resolution registry if merge components are available
     if merge_storage is not None and merge_resolver is not None:
         from gobby.mcp_proxy.tools.merge import create_merge_registry
@@ -204,6 +253,20 @@ def setup_internal_registries(
         manager.add_registry(hub_registry)
         logger.debug("Hub registry initialized")
+    # Initialize skills registry using the existing database from task_manager
+    # to avoid creating a duplicate connection that would leak
+    if task_manager is not None:
+        from gobby.mcp_proxy.tools.skills import create_skills_registry
+        skills_registry = create_skills_registry(
+            db=task_manager.db,
+            project_id=project_id,
+        )
+        manager.add_registry(skills_registry)
+        logger.debug("Skills registry initialized")
+    else:
+        logger.debug("Skills registry not initialized: task_manager is None")
     logger.info(f"Internal registries initialized: {len(manager)} registries")
     return manager

gobby/mcp_proxy/server.py CHANGED Viewed

@@ -2,13 +2,16 @@
 Gobby Daemon Tools MCP Server.
 """
+import json
 import logging
 from datetime import UTC
 from typing import Any
 from mcp.server.fastmcp import FastMCP
+from mcp.types import CallToolResult, TextContent
 from gobby.config.app import DaemonConfig
+from gobby.mcp_proxy.instructions import build_gobby_instructions
 from gobby.mcp_proxy.manager import MCPClientManager
 from gobby.mcp_proxy.services.recommendation import RecommendationService, SearchMode
 from gobby.mcp_proxy.services.server_mgmt import ServerManagementService
@@ -96,8 +99,35 @@ class GobbyDaemonTools:
         tool_name: str,
         arguments: dict[str, Any] | None = None,
     ) -> Any:
-        """Call a tool."""
-        return await self.tool_proxy.call_tool(server_name, tool_name, arguments)
+        """Call a tool.
+        Returns the tool result, or a CallToolResult with isError=True if the
+        underlying service indicates an error. This ensures the MCP protocol
+        properly signals errors to LLM clients instead of returning error dicts
+        as successful responses.
+        """
+        result = await self.tool_proxy.call_tool(server_name, tool_name, arguments)
+        # Check if result indicates an error (ToolProxyService returns dict with success: False)
+        if isinstance(result, dict) and result.get("success") is False:
+            # Build helpful error message with schema hint if available
+            error_msg = result.get("error", "Unknown error")
+            hint = result.get("hint", "")
+            schema = result.get("schema")
+            parts = [f"Error: {error_msg}"]
+            if hint:
+                parts.append(f"\n{hint}")
+            if schema:
+                parts.append(f"\nCorrect schema:\n{json.dumps(schema, indent=2)}")
+            # Return MCP error response with isError=True
+            return CallToolResult(
+                content=[TextContent(type="text", text="\n".join(parts))],
+                isError=True,
+            )
+        return result
     async def list_tools(self, server: str, session_id: str | None = None) -> dict[str, Any]:
         """List tools for a specific server, optionally filtered by workflow phase restrictions."""
@@ -513,7 +543,7 @@ class GobbyDaemonTools:
 def create_mcp_server(tools_handler: GobbyDaemonTools) -> FastMCP:
     """Create the FastMCP server instance for the HTTP daemon."""
-    mcp = FastMCP("gobby")
+    mcp = FastMCP("gobby", instructions=build_gobby_instructions())
     # System tools
     mcp.add_tool(tools_handler.status)

gobby/mcp_proxy/services/tool_proxy.py CHANGED Viewed

@@ -4,7 +4,7 @@ import logging
 from typing import TYPE_CHECKING, Any
 from gobby.mcp_proxy.manager import MCPClientManager
-from gobby.mcp_proxy.models import MCPError
+from gobby.mcp_proxy.models import MCPError, ToolProxyErrorCode
 if TYPE_CHECKING:
     from gobby.mcp_proxy.services.fallback import ToolFallbackResolver
@@ -74,6 +74,70 @@ class ToolProxyService:
         return errors
+    def _is_argument_error(self, error_message: str) -> bool:
+        """Detect if error message suggests invalid arguments.
+        Used to determine whether to include tool schema in error response
+        to help the caller self-correct.
+        """
+        indicators = [
+            "parameter",
+            "argument",
+            "required",
+            "missing",
+            "invalid",
+            "unknown",
+            "expected",
+            "type error",
+            "validation",
+            "schema",
+            "property",
+            "field",
+            "400",
+            "422",
+            "-32602",  # JSON-RPC invalid params error code
+        ]
+        error_lower = error_message.lower()
+        return any(indicator in error_lower for indicator in indicators)
+    def _classify_error(self, error_message: str, exception: Exception) -> str:
+        """Classify an error into a structured error code.
+        Used to provide structured error codes that consumers can rely on
+        instead of fragile string matching.
+        Args:
+            error_message: The error message string
+            exception: The original exception
+        Returns:
+            ToolProxyErrorCode value as string
+        """
+        error_lower = error_message.lower()
+        # Check for server not found/configured errors
+        if "server" in error_lower:
+            if "not found" in error_lower:
+                return ToolProxyErrorCode.SERVER_NOT_FOUND.value
+            if "not configured" in error_lower:
+                return ToolProxyErrorCode.SERVER_NOT_CONFIGURED.value
+        # Check for tool not found
+        if "tool" in error_lower and "not found" in error_lower:
+            return ToolProxyErrorCode.TOOL_NOT_FOUND.value
+        # Check for argument/validation errors
+        if self._is_argument_error(error_message):
+            return ToolProxyErrorCode.INVALID_ARGUMENTS.value
+        # Check for connection errors
+        connection_indicators = ["connection", "timeout", "refused", "unreachable", "circuit"]
+        if any(ind in error_lower for ind in connection_indicators):
+            return ToolProxyErrorCode.CONNECTION_ERROR.value
+        # Default to execution error
+        return ToolProxyErrorCode.EXECUTION_ERROR.value
     async def list_tools(
         self,
         server_name: str,
@@ -193,10 +257,26 @@ class ToolProxyService:
             response: dict[str, Any] = {
                 "success": False,
                 "error": error_message,
+                "error_code": self._classify_error(error_message, e),
                 "server_name": server_name,
                 "tool_name": tool_name,
             }
+            # Enrich with schema if error looks like an argument validation error
+            if self._is_argument_error(error_message):
+                try:
+                    schema_result = await self.get_tool_schema(server_name, tool_name)
+                    if schema_result.get("success"):
+                        input_schema = schema_result.get("tool", {}).get("inputSchema", {})
+                        if input_schema:
+                            response["hint"] = (
+                                "This appears to be an argument error. "
+                                "Schema provided for self-correction."
+                            )
+                            response["schema"] = input_schema
+                except Exception as schema_error:
+                    logger.debug(f"Could not fetch schema for error enrichment: {schema_error}")
             # Get fallback suggestions if resolver is available
             if self._fallback_resolver:
                 try:

gobby/mcp_proxy/stdio.py CHANGED Viewed

@@ -22,6 +22,7 @@ from gobby.mcp_proxy.daemon_control import (
     start_daemon_process,
     stop_daemon_process,
 )
+from gobby.mcp_proxy.instructions import build_gobby_instructions
 from gobby.mcp_proxy.registries import setup_internal_registries
 __all__ = [
@@ -264,7 +265,7 @@ def create_stdio_mcp_server() -> FastMCP:
     _ = setup_internal_registries(config, session_manager, memory_manager)
     # Initialize MCP server and daemon proxy
-    mcp = FastMCP("gobby")
+    mcp = FastMCP("gobby", instructions=build_gobby_instructions())
     proxy = DaemonProxy(config.daemon_port)
     register_proxy_tools(mcp, proxy)

gobby/mcp_proxy/tools/__init__.py CHANGED Viewed

@@ -7,7 +7,6 @@ Provides factory functions for creating tool registries.
 # Main task registry (facade that merges all task-related registries)
 # Extracted task module registries (for direct use or testing)
 from gobby.mcp_proxy.tools.task_dependencies import create_dependency_registry
-from gobby.mcp_proxy.tools.task_expansion import create_expansion_registry
 from gobby.mcp_proxy.tools.task_github import create_github_sync_registry
 from gobby.mcp_proxy.tools.task_readiness import create_readiness_registry
 from gobby.mcp_proxy.tools.task_sync import create_sync_registry
@@ -19,7 +18,6 @@ __all__ = [
     "create_task_registry",
     # Extracted registries
     "create_dependency_registry",
-    "create_expansion_registry",
     "create_github_sync_registry",
     "create_readiness_registry",
     "create_sync_registry",

gobby 0.2.5__py3-none-any.whl → 0.2.6__py3-none-any.whl

gobby 0.2.5py3-none-any.whl → 0.2.6py3-none-any.whl