PyPI - gobby - Versions diffs - 0.2.5__py3-none-any.whl - Mend

gobby 0.2.5__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (383) hide show

gobby/__init__.py +3 -0
gobby/adapters/__init__.py +30 -0
gobby/adapters/base.py +93 -0
gobby/adapters/claude_code.py +276 -0
gobby/adapters/codex.py +1292 -0
gobby/adapters/gemini.py +343 -0
gobby/agents/__init__.py +37 -0
gobby/agents/codex_session.py +120 -0
gobby/agents/constants.py +112 -0
gobby/agents/context.py +362 -0
gobby/agents/definitions.py +133 -0
gobby/agents/gemini_session.py +111 -0
gobby/agents/registry.py +618 -0
gobby/agents/runner.py +968 -0
gobby/agents/session.py +259 -0
gobby/agents/spawn.py +916 -0
gobby/agents/spawners/__init__.py +77 -0
gobby/agents/spawners/base.py +142 -0
gobby/agents/spawners/cross_platform.py +266 -0
gobby/agents/spawners/embedded.py +225 -0
gobby/agents/spawners/headless.py +226 -0
gobby/agents/spawners/linux.py +125 -0
gobby/agents/spawners/macos.py +277 -0
gobby/agents/spawners/windows.py +308 -0
gobby/agents/tty_config.py +319 -0
gobby/autonomous/__init__.py +32 -0
gobby/autonomous/progress_tracker.py +447 -0
gobby/autonomous/stop_registry.py +269 -0
gobby/autonomous/stuck_detector.py +383 -0
gobby/cli/__init__.py +67 -0
gobby/cli/__main__.py +8 -0
gobby/cli/agents.py +529 -0
gobby/cli/artifacts.py +266 -0
gobby/cli/daemon.py +329 -0
gobby/cli/extensions.py +526 -0
gobby/cli/github.py +263 -0
gobby/cli/init.py +53 -0
gobby/cli/install.py +614 -0
gobby/cli/installers/__init__.py +37 -0
gobby/cli/installers/antigravity.py +65 -0
gobby/cli/installers/claude.py +363 -0
gobby/cli/installers/codex.py +192 -0
gobby/cli/installers/gemini.py +294 -0
gobby/cli/installers/git_hooks.py +377 -0
gobby/cli/installers/shared.py +737 -0
gobby/cli/linear.py +250 -0
gobby/cli/mcp.py +30 -0
gobby/cli/mcp_proxy.py +698 -0
gobby/cli/memory.py +304 -0
gobby/cli/merge.py +384 -0
gobby/cli/projects.py +79 -0
gobby/cli/sessions.py +622 -0
gobby/cli/tasks/__init__.py +30 -0
gobby/cli/tasks/_utils.py +658 -0
gobby/cli/tasks/ai.py +1025 -0
gobby/cli/tasks/commits.py +169 -0
gobby/cli/tasks/crud.py +685 -0
gobby/cli/tasks/deps.py +135 -0
gobby/cli/tasks/labels.py +63 -0
gobby/cli/tasks/main.py +273 -0
gobby/cli/tasks/search.py +178 -0
gobby/cli/tui.py +34 -0
gobby/cli/utils.py +513 -0
gobby/cli/workflows.py +927 -0
gobby/cli/worktrees.py +481 -0
gobby/config/__init__.py +129 -0
gobby/config/app.py +551 -0
gobby/config/extensions.py +167 -0
gobby/config/features.py +472 -0
gobby/config/llm_providers.py +98 -0
gobby/config/logging.py +66 -0
gobby/config/mcp.py +346 -0
gobby/config/persistence.py +247 -0
gobby/config/servers.py +141 -0
gobby/config/sessions.py +250 -0
gobby/config/tasks.py +784 -0
gobby/hooks/__init__.py +104 -0
gobby/hooks/artifact_capture.py +213 -0
gobby/hooks/broadcaster.py +243 -0
gobby/hooks/event_handlers.py +723 -0
gobby/hooks/events.py +218 -0
gobby/hooks/git.py +169 -0
gobby/hooks/health_monitor.py +171 -0
gobby/hooks/hook_manager.py +856 -0
gobby/hooks/hook_types.py +575 -0
gobby/hooks/plugins.py +813 -0
gobby/hooks/session_coordinator.py +396 -0
gobby/hooks/verification_runner.py +268 -0
gobby/hooks/webhooks.py +339 -0
gobby/install/claude/commands/gobby/bug.md +51 -0
gobby/install/claude/commands/gobby/chore.md +51 -0
gobby/install/claude/commands/gobby/epic.md +52 -0
gobby/install/claude/commands/gobby/eval.md +235 -0
gobby/install/claude/commands/gobby/feat.md +49 -0
gobby/install/claude/commands/gobby/nit.md +52 -0
gobby/install/claude/commands/gobby/ref.md +52 -0
gobby/install/claude/hooks/HOOK_SCHEMAS.md +632 -0
gobby/install/claude/hooks/hook_dispatcher.py +364 -0
gobby/install/claude/hooks/validate_settings.py +102 -0
gobby/install/claude/hooks-template.json +118 -0
gobby/install/codex/hooks/hook_dispatcher.py +153 -0
gobby/install/codex/prompts/forget.md +7 -0
gobby/install/codex/prompts/memories.md +7 -0
gobby/install/codex/prompts/recall.md +7 -0
gobby/install/codex/prompts/remember.md +13 -0
gobby/install/gemini/hooks/hook_dispatcher.py +268 -0
gobby/install/gemini/hooks-template.json +138 -0
gobby/install/shared/plugins/code_guardian.py +456 -0
gobby/install/shared/plugins/example_notify.py +331 -0
gobby/integrations/__init__.py +10 -0
gobby/integrations/github.py +145 -0
gobby/integrations/linear.py +145 -0
gobby/llm/__init__.py +40 -0
gobby/llm/base.py +120 -0
gobby/llm/claude.py +578 -0
gobby/llm/claude_executor.py +503 -0
gobby/llm/codex.py +322 -0
gobby/llm/codex_executor.py +513 -0
gobby/llm/executor.py +316 -0
gobby/llm/factory.py +34 -0
gobby/llm/gemini.py +258 -0
gobby/llm/gemini_executor.py +339 -0
gobby/llm/litellm.py +287 -0
gobby/llm/litellm_executor.py +303 -0
gobby/llm/resolver.py +499 -0
gobby/llm/service.py +236 -0
gobby/mcp_proxy/__init__.py +29 -0
gobby/mcp_proxy/actions.py +175 -0
gobby/mcp_proxy/daemon_control.py +198 -0
gobby/mcp_proxy/importer.py +436 -0
gobby/mcp_proxy/lazy.py +325 -0
gobby/mcp_proxy/manager.py +798 -0
gobby/mcp_proxy/metrics.py +609 -0
gobby/mcp_proxy/models.py +139 -0
gobby/mcp_proxy/registries.py +215 -0
gobby/mcp_proxy/schema_hash.py +381 -0
gobby/mcp_proxy/semantic_search.py +706 -0
gobby/mcp_proxy/server.py +549 -0
gobby/mcp_proxy/services/__init__.py +0 -0
gobby/mcp_proxy/services/fallback.py +306 -0
gobby/mcp_proxy/services/recommendation.py +224 -0
gobby/mcp_proxy/services/server_mgmt.py +214 -0
gobby/mcp_proxy/services/system.py +72 -0
gobby/mcp_proxy/services/tool_filter.py +231 -0
gobby/mcp_proxy/services/tool_proxy.py +309 -0
gobby/mcp_proxy/stdio.py +565 -0
gobby/mcp_proxy/tools/__init__.py +27 -0
gobby/mcp_proxy/tools/agents.py +1103 -0
gobby/mcp_proxy/tools/artifacts.py +207 -0
gobby/mcp_proxy/tools/hub.py +335 -0
gobby/mcp_proxy/tools/internal.py +337 -0
gobby/mcp_proxy/tools/memory.py +543 -0
gobby/mcp_proxy/tools/merge.py +422 -0
gobby/mcp_proxy/tools/metrics.py +283 -0
gobby/mcp_proxy/tools/orchestration/__init__.py +23 -0
gobby/mcp_proxy/tools/orchestration/cleanup.py +619 -0
gobby/mcp_proxy/tools/orchestration/monitor.py +380 -0
gobby/mcp_proxy/tools/orchestration/orchestrate.py +746 -0
gobby/mcp_proxy/tools/orchestration/review.py +736 -0
gobby/mcp_proxy/tools/orchestration/utils.py +16 -0
gobby/mcp_proxy/tools/session_messages.py +1056 -0
gobby/mcp_proxy/tools/task_dependencies.py +219 -0
gobby/mcp_proxy/tools/task_expansion.py +591 -0
gobby/mcp_proxy/tools/task_github.py +393 -0
gobby/mcp_proxy/tools/task_linear.py +379 -0
gobby/mcp_proxy/tools/task_orchestration.py +77 -0
gobby/mcp_proxy/tools/task_readiness.py +522 -0
gobby/mcp_proxy/tools/task_sync.py +351 -0
gobby/mcp_proxy/tools/task_validation.py +843 -0
gobby/mcp_proxy/tools/tasks/__init__.py +25 -0
gobby/mcp_proxy/tools/tasks/_context.py +112 -0
gobby/mcp_proxy/tools/tasks/_crud.py +516 -0
gobby/mcp_proxy/tools/tasks/_factory.py +176 -0
gobby/mcp_proxy/tools/tasks/_helpers.py +129 -0
gobby/mcp_proxy/tools/tasks/_lifecycle.py +517 -0
gobby/mcp_proxy/tools/tasks/_lifecycle_validation.py +301 -0
gobby/mcp_proxy/tools/tasks/_resolution.py +55 -0
gobby/mcp_proxy/tools/tasks/_search.py +215 -0
gobby/mcp_proxy/tools/tasks/_session.py +125 -0
gobby/mcp_proxy/tools/workflows.py +973 -0
gobby/mcp_proxy/tools/worktrees.py +1264 -0
gobby/mcp_proxy/transports/__init__.py +0 -0
gobby/mcp_proxy/transports/base.py +95 -0
gobby/mcp_proxy/transports/factory.py +44 -0
gobby/mcp_proxy/transports/http.py +139 -0
gobby/mcp_proxy/transports/stdio.py +213 -0
gobby/mcp_proxy/transports/websocket.py +136 -0
gobby/memory/backends/__init__.py +116 -0
gobby/memory/backends/mem0.py +408 -0
gobby/memory/backends/memu.py +485 -0
gobby/memory/backends/null.py +111 -0
gobby/memory/backends/openmemory.py +537 -0
gobby/memory/backends/sqlite.py +304 -0
gobby/memory/context.py +87 -0
gobby/memory/manager.py +1001 -0
gobby/memory/protocol.py +451 -0
gobby/memory/search/__init__.py +66 -0
gobby/memory/search/text.py +127 -0
gobby/memory/viz.py +258 -0
gobby/prompts/__init__.py +13 -0
gobby/prompts/defaults/expansion/system.md +119 -0
gobby/prompts/defaults/expansion/user.md +48 -0
gobby/prompts/defaults/external_validation/agent.md +72 -0
gobby/prompts/defaults/external_validation/external.md +63 -0
gobby/prompts/defaults/external_validation/spawn.md +83 -0
gobby/prompts/defaults/external_validation/system.md +6 -0
gobby/prompts/defaults/features/import_mcp.md +22 -0
gobby/prompts/defaults/features/import_mcp_github.md +17 -0
gobby/prompts/defaults/features/import_mcp_search.md +16 -0
gobby/prompts/defaults/features/recommend_tools.md +32 -0
gobby/prompts/defaults/features/recommend_tools_hybrid.md +35 -0
gobby/prompts/defaults/features/recommend_tools_llm.md +30 -0
gobby/prompts/defaults/features/server_description.md +20 -0
gobby/prompts/defaults/features/server_description_system.md +6 -0
gobby/prompts/defaults/features/task_description.md +31 -0
gobby/prompts/defaults/features/task_description_system.md +6 -0
gobby/prompts/defaults/features/tool_summary.md +17 -0
gobby/prompts/defaults/features/tool_summary_system.md +6 -0
gobby/prompts/defaults/research/step.md +58 -0
gobby/prompts/defaults/validation/criteria.md +47 -0
gobby/prompts/defaults/validation/validate.md +38 -0
gobby/prompts/loader.py +346 -0
gobby/prompts/models.py +113 -0
gobby/py.typed +0 -0
gobby/runner.py +488 -0
gobby/search/__init__.py +23 -0
gobby/search/protocol.py +104 -0
gobby/search/tfidf.py +232 -0
gobby/servers/__init__.py +7 -0
gobby/servers/http.py +636 -0
gobby/servers/models.py +31 -0
gobby/servers/routes/__init__.py +23 -0
gobby/servers/routes/admin.py +416 -0
gobby/servers/routes/dependencies.py +118 -0
gobby/servers/routes/mcp/__init__.py +24 -0
gobby/servers/routes/mcp/hooks.py +135 -0
gobby/servers/routes/mcp/plugins.py +121 -0
gobby/servers/routes/mcp/tools.py +1337 -0
gobby/servers/routes/mcp/webhooks.py +159 -0
gobby/servers/routes/sessions.py +582 -0
gobby/servers/websocket.py +766 -0
gobby/sessions/__init__.py +13 -0
gobby/sessions/analyzer.py +322 -0
gobby/sessions/lifecycle.py +240 -0
gobby/sessions/manager.py +563 -0
gobby/sessions/processor.py +225 -0
gobby/sessions/summary.py +532 -0
gobby/sessions/transcripts/__init__.py +41 -0
gobby/sessions/transcripts/base.py +125 -0
gobby/sessions/transcripts/claude.py +386 -0
gobby/sessions/transcripts/codex.py +143 -0
gobby/sessions/transcripts/gemini.py +195 -0
gobby/storage/__init__.py +21 -0
gobby/storage/agents.py +409 -0
gobby/storage/artifact_classifier.py +341 -0
gobby/storage/artifacts.py +285 -0
gobby/storage/compaction.py +67 -0
gobby/storage/database.py +357 -0
gobby/storage/inter_session_messages.py +194 -0
gobby/storage/mcp.py +680 -0
gobby/storage/memories.py +562 -0
gobby/storage/merge_resolutions.py +550 -0
gobby/storage/migrations.py +860 -0
gobby/storage/migrations_legacy.py +1359 -0
gobby/storage/projects.py +166 -0
gobby/storage/session_messages.py +251 -0
gobby/storage/session_tasks.py +97 -0
gobby/storage/sessions.py +817 -0
gobby/storage/task_dependencies.py +223 -0
gobby/storage/tasks/__init__.py +42 -0
gobby/storage/tasks/_aggregates.py +180 -0
gobby/storage/tasks/_crud.py +449 -0
gobby/storage/tasks/_id.py +104 -0
gobby/storage/tasks/_lifecycle.py +311 -0
gobby/storage/tasks/_manager.py +889 -0
gobby/storage/tasks/_models.py +300 -0
gobby/storage/tasks/_ordering.py +119 -0
gobby/storage/tasks/_path_cache.py +110 -0
gobby/storage/tasks/_queries.py +343 -0
gobby/storage/tasks/_search.py +143 -0
gobby/storage/workflow_audit.py +393 -0
gobby/storage/worktrees.py +547 -0
gobby/sync/__init__.py +29 -0
gobby/sync/github.py +333 -0
gobby/sync/linear.py +304 -0
gobby/sync/memories.py +284 -0
gobby/sync/tasks.py +641 -0
gobby/tasks/__init__.py +8 -0
gobby/tasks/build_verification.py +193 -0
gobby/tasks/commits.py +633 -0
gobby/tasks/context.py +747 -0
gobby/tasks/criteria.py +342 -0
gobby/tasks/enhanced_validator.py +226 -0
gobby/tasks/escalation.py +263 -0
gobby/tasks/expansion.py +626 -0
gobby/tasks/external_validator.py +764 -0
gobby/tasks/issue_extraction.py +171 -0
gobby/tasks/prompts/expand.py +327 -0
gobby/tasks/research.py +421 -0
gobby/tasks/tdd.py +352 -0
gobby/tasks/tree_builder.py +263 -0
gobby/tasks/validation.py +712 -0
gobby/tasks/validation_history.py +357 -0
gobby/tasks/validation_models.py +89 -0
gobby/tools/__init__.py +0 -0
gobby/tools/summarizer.py +170 -0
gobby/tui/__init__.py +5 -0
gobby/tui/api_client.py +281 -0
gobby/tui/app.py +327 -0
gobby/tui/screens/__init__.py +25 -0
gobby/tui/screens/agents.py +333 -0
gobby/tui/screens/chat.py +450 -0
gobby/tui/screens/dashboard.py +377 -0
gobby/tui/screens/memory.py +305 -0
gobby/tui/screens/metrics.py +231 -0
gobby/tui/screens/orchestrator.py +904 -0
gobby/tui/screens/sessions.py +412 -0
gobby/tui/screens/tasks.py +442 -0
gobby/tui/screens/workflows.py +289 -0
gobby/tui/screens/worktrees.py +174 -0
gobby/tui/widgets/__init__.py +21 -0
gobby/tui/widgets/chat.py +210 -0
gobby/tui/widgets/conductor.py +104 -0
gobby/tui/widgets/menu.py +132 -0
gobby/tui/widgets/message_panel.py +160 -0
gobby/tui/widgets/review_gate.py +224 -0
gobby/tui/widgets/task_tree.py +99 -0
gobby/tui/widgets/token_budget.py +166 -0
gobby/tui/ws_client.py +258 -0
gobby/utils/__init__.py +3 -0
gobby/utils/daemon_client.py +235 -0
gobby/utils/git.py +222 -0
gobby/utils/id.py +38 -0
gobby/utils/json_helpers.py +161 -0
gobby/utils/logging.py +376 -0
gobby/utils/machine_id.py +135 -0
gobby/utils/metrics.py +589 -0
gobby/utils/project_context.py +182 -0
gobby/utils/project_init.py +263 -0
gobby/utils/status.py +256 -0
gobby/utils/validation.py +80 -0
gobby/utils/version.py +23 -0
gobby/workflows/__init__.py +4 -0
gobby/workflows/actions.py +1310 -0
gobby/workflows/approval_flow.py +138 -0
gobby/workflows/artifact_actions.py +103 -0
gobby/workflows/audit_helpers.py +110 -0
gobby/workflows/autonomous_actions.py +286 -0
gobby/workflows/context_actions.py +394 -0
gobby/workflows/definitions.py +130 -0
gobby/workflows/detection_helpers.py +208 -0
gobby/workflows/engine.py +485 -0
gobby/workflows/evaluator.py +669 -0
gobby/workflows/git_utils.py +96 -0
gobby/workflows/hooks.py +169 -0
gobby/workflows/lifecycle_evaluator.py +613 -0
gobby/workflows/llm_actions.py +70 -0
gobby/workflows/loader.py +333 -0
gobby/workflows/mcp_actions.py +60 -0
gobby/workflows/memory_actions.py +272 -0
gobby/workflows/premature_stop.py +164 -0
gobby/workflows/session_actions.py +139 -0
gobby/workflows/state_actions.py +123 -0
gobby/workflows/state_manager.py +104 -0
gobby/workflows/stop_signal_actions.py +163 -0
gobby/workflows/summary_actions.py +344 -0
gobby/workflows/task_actions.py +249 -0
gobby/workflows/task_enforcement_actions.py +901 -0
gobby/workflows/templates.py +52 -0
gobby/workflows/todo_actions.py +84 -0
gobby/workflows/webhook.py +223 -0
gobby/workflows/webhook_executor.py +399 -0
gobby/worktrees/__init__.py +5 -0
gobby/worktrees/git.py +690 -0
gobby/worktrees/merge/__init__.py +20 -0
gobby/worktrees/merge/conflict_parser.py +177 -0
gobby/worktrees/merge/resolver.py +485 -0
gobby-0.2.5.dist-info/METADATA +351 -0
gobby-0.2.5.dist-info/RECORD +383 -0
gobby-0.2.5.dist-info/WHEEL +5 -0
gobby-0.2.5.dist-info/entry_points.txt +2 -0
gobby-0.2.5.dist-info/licenses/LICENSE.md +193 -0
gobby-0.2.5.dist-info/top_level.txt +1 -0

gobby/mcp_proxy/services/fallback.py ADDED Viewed

@@ -0,0 +1,306 @@
+"""Tool fallback resolution service.
+Provides alternative tool suggestions when a tool call fails,
+using semantic similarity and success rate weighting.
+"""
+from __future__ import annotations
+import logging
+from dataclasses import dataclass
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    from gobby.mcp_proxy.metrics import ToolMetricsManager
+    from gobby.mcp_proxy.semantic_search import SemanticToolSearch
+logger = logging.getLogger(__name__)
+@dataclass
+class FallbackSuggestion:
+    """A suggested alternative tool."""
+    server_name: str
+    tool_name: str
+    description: str | None
+    similarity: float
+    success_rate: float | None
+    score: float  # Combined ranking score
+    def to_dict(self) -> dict[str, Any]:
+        """Convert to dictionary."""
+        return {
+            "server_name": self.server_name,
+            "tool_name": self.tool_name,
+            "description": self.description,
+            "similarity": round(self.similarity, 4),
+            "success_rate": round(self.success_rate, 4) if self.success_rate else None,
+            "score": round(self.score, 4),
+        }
+class ToolFallbackResolver:
+    """
+    Resolves alternative tools when a tool call fails.
+    Uses semantic similarity search to find similar tools and
+    weights results by historical success rate from metrics.
+    """
+    # Default weight for similarity vs success_rate in scoring
+    DEFAULT_SIMILARITY_WEIGHT = 0.7
+    DEFAULT_SUCCESS_WEIGHT = 0.3
+    # Minimum similarity threshold for candidates
+    DEFAULT_MIN_SIMILARITY = 0.3
+    # Default success rate when no metrics available
+    DEFAULT_SUCCESS_RATE = 0.5
+    def __init__(
+        self,
+        semantic_search: SemanticToolSearch,
+        metrics_manager: ToolMetricsManager | None = None,
+        similarity_weight: float = DEFAULT_SIMILARITY_WEIGHT,
+        success_weight: float = DEFAULT_SUCCESS_WEIGHT,
+        min_similarity: float = DEFAULT_MIN_SIMILARITY,
+    ):
+        """
+        Initialize the fallback resolver.
+        Args:
+            semantic_search: SemanticToolSearch instance for finding similar tools
+            metrics_manager: Optional ToolMetricsManager for success rate data
+            similarity_weight: Weight for similarity score (0-1)
+            success_weight: Weight for success rate score (0-1)
+            min_similarity: Minimum similarity threshold for candidates
+        """
+        self._semantic_search = semantic_search
+        self._metrics_manager = metrics_manager
+        self._similarity_weight = similarity_weight
+        self._success_weight = success_weight
+        self._min_similarity = min_similarity
+    async def find_alternatives(
+        self,
+        failed_tool_name: str,
+        failed_tool_description: str | None = None,
+        error_context: str | None = None,
+        server_name: str | None = None,
+        project_id: str | None = None,
+        top_k: int = 5,
+        exclude_failed: bool = True,
+    ) -> list[FallbackSuggestion]:
+        """
+        Find alternative tools similar to a failed tool.
+        Uses semantic search to find tools with similar descriptions,
+        then weights by historical success rate.
+        Args:
+            failed_tool_name: Name of the tool that failed
+            failed_tool_description: Description of the failed tool (if available)
+            error_context: Error message or context for better matching
+            server_name: Server the failed tool belongs to (for exclusion)
+            project_id: Project ID for scoping the search
+            top_k: Maximum number of suggestions to return
+            exclude_failed: Whether to exclude the failed tool from results
+        Returns:
+            List of FallbackSuggestion sorted by combined score (descending)
+        """
+        if not project_id:
+            logger.warning("No project_id provided for fallback search")
+            return []
+        # Build query from tool info and error context
+        query = self._build_search_query(failed_tool_name, failed_tool_description, error_context)
+        # Get semantically similar tools
+        try:
+            search_results = await self._semantic_search.search_tools(
+                query=query,
+                project_id=project_id,
+                top_k=top_k * 2,  # Get extra for filtering
+                min_similarity=self._min_similarity,
+            )
+        except Exception as e:
+            logger.error(f"Semantic search failed in fallback resolver: {e}")
+            return []
+        if not search_results:
+            logger.debug(f"No semantic matches found for '{failed_tool_name}'")
+            return []
+        # Filter out the failed tool if requested
+        if exclude_failed:
+            search_results = [
+                r
+                for r in search_results
+                if not (r.tool_name == failed_tool_name and r.server_name == server_name)
+            ]
+        # Enrich with success rates and compute combined scores
+        suggestions = []
+        for result in search_results[:top_k]:
+            success_rate = self._get_success_rate(result.server_name, result.tool_name, project_id)
+            score = self._compute_score(result.similarity, success_rate)
+            suggestions.append(
+                FallbackSuggestion(
+                    server_name=result.server_name,
+                    tool_name=result.tool_name,
+                    description=result.description,
+                    similarity=result.similarity,
+                    success_rate=success_rate,
+                    score=score,
+                )
+            )
+        # Sort by combined score (descending)
+        suggestions.sort(key=lambda s: s.score, reverse=True)
+        logger.debug(f"Found {len(suggestions)} fallback suggestions for '{failed_tool_name}'")
+        return suggestions
+    def _build_search_query(
+        self,
+        tool_name: str,
+        description: str | None,
+        error_context: str | None,
+    ) -> str:
+        """
+        Build a search query from tool info and error context.
+        Args:
+            tool_name: Name of the failed tool
+            description: Tool description
+            error_context: Error message or context
+        Returns:
+            Search query string
+        """
+        parts = [f"Tool similar to: {tool_name}"]
+        if description:
+            parts.append(f"Description: {description}")
+        if error_context:
+            # Extract key terms from error, avoiding noise
+            parts.append(f"Context: {error_context[:200]}")
+        return "\n".join(parts)
+    def _get_success_rate(self, server_name: str, tool_name: str, project_id: str) -> float | None:
+        """
+        Get success rate for a tool from metrics.
+        Args:
+            server_name: Server name
+            tool_name: Tool name
+            project_id: Project ID
+        Returns:
+            Success rate (0-1) or None if no metrics available
+        """
+        if not self._metrics_manager:
+            return None
+        try:
+            return self._metrics_manager.get_tool_success_rate(
+                server_name=server_name,
+                tool_name=tool_name,
+                project_id=project_id,
+            )
+        except Exception as e:
+            logger.debug(f"Failed to get success rate for {server_name}/{tool_name}: {e}")
+            return None
+    def _compute_score(self, similarity: float, success_rate: float | None) -> float:
+        """
+        Compute combined ranking score.
+        Score = (similarity * similarity_weight) + (success_rate * success_weight)
+        When success_rate is None, uses default value to avoid penalizing
+        tools without metrics history.
+        Args:
+            similarity: Cosine similarity score (0-1)
+            success_rate: Historical success rate (0-1) or None
+        Returns:
+            Combined score (0-1)
+        """
+        effective_success_rate = (
+            success_rate if success_rate is not None else self.DEFAULT_SUCCESS_RATE
+        )
+        return similarity * self._similarity_weight + effective_success_rate * self._success_weight
+    async def find_alternatives_for_error(
+        self,
+        server_name: str,
+        tool_name: str,
+        error_message: str,
+        project_id: str,
+        top_k: int = 3,
+    ) -> list[dict[str, Any]]:
+        """
+        Convenience method for call_tool integration.
+        Takes error details and returns serialized suggestions.
+        Args:
+            server_name: Server where the tool failed
+            tool_name: Name of the failed tool
+            error_message: Error message from the failure
+            project_id: Project ID
+            top_k: Number of suggestions to return
+        Returns:
+            List of suggestion dictionaries ready for JSON response
+        """
+        # Try to get tool description from cached tools
+        description = await self._get_tool_description(server_name, tool_name)
+        suggestions = await self.find_alternatives(
+            failed_tool_name=tool_name,
+            failed_tool_description=description,
+            error_context=error_message,
+            server_name=server_name,
+            project_id=project_id,
+            top_k=top_k,
+        )
+        return [s.to_dict() for s in suggestions]
+    async def _get_tool_description(self, server_name: str, tool_name: str) -> str | None:
+        """
+        Get tool description from semantic search's cached data.
+        Args:
+            server_name: Server name
+            tool_name: Tool name
+        Returns:
+            Tool description or None
+        """
+        # The tool info is in the database, accessed via _get_tool_info_map
+        # But we don't have project_id here, so we search all
+        try:
+            row = self._semantic_search.db.fetchone(
+                """
+                SELECT t.description
+                FROM tools t
+                JOIN mcp_servers s ON t.mcp_server_id = s.id
+                WHERE s.name = ? AND t.name = ?
+                LIMIT 1
+                """,
+                (server_name, tool_name),
+            )
+            return row["description"] if row else None
+        except Exception:
+            return None

gobby/mcp_proxy/services/recommendation.py ADDED Viewed

@@ -0,0 +1,224 @@
+"""Recommendation service."""
+from __future__ import annotations
+import json
+import logging
+from typing import TYPE_CHECKING, Any, Literal
+if TYPE_CHECKING:
+    from gobby.config.app import RecommendToolsConfig
+logger = logging.getLogger("gobby.mcp.server")
+# Search mode type
+SearchMode = Literal["llm", "semantic", "hybrid"]
+class RecommendationService:
+    """Service for recommending tools."""
+    def __init__(
+        self,
+        llm_service: Any,
+        mcp_manager: Any,
+        semantic_search: Any | None = None,
+        project_id: str | None = None,
+        config: RecommendToolsConfig | None = None,
+    ):
+        self._llm_service = llm_service
+        self._mcp_manager = mcp_manager
+        self._semantic_search = semantic_search
+        self._project_id = project_id
+        self._config = config
+    def _get_config(self) -> RecommendToolsConfig:
+        """Get config with fallback to defaults."""
+        if self._config is not None:
+            return self._config
+        from gobby.config.app import RecommendToolsConfig
+        return RecommendToolsConfig()
+    async def recommend_tools(
+        self,
+        task_description: str,
+        agent_id: str | None = None,
+        search_mode: SearchMode = "llm",
+        top_k: int = 10,
+        min_similarity: float = 0.3,
+        project_id: str | None = None,
+    ) -> dict[str, Any]:
+        """
+        Recommend tools based on task description.
+        Args:
+            task_description: Description of what the user wants to do
+            agent_id: Optional agent ID for filtering (reserved for future use)
+            search_mode: How to search for tools:
+                - "llm": Use LLM to recommend (default, original behavior)
+                - "semantic": Use embedding similarity search
+                - "hybrid": Combine semantic search with LLM ranking
+            top_k: Maximum recommendations to return (for semantic/hybrid)
+            min_similarity: Minimum similarity threshold (for semantic/hybrid)
+            project_id: Project ID for semantic/hybrid search (overrides instance default)
+        Returns:
+            Dict with recommendations and metadata
+        """
+        # Use provided project_id or fall back to instance default
+        effective_project_id = project_id or self._project_id
+        if search_mode == "semantic":
+            return await self._recommend_semantic(
+                task_description, top_k, min_similarity, effective_project_id
+            )
+        elif search_mode == "hybrid":
+            return await self._recommend_hybrid(
+                task_description, top_k, min_similarity, effective_project_id
+            )
+        else:
+            return await self._recommend_llm(task_description)
+    async def _recommend_semantic(
+        self, task_description: str, top_k: int, min_similarity: float, project_id: str | None
+    ) -> dict[str, Any]:
+        """Recommend tools using semantic similarity search."""
+        if not self._semantic_search:
+            return {
+                "success": False,
+                "error": "Semantic search not configured",
+                "task": task_description,
+            }
+        if not project_id:
+            return {
+                "success": False,
+                "error": "Project ID not set for semantic search",
+                "task": task_description,
+            }
+        try:
+            results = await self._semantic_search.search_tools(
+                query=task_description,
+                project_id=project_id,
+                top_k=top_k,
+                min_similarity=min_similarity,
+            )
+            recommendations = [
+                {
+                    "server": r.server_name,
+                    "tool": r.tool_name,
+                    "reason": r.description or "Semantically similar to query",
+                    "similarity": round(r.similarity, 4),
+                }
+                for r in results
+            ]
+            return {
+                "success": True,
+                "task": task_description,
+                "search_mode": "semantic",
+                "recommendation": recommendations,
+                "recommendations": recommendations,
+                "total_results": len(results),
+            }
+        except Exception as e:
+            logger.error(f"Semantic search failed: {e}")
+            return {"success": False, "error": str(e), "task": task_description}
+    async def _recommend_hybrid(
+        self, task_description: str, top_k: int, min_similarity: float, project_id: str | None
+    ) -> dict[str, Any]:
+        """Recommend tools using semantic search + LLM re-ranking."""
+        # First get semantic results
+        semantic_result = await self._recommend_semantic(
+            task_description,
+            top_k * 2,
+            min_similarity,
+            project_id,  # Get more for re-ranking
+        )
+        if not semantic_result.get("success") or not semantic_result.get("recommendations"):
+            # Fall back to pure LLM if semantic fails
+            return await self._recommend_llm(task_description)
+        # Use LLM to re-rank and add reasoning
+        try:
+            config = self._get_config()
+            candidates = semantic_result["recommendations"]
+            candidate_list = "\n".join(
+                f"- {c['server']}/{c['tool']}: {c.get('reason', 'No description')}"
+                for c in candidates
+            )
+            prompt = config.hybrid_rerank_prompt.format(
+                task_description=task_description,
+                candidate_list=candidate_list,
+                top_k=top_k,
+            )
+            provider = self._llm_service.get_default_provider()
+            response = await provider.generate_text(prompt)
+            # Parse LLM response
+            if "```json" in response:
+                response = response.split("```json")[1].split("```")[0].strip()
+            elif "```" in response:
+                response = response.split("```")[1].split("```")[0].strip()
+            data = json.loads(response)
+            recommendations = data.get("recommendations", [])[:top_k]
+            return {
+                "success": True,
+                "task": task_description,
+                "search_mode": "hybrid",
+                "recommendation": recommendations,
+                "recommendations": recommendations,
+                "semantic_candidates": len(candidates),
+            }
+        except Exception as e:
+            logger.warning(f"Hybrid LLM re-ranking failed, using semantic results: {e}")
+            # Fall back to semantic results
+            semantic_result["search_mode"] = "hybrid_fallback"
+            return semantic_result
+    async def _recommend_llm(self, task_description: str) -> dict[str, Any]:
+        """Recommend tools using LLM (original behavior)."""
+        try:
+            config = self._get_config()
+            available_servers = self._mcp_manager.get_available_servers()
+            prompt = config.llm_prompt.format(
+                task_description=task_description,
+                available_servers=", ".join(available_servers),
+            )
+            provider = self._llm_service.get_default_provider()
+            response = await provider.generate_text(prompt)
+            try:
+                if "```json" in response:
+                    response = response.split("```json")[1].split("```")[0].strip()
+                elif "```" in response:
+                    response = response.split("```")[1].split("```")[0].strip()
+                data = json.loads(response)
+                recommendations = data.get("recommendations", [])
+            except (json.JSONDecodeError, KeyError, IndexError) as e:
+                recommendations = []
+                logger.warning(f"Failed to parse LLM recommendation response: {e}")
+            return {
+                "success": True,
+                "task": task_description,
+                "search_mode": "llm",
+                "recommendation": recommendations,
+                "recommendations": recommendations,
+                "available_servers": available_servers,
+            }
+        except Exception as e:
+            logger.error(f"Error generating recommendations: {e}")
+            return {"success": False, "error": str(e), "task": task_description}