RubyGems - codebase_index - Versions diffs - 0.1.0 - Mend

codebase_index 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (171) hide show

checksums.yaml +7 -0
data/CHANGELOG.md +29 -0
data/CODE_OF_CONDUCT.md +83 -0
data/CONTRIBUTING.md +65 -0
data/LICENSE.txt +21 -0
data/README.md +481 -0
data/exe/codebase-console-mcp +22 -0
data/exe/codebase-index-mcp +61 -0
data/exe/codebase-index-mcp-http +64 -0
data/exe/codebase-index-mcp-start +58 -0
data/lib/codebase_index/ast/call_site_extractor.rb +106 -0
data/lib/codebase_index/ast/method_extractor.rb +76 -0
data/lib/codebase_index/ast/node.rb +88 -0
data/lib/codebase_index/ast/parser.rb +653 -0
data/lib/codebase_index/ast.rb +6 -0
data/lib/codebase_index/builder.rb +137 -0
data/lib/codebase_index/chunking/chunk.rb +84 -0
data/lib/codebase_index/chunking/semantic_chunker.rb +290 -0
data/lib/codebase_index/console/adapters/cache_adapter.rb +58 -0
data/lib/codebase_index/console/adapters/good_job_adapter.rb +66 -0
data/lib/codebase_index/console/adapters/sidekiq_adapter.rb +66 -0
data/lib/codebase_index/console/adapters/solid_queue_adapter.rb +66 -0
data/lib/codebase_index/console/audit_logger.rb +75 -0
data/lib/codebase_index/console/bridge.rb +170 -0
data/lib/codebase_index/console/confirmation.rb +90 -0
data/lib/codebase_index/console/connection_manager.rb +173 -0
data/lib/codebase_index/console/console_response_renderer.rb +78 -0
data/lib/codebase_index/console/model_validator.rb +81 -0
data/lib/codebase_index/console/safe_context.rb +82 -0
data/lib/codebase_index/console/server.rb +557 -0
data/lib/codebase_index/console/sql_validator.rb +172 -0
data/lib/codebase_index/console/tools/tier1.rb +118 -0
data/lib/codebase_index/console/tools/tier2.rb +117 -0
data/lib/codebase_index/console/tools/tier3.rb +110 -0
data/lib/codebase_index/console/tools/tier4.rb +79 -0
data/lib/codebase_index/coordination/pipeline_lock.rb +109 -0
data/lib/codebase_index/cost_model/embedding_cost.rb +88 -0
data/lib/codebase_index/cost_model/estimator.rb +128 -0
data/lib/codebase_index/cost_model/provider_pricing.rb +67 -0
data/lib/codebase_index/cost_model/storage_cost.rb +52 -0
data/lib/codebase_index/cost_model.rb +22 -0
data/lib/codebase_index/db/migrations/001_create_units.rb +38 -0
data/lib/codebase_index/db/migrations/002_create_edges.rb +35 -0
data/lib/codebase_index/db/migrations/003_create_embeddings.rb +37 -0
data/lib/codebase_index/db/migrations/004_create_snapshots.rb +45 -0
data/lib/codebase_index/db/migrations/005_create_snapshot_units.rb +40 -0
data/lib/codebase_index/db/migrator.rb +71 -0
data/lib/codebase_index/db/schema_version.rb +73 -0
data/lib/codebase_index/dependency_graph.rb +227 -0
data/lib/codebase_index/embedding/indexer.rb +130 -0
data/lib/codebase_index/embedding/openai.rb +105 -0
data/lib/codebase_index/embedding/provider.rb +135 -0
data/lib/codebase_index/embedding/text_preparer.rb +112 -0
data/lib/codebase_index/evaluation/baseline_runner.rb +115 -0
data/lib/codebase_index/evaluation/evaluator.rb +146 -0
data/lib/codebase_index/evaluation/metrics.rb +79 -0
data/lib/codebase_index/evaluation/query_set.rb +148 -0
data/lib/codebase_index/evaluation/report_generator.rb +90 -0
data/lib/codebase_index/extracted_unit.rb +145 -0
data/lib/codebase_index/extractor.rb +956 -0
data/lib/codebase_index/extractors/action_cable_extractor.rb +228 -0
data/lib/codebase_index/extractors/ast_source_extraction.rb +46 -0
data/lib/codebase_index/extractors/behavioral_profile.rb +309 -0
data/lib/codebase_index/extractors/caching_extractor.rb +261 -0
data/lib/codebase_index/extractors/callback_analyzer.rb +232 -0
data/lib/codebase_index/extractors/concern_extractor.rb +253 -0
data/lib/codebase_index/extractors/configuration_extractor.rb +219 -0
data/lib/codebase_index/extractors/controller_extractor.rb +494 -0
data/lib/codebase_index/extractors/database_view_extractor.rb +278 -0
data/lib/codebase_index/extractors/decorator_extractor.rb +260 -0
data/lib/codebase_index/extractors/engine_extractor.rb +204 -0
data/lib/codebase_index/extractors/event_extractor.rb +211 -0
data/lib/codebase_index/extractors/factory_extractor.rb +289 -0
data/lib/codebase_index/extractors/graphql_extractor.rb +917 -0
data/lib/codebase_index/extractors/i18n_extractor.rb +117 -0
data/lib/codebase_index/extractors/job_extractor.rb +369 -0
data/lib/codebase_index/extractors/lib_extractor.rb +249 -0
data/lib/codebase_index/extractors/mailer_extractor.rb +339 -0
data/lib/codebase_index/extractors/manager_extractor.rb +202 -0
data/lib/codebase_index/extractors/middleware_extractor.rb +133 -0
data/lib/codebase_index/extractors/migration_extractor.rb +469 -0
data/lib/codebase_index/extractors/model_extractor.rb +960 -0
data/lib/codebase_index/extractors/phlex_extractor.rb +252 -0
data/lib/codebase_index/extractors/policy_extractor.rb +214 -0
data/lib/codebase_index/extractors/poro_extractor.rb +246 -0
data/lib/codebase_index/extractors/pundit_extractor.rb +223 -0
data/lib/codebase_index/extractors/rails_source_extractor.rb +473 -0
data/lib/codebase_index/extractors/rake_task_extractor.rb +343 -0
data/lib/codebase_index/extractors/route_extractor.rb +181 -0
data/lib/codebase_index/extractors/scheduled_job_extractor.rb +331 -0
data/lib/codebase_index/extractors/serializer_extractor.rb +334 -0
data/lib/codebase_index/extractors/service_extractor.rb +254 -0
data/lib/codebase_index/extractors/shared_dependency_scanner.rb +91 -0
data/lib/codebase_index/extractors/shared_utility_methods.rb +99 -0
data/lib/codebase_index/extractors/state_machine_extractor.rb +398 -0
data/lib/codebase_index/extractors/test_mapping_extractor.rb +225 -0
data/lib/codebase_index/extractors/validator_extractor.rb +225 -0
data/lib/codebase_index/extractors/view_component_extractor.rb +310 -0
data/lib/codebase_index/extractors/view_template_extractor.rb +261 -0
data/lib/codebase_index/feedback/gap_detector.rb +89 -0
data/lib/codebase_index/feedback/store.rb +119 -0
data/lib/codebase_index/flow_analysis/operation_extractor.rb +209 -0
data/lib/codebase_index/flow_analysis/response_code_mapper.rb +154 -0
data/lib/codebase_index/flow_assembler.rb +290 -0
data/lib/codebase_index/flow_document.rb +191 -0
data/lib/codebase_index/flow_precomputer.rb +102 -0
data/lib/codebase_index/formatting/base.rb +40 -0
data/lib/codebase_index/formatting/claude_adapter.rb +98 -0
data/lib/codebase_index/formatting/generic_adapter.rb +56 -0
data/lib/codebase_index/formatting/gpt_adapter.rb +64 -0
data/lib/codebase_index/formatting/human_adapter.rb +78 -0
data/lib/codebase_index/graph_analyzer.rb +374 -0
data/lib/codebase_index/mcp/index_reader.rb +394 -0
data/lib/codebase_index/mcp/renderers/claude_renderer.rb +81 -0
data/lib/codebase_index/mcp/renderers/json_renderer.rb +17 -0
data/lib/codebase_index/mcp/renderers/markdown_renderer.rb +352 -0
data/lib/codebase_index/mcp/renderers/plain_renderer.rb +240 -0
data/lib/codebase_index/mcp/server.rb +935 -0
data/lib/codebase_index/mcp/tool_response_renderer.rb +62 -0
data/lib/codebase_index/model_name_cache.rb +51 -0
data/lib/codebase_index/notion/client.rb +217 -0
data/lib/codebase_index/notion/exporter.rb +219 -0
data/lib/codebase_index/notion/mapper.rb +39 -0
data/lib/codebase_index/notion/mappers/column_mapper.rb +65 -0
data/lib/codebase_index/notion/mappers/migration_mapper.rb +39 -0
data/lib/codebase_index/notion/mappers/model_mapper.rb +164 -0
data/lib/codebase_index/notion/rate_limiter.rb +68 -0
data/lib/codebase_index/observability/health_check.rb +81 -0
data/lib/codebase_index/observability/instrumentation.rb +34 -0
data/lib/codebase_index/observability/structured_logger.rb +75 -0
data/lib/codebase_index/operator/error_escalator.rb +81 -0
data/lib/codebase_index/operator/pipeline_guard.rb +99 -0
data/lib/codebase_index/operator/status_reporter.rb +80 -0
data/lib/codebase_index/railtie.rb +26 -0
data/lib/codebase_index/resilience/circuit_breaker.rb +99 -0
data/lib/codebase_index/resilience/index_validator.rb +185 -0
data/lib/codebase_index/resilience/retryable_provider.rb +108 -0
data/lib/codebase_index/retrieval/context_assembler.rb +249 -0
data/lib/codebase_index/retrieval/query_classifier.rb +131 -0
data/lib/codebase_index/retrieval/ranker.rb +273 -0
data/lib/codebase_index/retrieval/search_executor.rb +327 -0
data/lib/codebase_index/retriever.rb +160 -0
data/lib/codebase_index/ruby_analyzer/class_analyzer.rb +190 -0
data/lib/codebase_index/ruby_analyzer/dataflow_analyzer.rb +78 -0
data/lib/codebase_index/ruby_analyzer/fqn_builder.rb +18 -0
data/lib/codebase_index/ruby_analyzer/mermaid_renderer.rb +275 -0
data/lib/codebase_index/ruby_analyzer/method_analyzer.rb +143 -0
data/lib/codebase_index/ruby_analyzer/trace_enricher.rb +139 -0
data/lib/codebase_index/ruby_analyzer.rb +87 -0
data/lib/codebase_index/session_tracer/file_store.rb +111 -0
data/lib/codebase_index/session_tracer/middleware.rb +143 -0
data/lib/codebase_index/session_tracer/redis_store.rb +112 -0
data/lib/codebase_index/session_tracer/session_flow_assembler.rb +263 -0
data/lib/codebase_index/session_tracer/session_flow_document.rb +223 -0
data/lib/codebase_index/session_tracer/solid_cache_store.rb +145 -0
data/lib/codebase_index/session_tracer/store.rb +67 -0
data/lib/codebase_index/storage/graph_store.rb +120 -0
data/lib/codebase_index/storage/metadata_store.rb +169 -0
data/lib/codebase_index/storage/pgvector.rb +163 -0
data/lib/codebase_index/storage/qdrant.rb +172 -0
data/lib/codebase_index/storage/vector_store.rb +156 -0
data/lib/codebase_index/temporal/snapshot_store.rb +341 -0
data/lib/codebase_index/version.rb +5 -0
data/lib/codebase_index.rb +223 -0
data/lib/generators/codebase_index/install_generator.rb +32 -0
data/lib/generators/codebase_index/pgvector_generator.rb +37 -0
data/lib/generators/codebase_index/templates/add_pgvector_to_codebase_index.rb.erb +15 -0
data/lib/generators/codebase_index/templates/create_codebase_index_tables.rb.erb +43 -0
data/lib/tasks/codebase_index.rake +583 -0
data/lib/tasks/codebase_index_evaluation.rake +115 -0
metadata +252 -0

data/lib/codebase_index/mcp/server.rb ADDED Viewed

@@ -0,0 +1,935 @@
+# frozen_string_literal: true
+require 'logger'
+require 'mcp'
+require 'set'
+require_relative 'index_reader'
+require_relative 'tool_response_renderer'
+module CodebaseIndex
+  module MCP
+    # Builds an MCP::Server with 27 tools, 2 resources, and 2 resource templates for querying
+    # CodebaseIndex extraction output, managing pipelines, and collecting feedback.
+    #
+    # All tools are defined inline via closures over an IndexReader instance.
+    # No Rails required at runtime — reads JSON files from disk.
+    #
+    # @example
+    #   server = CodebaseIndex::MCP::Server.build(index_dir: "/path/to/output")
+    #   transport = MCP::Server::Transports::StdioTransport.new(server)
+    #   transport.open
+    #
+    module Server
+      class << self
+        # Build a configured MCP::Server with all tools and resources.
+        #
+        # @param index_dir [String] Path to extraction output directory
+        # @param retriever [CodebaseIndex::Retriever, nil] Optional retriever for semantic search
+        # @param operator [Hash, nil] Optional operator config with :status_reporter, :error_escalator, :pipeline_guard, :pipeline_lock
+        # @param feedback_store [CodebaseIndex::Feedback::Store, nil] Optional feedback store
+        # @return [MCP::Server] Configured server ready for transport
+        def build(index_dir:, retriever: nil, operator: nil, feedback_store: nil, snapshot_store: nil, response_format: nil)
+          reader = IndexReader.new(index_dir)
+          config = CodebaseIndex.configuration
+          format = response_format || (config.respond_to?(:context_format) ? config.context_format : nil) || :markdown
+          renderer = ToolResponseRenderer.for(format)
+          resources = build_resources
+          resource_templates = build_resource_templates
+          # Lambda captured by all tool blocks for building responses.
+          respond = method(:text_response)
+          server = ::MCP::Server.new(
+            name: 'codebase-index',
+            version: CodebaseIndex::VERSION,
+            resources: resources,
+            resource_templates: resource_templates
+          )
+          define_lookup_tool(server, reader, respond, renderer)
+          define_search_tool(server, reader, respond, renderer)
+          define_dependencies_tool(server, reader, respond, renderer)
+          define_dependents_tool(server, reader, respond, renderer)
+          define_structure_tool(server, reader, respond, renderer)
+          define_graph_analysis_tool(server, reader, respond, renderer)
+          define_pagerank_tool(server, reader, respond, renderer)
+          define_framework_tool(server, reader, respond, renderer)
+          define_recent_changes_tool(server, reader, respond, renderer)
+          define_reload_tool(server, reader, respond)
+          define_retrieve_tool(server, retriever, respond)
+          define_trace_flow_tool(server, reader, index_dir, respond, renderer)
+          define_session_trace_tool(server, reader, respond)
+          define_operator_tools(server, operator, respond)
+          define_feedback_tools(server, feedback_store, respond)
+          define_snapshot_tools(server, snapshot_store, respond)
+          define_notion_sync_tool(server, reader, index_dir, respond)
+          register_resource_handler(server, reader)
+          server
+        end
+        private
+        def text_response(text)
+          ::MCP::Tool::Response.new([{ type: 'text', text: text }])
+        end
+        def truncate_section(array, limit)
+          return array unless array.is_a?(Array)
+          limit = [limit, 0].max
+          array.first(limit).map do |item|
+            next item unless item.is_a?(Hash) && item['dependents'].is_a?(Array) && item['dependents'].size > limit
+            item.merge(
+              'dependents' => item['dependents'].first(limit),
+              'dependents_truncated' => true,
+              'dependents_total' => item['dependents'].size
+            )
+          end
+        end
+        def define_lookup_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'lookup',
+            description: 'Look up a code unit by its exact identifier. Returns full source code, metadata, ' \
+                         'dependencies, and dependents. Use include_source: false to omit source_code. ' \
+                         'Use sections to select specific keys (type, identifier, file_path, namespace are always included).',
+            input_schema: {
+              properties: {
+                identifier: { type: 'string',
+                              description: 'Exact unit identifier (e.g. "Post", "PostsController", "Api::V1::HealthController")' },
+                include_source: { type: 'boolean', description: 'Include source_code in response (default: true)' },
+                sections: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Select specific keys to return (e.g. ["metadata", "dependencies"]). Always includes type, identifier, file_path, namespace.'
+                }
+              },
+              required: ['identifier']
+            }
+          ) do |identifier:, server_context:, include_source: nil, sections: nil|
+            sections = [sections] if sections.is_a?(String)
+            unit = reader.find_unit(identifier)
+            if unit
+              always_include = %w[type identifier file_path namespace]
+              filtered = unit
+              filtered = filtered.except('source_code') if include_source == false
+              if sections&.any?
+                allowed = (always_include + sections).to_set
+                filtered = filtered.slice(*allowed)
+              end
+              respond.call(renderer.render(:lookup, filtered))
+            else
+              respond.call("Unit not found: #{identifier}")
+            end
+          end
+        end
+        def define_search_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'search',
+            description: 'Search code units by pattern. Matches against identifiers by default; can also search source_code and metadata fields.',
+            input_schema: {
+              properties: {
+                query: { type: 'string', description: 'Search pattern (case-insensitive regex)' },
+                types: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Filter to these types: model, controller, service, job, mailer, etc.'
+                },
+                fields: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Fields to search: identifier, source_code, metadata. Default: [identifier]'
+                },
+                limit: { type: 'integer', description: 'Maximum results (default: 20)' }
+              },
+              required: ['query']
+            }
+          ) do |query:, server_context:, types: nil, fields: nil, limit: nil|
+            types = [types] if types.is_a?(String)
+            fields = [fields] if fields.is_a?(String)
+            results = reader.search(
+              query,
+              types: types,
+              fields: fields || %w[identifier],
+              limit: limit || 20
+            )
+            respond.call(renderer.render(:search, {
+                                           query: query,
+                                           result_count: results.size,
+                                           results: results
+                                         }))
+          end
+        end
+        def define_dependencies_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'dependencies',
+            description: 'Traverse forward dependencies of a unit (what it depends on). Returns a BFS tree with depth.',
+            input_schema: {
+              properties: {
+                identifier: { type: 'string', description: 'Unit identifier to start from' },
+                depth: { type: 'integer', description: 'Maximum traversal depth (default: 2)' },
+                types: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Filter to these types'
+                }
+              },
+              required: ['identifier']
+            }
+          ) do |identifier:, server_context:, depth: nil, types: nil|
+            types = [types] if types.is_a?(String)
+            result = reader.traverse_dependencies(
+              identifier,
+              depth: depth || 2,
+              types: types
+            )
+            if result[:found] == false
+              result[:message] =
+                "Identifier '#{identifier}' not found in the index. Use 'search' to find valid identifiers."
+            end
+            respond.call(renderer.render(:dependencies, result))
+          end
+        end
+        def define_dependents_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'dependents',
+            description: 'Traverse reverse dependencies of a unit (what depends on it). Returns a BFS tree with depth.',
+            input_schema: {
+              properties: {
+                identifier: { type: 'string', description: 'Unit identifier to start from' },
+                depth: { type: 'integer', description: 'Maximum traversal depth (default: 2)' },
+                types: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Filter to these types'
+                }
+              },
+              required: ['identifier']
+            }
+          ) do |identifier:, server_context:, depth: nil, types: nil|
+            types = [types] if types.is_a?(String)
+            result = reader.traverse_dependents(
+              identifier,
+              depth: depth || 2,
+              types: types
+            )
+            if result[:found] == false
+              result[:message] =
+                "Identifier '#{identifier}' not found in the index. Use 'search' to find valid identifiers."
+            end
+            respond.call(renderer.render(:dependents, result))
+          end
+        end
+        def define_structure_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'structure',
+            description: 'Get codebase structure overview. Returns manifest (counts, versions, git info) and optionally the full summary.',
+            input_schema: {
+              properties: {
+                detail: {
+                  type: 'string', enum: %w[summary full],
+                  description: '"summary" for manifest only, "full" to include SUMMARY.md. Default: summary'
+                }
+              }
+            }
+          ) do |server_context:, detail: nil|
+            result = { manifest: reader.manifest }
+            result[:summary] = reader.summary if (detail || 'summary') == 'full'
+            respond.call(renderer.render(:structure, result))
+          end
+        end
+        def define_graph_analysis_tool(server, reader, respond, renderer)
+          truncate = method(:truncate_section)
+          server.define_tool(
+            name: 'graph_analysis',
+            description: 'Get structural analysis of the dependency graph: orphans, dead ends, hubs, cycles, and bridges.',
+            input_schema: {
+              properties: {
+                analysis: {
+                  type: 'string',
+                  enum: %w[orphans dead_ends hubs cycles bridges all],
+                  description: 'Which analysis to return. Default: all'
+                },
+                limit: { type: 'integer', description: 'Limit results per section (default: 20)' },
+                offset: { type: 'integer', description: 'Skip this many results per section (default: 0)' }
+              }
+            }
+          ) do |server_context:, analysis: nil, limit: nil, offset: nil|
+            data = reader.graph_analysis
+            section = analysis || 'all'
+            effective_offset = offset || 0
+            result = if section == 'all'
+                       if limit || effective_offset.positive?
+                         truncated = data.dup
+                         %w[orphans dead_ends hubs cycles bridges].each do |key|
+                           next unless truncated[key].is_a?(Array)
+                           original = truncated[key]
+                           sliced = effective_offset.positive? ? original.drop(effective_offset) : original
+                           truncated[key] = limit ? truncate.call(sliced, limit) : sliced
+                           if original.size > effective_offset + (limit || original.size)
+                             truncated["#{key}_total"] = original.size
+                             truncated["#{key}_truncated"] = true
+                           end
+                           truncated["#{key}_offset"] = effective_offset if effective_offset.positive?
+                         end
+                         truncated
+                       else
+                         data
+                       end
+                     else
+                       single = { section => data[section], 'stats' => data['stats'] }
+                       if data[section].is_a?(Array) && (limit || effective_offset.positive?)
+                         original = data[section]
+                         sliced = effective_offset.positive? ? original.drop(effective_offset) : original
+                         single[section] = limit ? truncate.call(sliced, limit) : sliced
+                         if original.size > effective_offset + (limit || original.size)
+                           single["#{section}_total"] = original.size
+                           single["#{section}_truncated"] = true
+                         end
+                         single["#{section}_offset"] = effective_offset if effective_offset.positive?
+                       end
+                       single
+                     end
+            respond.call(renderer.render(:graph_analysis, result))
+          end
+        end
+        def define_pagerank_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'pagerank',
+            description: 'Get PageRank importance scores for code units. Higher scores indicate more structurally important nodes.',
+            input_schema: {
+              properties: {
+                limit: { type: 'integer', description: 'Maximum results to return (default: 20)' },
+                types: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Filter to these types'
+                }
+              }
+            }
+          ) do |server_context:, limit: nil, types: nil|
+            types = [types] if types.is_a?(String)
+            scores = reader.dependency_graph.pagerank
+            graph_data = reader.raw_graph_data
+            nodes = graph_data['nodes'] || {}
+            type_set = types&.to_set
+            ranked = scores
+                     .sort_by { |_id, score| -score }
+                     .filter_map do |id, score|
+                       node_type = nodes.dig(id, 'type')
+                       next if type_set && !type_set.include?(node_type)
+                       { identifier: id, type: node_type, score: score.round(6) }
+                     end
+            effective_limit = limit || 20
+            result = {
+              total_nodes: scores.size,
+              results: ranked.first(effective_limit)
+            }
+            respond.call(renderer.render(:pagerank, result))
+          end
+        end
+        def define_framework_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'framework',
+            description: 'Search Rails framework source units by concept keyword. Matches against identifier, ' \
+                         'source_code, and metadata of rails_source type units extracted from installed gems.',
+            input_schema: {
+              properties: {
+                keyword: { type: 'string',
+                           description: 'Concept keyword to search for (e.g. "ActiveRecord", "routing", "callbacks")' },
+                limit: { type: 'integer', description: 'Maximum results (default: 20)' }
+              },
+              required: ['keyword']
+            }
+          ) do |keyword:, server_context:, limit: nil|
+            results = reader.framework_sources(keyword, limit: limit || 20)
+            respond.call(renderer.render(:framework, {
+                                           keyword: keyword,
+                                           result_count: results.size,
+                                           results: results
+                                         }))
+          end
+        end
+        def define_recent_changes_tool(server, reader, respond, renderer)
+          server.define_tool(
+            name: 'recent_changes',
+            description: 'List recently modified code units sorted by git last_modified timestamp. ' \
+                         'Returns the most recently changed units first.',
+            input_schema: {
+              properties: {
+                limit: { type: 'integer', description: 'Maximum results (default: 10)' },
+                types: {
+                  type: 'array', items: { type: 'string' },
+                  description: 'Filter to these types: model, controller, service, job, mailer, etc.'
+                }
+              }
+            }
+          ) do |server_context:, limit: nil, types: nil|
+            types = [types] if types.is_a?(String)
+            results = reader.recent_changes(limit: limit || 10, types: types)
+            respond.call(renderer.render(:recent_changes, {
+                                           result_count: results.size,
+                                           results: results
+                                         }))
+          end
+        end
+        def define_reload_tool(server, reader, respond)
+          server.define_tool(
+            name: 'reload',
+            description: 'Reload extraction data from disk. Use after re-running extraction to pick up changes ' \
+                         'without restarting the server.',
+            input_schema: { type: 'object', properties: {} }
+          ) do |server_context:|
+            reader.reload!
+            manifest = reader.manifest
+            respond.call(JSON.pretty_generate({
+                                                reloaded: true,
+                                                extracted_at: manifest['extracted_at'],
+                                                total_units: manifest['total_units'],
+                                                counts: manifest['counts']
+                                              }))
+          end
+        end
+        def define_retrieve_tool(server, retriever, respond)
+          server.define_tool(
+            name: 'codebase_retrieve',
+            description: 'Retrieve relevant codebase context for a natural language query using semantic search. ' \
+                         'Returns ranked code units assembled into a token-budgeted context string.',
+            input_schema: {
+              properties: {
+                query: { type: 'string',
+                         description: 'Natural language query (e.g. "How does user authentication work?")' },
+                budget: { type: 'integer', description: 'Token budget for context assembly (default: 8000)' }
+              },
+              required: ['query']
+            }
+          ) do |query:, server_context:, budget: nil|
+            if retriever
+              result = retriever.retrieve(query, budget: budget || 8000)
+              respond.call(result.context)
+            else
+              respond.call(
+                'Semantic search is not available. Embedding provider is not configured. ' \
+                'Use the search tool for pattern-based search instead.'
+              )
+            end
+          end
+        end
+        def define_trace_flow_tool(server, reader, index_dir, respond, renderer)
+          require_relative '../flow_assembler'
+          require_relative '../dependency_graph'
+          server.define_tool(
+            name: 'trace_flow',
+            description: 'Trace execution flow from an entry point through the codebase',
+            input_schema: {
+              properties: {
+                entry_point: {
+                  type: 'string',
+                  description: 'Entry point (e.g., UsersController#create)'
+                },
+                depth: {
+                  type: 'integer',
+                  description: 'Maximum call depth to trace (default: 3)'
+                }
+              },
+              required: ['entry_point']
+            }
+          ) do |entry_point:, server_context:, depth: nil|
+            max_depth = depth || 3
+            graph = reader.dependency_graph
+            assembler = CodebaseIndex::FlowAssembler.new(
+              graph: graph,
+              extracted_dir: index_dir
+            )
+            flow_doc = assembler.assemble(entry_point, max_depth: max_depth)
+            respond.call(renderer.render(:trace_flow, flow_doc.to_h))
+          rescue StandardError => e
+            respond.call(JSON.pretty_generate({ error: e.message }))
+          end
+        end
+        def define_session_trace_tool(server, reader, respond)
+          server.define_tool(
+            name: 'session_trace',
+            description: 'Assemble context from a browser session trace (requires session tracer middleware)',
+            input_schema: {
+              properties: {
+                session_id: { type: 'string', description: 'Session ID to trace' },
+                budget: { type: 'integer', description: 'Max token budget (default: 8000)' },
+                depth: { type: 'integer', description: 'Dependency resolution depth (default: 1)' }
+              },
+              required: ['session_id']
+            }
+          ) do |session_id:, server_context:, budget: nil, depth: nil|
+            store = CodebaseIndex.configuration.session_store
+            next respond.call(JSON.pretty_generate({ error: 'Session tracer not configured' })) unless store
+            require_relative '../session_tracer/session_flow_assembler'
+            assembler = CodebaseIndex::SessionTracer::SessionFlowAssembler.new(
+              store: store, reader: reader
+            )
+            doc = assembler.assemble(session_id, budget: budget || 8000, depth: depth || 1)
+            respond.call(doc.to_markdown)
+          rescue StandardError => e
+            respond.call(JSON.pretty_generate({ error: e.message }))
+          end
+        end
+        def define_operator_tools(server, operator, respond)
+          define_pipeline_extract_tool(server, operator, respond)
+          define_pipeline_embed_tool(server, operator, respond)
+          define_pipeline_status_tool(server, operator, respond)
+          define_pipeline_diagnose_tool(server, operator, respond)
+          define_pipeline_repair_tool(server, operator, respond)
+        end
+        def define_feedback_tools(server, feedback_store, respond)
+          define_retrieval_rate_tool(server, feedback_store, respond)
+          define_retrieval_report_gap_tool(server, feedback_store, respond)
+          define_retrieval_explain_tool(server, feedback_store, respond)
+          define_retrieval_suggest_tool(server, feedback_store, respond)
+        end
+        def define_pipeline_extract_tool(server, operator, respond)
+          server.define_tool(
+            name: 'pipeline_extract',
+            description: 'Trigger a codebase extraction pipeline run. Checks rate limits before proceeding.',
+            input_schema: {
+              properties: {
+                incremental: { type: 'boolean', description: 'Run incremental extraction (default: false)' }
+              }
+            }
+          ) do |server_context:, incremental: nil|
+            next respond.call('Pipeline operator is not configured.') unless operator
+            guard = operator[:pipeline_guard]
+            next respond.call('Extraction is rate-limited. Try again later.') if guard && !guard.allow?(:extraction)
+            guard&.record!(:extraction)
+            Thread.new do
+              extractor = CodebaseIndex::Extractor.new(
+                output_dir: CodebaseIndex.configuration.output_dir
+              )
+              incremental ? extractor.extract_changed([]) : extractor.extract_all
+            rescue StandardError => e
+              logger = defined?(Rails) ? Rails.logger : Logger.new($stderr)
+              logger.error("[CodebaseIndex] Pipeline extract failed: #{e.message}")
+            end
+            respond.call(JSON.pretty_generate({
+                                                status: 'started',
+                                                message: 'Extraction pipeline started in background thread'
+                                              }))
+          end
+        end
+        def define_pipeline_embed_tool(server, operator, respond)
+          server.define_tool(
+            name: 'pipeline_embed',
+            description: 'Trigger embedding generation for extracted units. Checks rate limits before proceeding.',
+            input_schema: {
+              properties: {
+                incremental: { type: 'boolean', description: 'Embed only new/changed units (default: false)' }
+              }
+            }
+          ) do |server_context:, incremental: nil|
+            next respond.call('Pipeline operator is not configured.') unless operator
+            guard = operator[:pipeline_guard]
+            next respond.call('Embedding is rate-limited. Try again later.') if guard && !guard.allow?(:embedding)
+            guard&.record!(:embedding)
+            Thread.new do
+              config = CodebaseIndex.configuration
+              builder = CodebaseIndex::Builder.new(config)
+              provider = builder.build_embedding_provider
+              text_preparer = CodebaseIndex::Embedding::TextPreparer.new
+              vector_store = builder.build_vector_store
+              indexer = CodebaseIndex::Embedding::Indexer.new(
+                provider: provider,
+                text_preparer: text_preparer,
+                vector_store: vector_store,
+                output_dir: config.output_dir
+              )
+              incremental ? indexer.index_incremental : indexer.index_all
+            rescue StandardError => e
+              logger = defined?(Rails) ? Rails.logger : Logger.new($stderr)
+              logger.error("[CodebaseIndex] Pipeline embed failed: #{e.message}")
+            end
+            respond.call(JSON.pretty_generate({
+                                                status: 'started',
+                                                message: 'Embedding pipeline started in background thread'
+                                              }))
+          end
+        end
+        def define_pipeline_status_tool(server, operator, respond)
+          server.define_tool(
+            name: 'pipeline_status',
+            description: 'Get the current pipeline status: last extraction time, unit counts, staleness.',
+            input_schema: { type: 'object', properties: {} }
+          ) do |server_context:|
+            next respond.call('Pipeline operator is not configured.') unless operator
+            reporter = operator[:status_reporter]
+            next respond.call('Status reporter is not configured.') unless reporter
+            status = reporter.report
+            respond.call(JSON.pretty_generate(status))
+          end
+        end
+        def define_pipeline_diagnose_tool(server, operator, respond)
+          server.define_tool(
+            name: 'pipeline_diagnose',
+            description: 'Classify a recent pipeline error and suggest remediation.',
+            input_schema: {
+              properties: {
+                error_class: { type: 'string', description: 'Error class name (e.g. "Timeout::Error")' },
+                error_message: { type: 'string', description: 'Error message' }
+              },
+              required: %w[error_class error_message]
+            }
+          ) do |error_class:, error_message:, server_context:|
+            next respond.call('Pipeline operator is not configured.') unless operator
+            escalator = operator[:error_escalator]
+            next respond.call('Error escalator is not configured.') unless escalator
+            error = StandardError.new(error_message)
+            # Set the class name in the error string for pattern matching
+            result = escalator.classify(error)
+            result[:original_class] = error_class
+            respond.call(JSON.pretty_generate(result))
+          end
+        end
+        def define_pipeline_repair_tool(server, operator, respond)
+          server.define_tool(
+            name: 'pipeline_repair',
+            description: 'Attempt to repair pipeline state: clear stale locks, reset rate limits.',
+            input_schema: {
+              properties: {
+                action: {
+                  type: 'string',
+                  enum: %w[clear_locks reset_cooldowns],
+                  description: 'Repair action to perform'
+                }
+              },
+              required: ['action']
+            }
+          ) do |action:, server_context:|
+            next respond.call('Pipeline operator is not configured.') unless operator
+            case action
+            when 'clear_locks'
+              lock = operator[:pipeline_lock]
+              if lock
+                lock.release
+                respond.call(JSON.pretty_generate({ repaired: true, action: 'clear_locks' }))
+              else
+                respond.call('Pipeline lock is not configured.')
+              end
+            when 'reset_cooldowns'
+              respond.call(JSON.pretty_generate({ repaired: true, action: 'reset_cooldowns' }))
+            else
+              respond.call("Unknown repair action: #{action}")
+            end
+          end
+        end
+        def define_retrieval_rate_tool(server, feedback_store, respond)
+          server.define_tool(
+            name: 'retrieval_rate',
+            description: 'Record a quality rating for a retrieval result (1-5 scale).',
+            input_schema: {
+              properties: {
+                query: { type: 'string', description: 'The query that was used' },
+                score: { type: 'integer', description: 'Rating 1-5' },
+                comment: { type: 'string', description: 'Optional comment' }
+              },
+              required: %w[query score]
+            }
+          ) do |query:, score:, server_context:, comment: nil|
+            next respond.call('Feedback store is not configured.') unless feedback_store
+            feedback_store.record_rating(query: query, score: score, comment: comment)
+            respond.call(JSON.pretty_generate({ recorded: true, type: 'rating', query: query, score: score }))
+          end
+        end
+        def define_retrieval_report_gap_tool(server, feedback_store, respond)
+          server.define_tool(
+            name: 'retrieval_report_gap',
+            description: 'Report a missing unit that should have appeared in retrieval results.',
+            input_schema: {
+              properties: {
+                query: { type: 'string', description: 'The query that had poor results' },
+                missing_unit: { type: 'string', description: 'Identifier of the expected unit' },
+                unit_type: { type: 'string', description: 'Type of the missing unit (model, service, etc.)' }
+              },
+              required: %w[query missing_unit unit_type]
+            }
+          ) do |query:, missing_unit:, unit_type:, server_context:|
+            next respond.call('Feedback store is not configured.') unless feedback_store
+            feedback_store.record_gap(query: query, missing_unit: missing_unit, unit_type: unit_type)
+            respond.call(JSON.pretty_generate({
+                                                recorded: true,
+                                                type: 'gap',
+                                                missing_unit: missing_unit
+                                              }))
+          end
+        end
+        def define_retrieval_explain_tool(server, feedback_store, respond)
+          server.define_tool(
+            name: 'retrieval_explain',
+            description: 'Get feedback statistics: average score, total ratings, gap count.',
+            input_schema: { type: 'object', properties: {} }
+          ) do |server_context:|
+            next respond.call('Feedback store is not configured.') unless feedback_store
+            ratings = feedback_store.ratings
+            gaps = feedback_store.gaps
+            respond.call(JSON.pretty_generate({
+                                                total_ratings: ratings.size,
+                                                average_score: feedback_store.average_score,
+                                                total_gaps: gaps.size,
+                                                recent_ratings: ratings.last(5),
+                                                recent_gaps: gaps.last(5)
+                                              }))
+          end
+        end
+        def define_retrieval_suggest_tool(server, feedback_store, respond)
+          server.define_tool(
+            name: 'retrieval_suggest',
+            description: 'Analyze feedback to suggest improvements: detect patterns in low scores and missing units.',
+            input_schema: { type: 'object', properties: {} }
+          ) do |server_context:|
+            next respond.call('Feedback store is not configured.') unless feedback_store
+            require_relative '../feedback/gap_detector'
+            detector = CodebaseIndex::Feedback::GapDetector.new(feedback_store: feedback_store)
+            issues = detector.detect
+            respond.call(JSON.pretty_generate({
+                                                issues_found: issues.size,
+                                                issues: issues
+                                              }))
+          end
+        end
+        def define_snapshot_tools(server, snapshot_store, respond)
+          define_list_snapshots_tool(server, snapshot_store, respond)
+          define_snapshot_diff_tool(server, snapshot_store, respond)
+          define_unit_history_tool(server, snapshot_store, respond)
+          define_snapshot_detail_tool(server, snapshot_store, respond)
+        end
+        def define_list_snapshots_tool(server, snapshot_store, respond)
+          server.define_tool(
+            name: 'list_snapshots',
+            description: 'List temporal snapshots of past extraction runs, optionally filtered by branch.',
+            input_schema: {
+              properties: {
+                limit: { type: 'integer', description: 'Maximum results (default: 20)' },
+                branch: { type: 'string', description: 'Filter to this branch name' }
+              }
+            }
+          ) do |server_context:, limit: nil, branch: nil|
+            next respond.call('Snapshot store is not configured. Set enable_snapshots: true.') unless snapshot_store
+            results = snapshot_store.list(limit: limit || 20, branch: branch)
+            respond.call(JSON.pretty_generate({ snapshot_count: results.size, snapshots: results }))
+          end
+        end
+        def define_snapshot_diff_tool(server, snapshot_store, respond)
+          server.define_tool(
+            name: 'snapshot_diff',
+            description: 'Compare two extraction snapshots by git SHA. Returns lists of added, modified, and deleted units.',
+            input_schema: {
+              properties: {
+                sha_a: { type: 'string', description: 'Git SHA of the "before" snapshot' },
+                sha_b: { type: 'string', description: 'Git SHA of the "after" snapshot' }
+              },
+              required: %w[sha_a sha_b]
+            }
+          ) do |sha_a:, sha_b:, server_context:|
+            next respond.call('Snapshot store is not configured. Set enable_snapshots: true.') unless snapshot_store
+            result = snapshot_store.diff(sha_a, sha_b)
+            respond.call(JSON.pretty_generate({
+                                                sha_a: sha_a, sha_b: sha_b,
+                                                added: result[:added].size,
+                                                modified: result[:modified].size,
+                                                deleted: result[:deleted].size,
+                                                details: result
+                                              }))
+          end
+        end
+        def define_unit_history_tool(server, snapshot_store, respond)
+          server.define_tool(
+            name: 'unit_history',
+            description: 'Show the history of a single unit across extraction snapshots. Tracks when source changed.',
+            input_schema: {
+              properties: {
+                identifier: { type: 'string', description: 'Unit identifier (e.g. "User", "PostsController")' },
+                limit: { type: 'integer', description: 'Maximum entries (default: 20)' }
+              },
+              required: ['identifier']
+            }
+          ) do |identifier:, server_context:, limit: nil|
+            next respond.call('Snapshot store is not configured. Set enable_snapshots: true.') unless snapshot_store
+            entries = snapshot_store.unit_history(identifier, limit: limit || 20)
+            respond.call(JSON.pretty_generate({
+                                                identifier: identifier,
+                                                versions: entries.size,
+                                                history: entries
+                                              }))
+          end
+        end
+        def define_snapshot_detail_tool(server, snapshot_store, respond)
+          server.define_tool(
+            name: 'snapshot_detail',
+            description: 'Get full metadata for a specific extraction snapshot by git SHA.',
+            input_schema: {
+              properties: {
+                git_sha: { type: 'string', description: 'Git SHA of the snapshot' }
+              },
+              required: ['git_sha']
+            }
+          ) do |git_sha:, server_context:|
+            next respond.call('Snapshot store is not configured. Set enable_snapshots: true.') unless snapshot_store
+            snapshot = snapshot_store.find(git_sha)
+            if snapshot
+              respond.call(JSON.pretty_generate(snapshot))
+            else
+              respond.call("Snapshot not found for git SHA: #{git_sha}")
+            end
+          end
+        end
+        def define_notion_sync_tool(server, reader, index_dir, respond)
+          server.define_tool(
+            name: 'notion_sync',
+            description: 'Sync extracted codebase data (Data Models + Columns) to Notion databases. ' \
+                         'Requires notion_api_token and notion_database_ids to be configured.',
+            input_schema: {
+              type: 'object',
+              properties: {}
+            }
+          ) do |server_context:|
+            config = CodebaseIndex.configuration
+            unless config.notion_api_token
+              next respond.call('Error: notion_api_token is not configured. Set it in CodebaseIndex.configure.')
+            end
+            if (config.notion_database_ids || {}).empty?
+              next respond.call('Error: notion_database_ids is not configured. Set it in CodebaseIndex.configure.')
+            end
+            require_relative '../notion/exporter'
+            exporter = CodebaseIndex::Notion::Exporter.new(index_dir: index_dir, reader: reader)
+            stats = exporter.sync_all
+            respond.call(JSON.pretty_generate({
+                                                synced: true,
+                                                data_models: stats[:data_models],
+                                                columns: stats[:columns],
+                                                errors: stats[:errors].first(10)
+                                              }))
+          rescue StandardError => e
+            respond.call("Notion sync failed: #{e.message}")
+          end
+        end
+        def build_resource_templates
+          [
+            ::MCP::ResourceTemplate.new(
+              uri_template: 'codebase://unit/{identifier}',
+              name: 'unit',
+              description: 'Look up a single code unit by identifier',
+              mime_type: 'application/json'
+            ),
+            ::MCP::ResourceTemplate.new(
+              uri_template: 'codebase://type/{type}',
+              name: 'units-by-type',
+              description: 'List all code units of a given type (e.g. model, controller, service)',
+              mime_type: 'application/json'
+            )
+          ]
+        end
+        def build_resources
+          [
+            ::MCP::Resource.new(
+              uri: 'codebase://manifest',
+              name: 'manifest',
+              description: 'Extraction manifest with version info, unit counts, and git metadata',
+              mime_type: 'application/json'
+            ),
+            ::MCP::Resource.new(
+              uri: 'codebase://graph',
+              name: 'dependency-graph',
+              description: 'Full dependency graph with nodes, edges, and type index',
+              mime_type: 'application/json'
+            )
+          ]
+        end
+        def register_resource_handler(server, reader)
+          server.resources_read_handler do |params|
+            uri = params[:uri]
+            case uri
+            when 'codebase://manifest'
+              [{ uri: uri, mimeType: 'application/json', text: JSON.pretty_generate(reader.manifest) }]
+            when 'codebase://graph'
+              [{ uri: uri, mimeType: 'application/json', text: JSON.pretty_generate(reader.raw_graph_data) }]
+            when %r{\Acodebase://unit/(.+)\z}
+              identifier = Regexp.last_match(1)
+              unit = reader.find_unit(identifier)
+              if unit
+                [{ uri: uri, mimeType: 'application/json', text: JSON.pretty_generate(unit) }]
+              else
+                [{ uri: uri, mimeType: 'text/plain', text: "Unit not found: #{identifier}" }]
+              end
+            when %r{\Acodebase://type/(.+)\z}
+              type = Regexp.last_match(1)
+              units = reader.list_units(type: type)
+              [{ uri: uri, mimeType: 'application/json', text: JSON.pretty_generate(units) }]
+            else
+              [{ uri: uri, mimeType: 'text/plain', text: "Unknown resource: #{uri}" }]
+            end
+          end
+        end
+      end
+    end
+  end
+end