RubyGems - htm - Versions diffs - 0.0.20 → 0.0.30 - Mend

htm 0.0.20 → 0.0.30

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (154) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +60 -0
data/Rakefile +104 -18
data/db/migrate/00001_enable_extensions.rb +9 -5
data/db/migrate/00002_create_robots.rb +18 -6
data/db/migrate/00003_create_file_sources.rb +30 -17
data/db/migrate/00004_create_nodes.rb +60 -48
data/db/migrate/00005_create_tags.rb +24 -12
data/db/migrate/00006_create_node_tags.rb +28 -13
data/db/migrate/00007_create_robot_nodes.rb +40 -26
data/db/schema.sql +17 -1
data/db/seeds.rb +33 -33
data/docs/database/naming-convention.md +244 -0
data/docs/database_rake_tasks.md +31 -0
data/docs/development/rake-tasks.md +80 -35
data/docs/guides/mcp-server.md +70 -1
data/examples/.envrc +6 -0
data/examples/.gitignore +2 -0
data/examples/00_create_examples_db.rb +94 -0
data/examples/{basic_usage.rb → 01_basic_usage.rb} +12 -16
data/examples/{custom_llm_configuration.rb → 03_custom_llm_configuration.rb} +13 -3
data/examples/{file_loader_usage.rb → 04_file_loader_usage.rb} +11 -14
data/examples/{timeframe_demo.rb → 05_timeframe_demo.rb} +10 -3
data/examples/{example_app → 06_example_app}/app.rb +15 -15
data/examples/{cli_app → 07_cli_app}/htm_cli.rb +15 -22
data/examples/08_sinatra_app/Gemfile.lock +241 -0
data/examples/{sinatra_app → 08_sinatra_app}/app.rb +19 -18
data/examples/{mcp_client.rb → 09_mcp_client.rb} +5 -8
data/examples/{telemetry → 10_telemetry}/SETUP_README.md +1 -1
data/examples/{telemetry → 10_telemetry}/demo.rb +14 -10
data/examples/11_robot_groups/README.md +335 -0
data/examples/{robot_groups → 11_robot_groups/lib}/robot_worker.rb +17 -3
data/examples/{robot_groups → 11_robot_groups}/multi_process.rb +9 -9
data/examples/{robot_groups → 11_robot_groups}/same_process.rb +9 -12
data/examples/{rails_app → 12_rails_app}/Gemfile +3 -0
data/examples/{rails_app → 12_rails_app}/Gemfile.lock +87 -58
data/examples/{rails_app → 12_rails_app}/app/controllers/dashboard_controller.rb +10 -6
data/examples/{rails_app → 12_rails_app}/app/controllers/files_controller.rb +5 -5
data/examples/{rails_app → 12_rails_app}/app/controllers/memories_controller.rb +11 -7
data/examples/{rails_app → 12_rails_app}/app/controllers/robots_controller.rb +8 -8
data/examples/12_rails_app/app/controllers/tags_controller.rb +36 -0
data/examples/{rails_app → 12_rails_app}/app/views/dashboard/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/files/new.html.erb +5 -2
data/examples/{rails_app → 12_rails_app}/app/views/memories/_memory_card.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/deleted.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/edit.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/show.html.erb +4 -4
data/examples/{rails_app → 12_rails_app}/app/views/robots/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/robots/show.html.erb +4 -4
data/examples/{rails_app → 12_rails_app}/app/views/search/index.html.erb +1 -1
data/examples/{rails_app → 12_rails_app}/app/views/tags/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/tags/show.html.erb +1 -1
data/examples/12_rails_app/config/initializers/htm.rb +7 -0
data/examples/12_rails_app/config/initializers/rack.rb +5 -0
data/examples/README.md +230 -211
data/examples/examples_helper.rb +138 -0
data/lib/htm/config/builder.rb +167 -0
data/lib/htm/config/database.rb +317 -0
data/lib/htm/config/defaults.yml +37 -9
data/lib/htm/config/section.rb +74 -0
data/lib/htm/config/validator.rb +83 -0
data/lib/htm/config.rb +64 -360
data/lib/htm/database.rb +85 -127
data/lib/htm/errors.rb +14 -0
data/lib/htm/integrations/sinatra.rb +13 -44
data/lib/htm/jobs/generate_embedding_job.rb +3 -4
data/lib/htm/jobs/generate_propositions_job.rb +4 -5
data/lib/htm/jobs/generate_tags_job.rb +16 -15
data/lib/htm/loaders/defaults_loader.rb +23 -0
data/lib/htm/loaders/markdown_loader.rb +17 -15
data/lib/htm/loaders/xdg_config_loader.rb +9 -9
data/lib/htm/long_term_memory/fulltext_search.rb +14 -14
data/lib/htm/long_term_memory/hybrid_search.rb +396 -229
data/lib/htm/long_term_memory/node_operations.rb +24 -23
data/lib/htm/long_term_memory/relevance_scorer.rb +23 -20
data/lib/htm/long_term_memory/robot_operations.rb +4 -4
data/lib/htm/long_term_memory/tag_operations.rb +91 -77
data/lib/htm/long_term_memory/vector_search.rb +4 -5
data/lib/htm/long_term_memory.rb +13 -13
data/lib/htm/mcp/cli.rb +115 -8
data/lib/htm/mcp/resources.rb +4 -3
data/lib/htm/mcp/server.rb +5 -4
data/lib/htm/mcp/tools.rb +37 -28
data/lib/htm/migration.rb +72 -0
data/lib/htm/models/file_source.rb +52 -31
data/lib/htm/models/node.rb +224 -108
data/lib/htm/models/node_tag.rb +49 -28
data/lib/htm/models/robot.rb +38 -27
data/lib/htm/models/robot_node.rb +63 -35
data/lib/htm/models/tag.rb +126 -123
data/lib/htm/observability.rb +45 -41
data/lib/htm/proposition_service.rb +76 -7
data/lib/htm/railtie.rb +2 -2
data/lib/htm/robot_group.rb +30 -18
data/lib/htm/sequel_config.rb +215 -0
data/lib/htm/sql_builder.rb +14 -16
data/lib/htm/tag_service.rb +78 -0
data/lib/htm/tasks.rb +3 -0
data/lib/htm/version.rb +1 -1
data/lib/htm/workflows/remember_workflow.rb +6 -5
data/lib/htm.rb +26 -22
data/lib/tasks/db.rake +0 -2
data/lib/tasks/doc.rake +2 -2
data/lib/tasks/files.rake +11 -18
data/lib/tasks/htm.rake +190 -62
data/lib/tasks/jobs.rake +179 -54
data/lib/tasks/tags.rake +8 -13
data/scripts/backfill_parent_tags.rb +376 -0
data/scripts/normalize_plural_tags.rb +335 -0
metadata +109 -80
data/examples/rails_app/app/controllers/tags_controller.rb +0 -30
data/examples/sinatra_app/Gemfile.lock +0 -166
data/lib/htm/active_record_config.rb +0 -104
/data/examples/{config_file_example → 02_config_file_example}/README.md +0 -0
/data/examples/{config_file_example → 02_config_file_example}/config/htm.local.yml +0 -0
/data/examples/{config_file_example → 02_config_file_example}/custom_config.yml +0 -0
/data/examples/{config_file_example → 02_config_file_example}/show_config.rb +0 -0
/data/examples/{example_app → 06_example_app}/Rakefile +0 -0
/data/examples/{cli_app → 07_cli_app}/README.md +0 -0
/data/examples/{sinatra_app → 08_sinatra_app}/Gemfile +0 -0
/data/examples/{telemetry → 10_telemetry}/README.md +0 -0
/data/examples/{telemetry → 10_telemetry}/grafana/dashboards/htm-metrics.json +0 -0
/data/examples/{rails_app → 12_rails_app}/.gitignore +0 -0
/data/examples/{rails_app → 12_rails_app}/Procfile.dev +0 -0
/data/examples/{rails_app → 12_rails_app}/README.md +0 -0
/data/examples/{rails_app → 12_rails_app}/Rakefile +0 -0
/data/examples/{rails_app → 12_rails_app}/app/assets/stylesheets/application.css +0 -0
/data/examples/{rails_app → 12_rails_app}/app/assets/stylesheets/inter-font.css +0 -0
/data/examples/{rails_app → 12_rails_app}/app/controllers/application_controller.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/controllers/search_controller.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/application.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/controllers/application.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/controllers/index.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/files/index.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/files/show.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/layouts/application.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/memories/index.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/memories/new.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/robots/new.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/shared/_navbar.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/shared/_stat_card.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/dev +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/rails +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/rake +0 -0
/data/examples/{rails_app → 12_rails_app}/config/application.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/boot.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/database.yml +0 -0
/data/examples/{rails_app → 12_rails_app}/config/environment.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/importmap.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/routes.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/tailwind.config.js +0 -0
/data/examples/{rails_app → 12_rails_app}/config.ru +0 -0
/data/examples/{rails_app → 12_rails_app}/log/.keep +0 -0
/data/examples/{rails_app → 12_rails_app}/tmp/local_secret.txt +0 -0

data/lib/htm/long_term_memory/hybrid_search.rb CHANGED Viewed

@@ -2,16 +2,20 @@
 class HTM
   class LongTermMemory
-    # Hybrid search combining full-text and vector similarity
+    # Hybrid search using Reciprocal Rank Fusion (RRF)
     #
-    # Performs combined search using:
-    # 1. Full-text search for content matching
-    # 2. Tag matching for categorical relevance
-    # 3. Vector similarity for semantic ranking
+    # Performs three independent searches and merges results:
+    # 1. Vector similarity search for semantic matching
+    # 2. Full-text search for keyword matching
+    # 3. Tag-based search for hierarchical category matching
     #
-    # Nodes without embeddings are included with a default similarity score,
-    # allowing newly created nodes to appear immediately before background
-    # jobs complete their embedding generation.
+    # Results are merged using RRF scoring. Nodes appearing in multiple
+    # searches receive boosted scores, making them rank higher.
+    #
+    # Tag scoring uses hierarchical depth matching - the more levels of a
+    # tag hierarchy that match, the higher the score contribution.
+    #
+    # RRF Formula: score = Σ 1/(k + rank) for each search where node appears
     #
     # Results are cached for performance.
     #
@@ -20,31 +24,38 @@ class HTM
     module HybridSearch
       # Maximum results to prevent DoS via unbounded queries
       MAX_HYBRID_LIMIT = 1000
-      MAX_PREFILTER_LIMIT = 5000
-      # Hybrid search (full-text + vector)
+      # RRF constant - higher values reduce the impact of rank differences
+      # 60 is the standard value from the original RRF paper
+      RRF_K = 60
+      # Multiplier for candidates from each search
+      # We fetch more candidates than requested to ensure good fusion
+      CANDIDATE_MULTIPLIER = 3
+      # Hybrid search using Reciprocal Rank Fusion
       #
       # @param timeframe [Range] Time range to search
       # @param query [String] Search query
       # @param limit [Integer] Maximum results (capped at MAX_HYBRID_LIMIT)
       # @param embedding_service [Object] Service to generate embeddings
-      # @param prefilter_limit [Integer] Candidates to consider (default: 100, capped at MAX_PREFILTER_LIMIT)
+      # @param prefilter_limit [Integer] Candidates per search (default: 100)
       # @param metadata [Hash] Filter by metadata fields (default: {})
       # @return [Array<Hash>] Matching nodes
       #
       def search_hybrid(timeframe:, query:, limit:, embedding_service:, prefilter_limit: 100, metadata: {})
         # Enforce limits to prevent DoS
         safe_limit = [[limit.to_i, 1].max, MAX_HYBRID_LIMIT].min
-        safe_prefilter = [[prefilter_limit.to_i, 1].max, MAX_PREFILTER_LIMIT].min
+        safe_prefilter = [prefilter_limit.to_i, 1].max
         start_time = Process.clock_gettime(Process::CLOCK_MONOTONIC)
         result = @cache.fetch(:hybrid, timeframe, query, safe_limit, safe_prefilter, metadata) do
-          search_hybrid_uncached(
+          search_hybrid_rrf(
             timeframe: timeframe,
             query: query,
             limit: safe_limit,
             embedding_service: embedding_service,
-            prefilter_limit: safe_prefilter,
+            candidate_limit: safe_prefilter * CANDIDATE_MULTIPLIER,
             metadata: metadata
           )
         end
@@ -55,269 +66,425 @@ class HTM
       private
-      # Threshold for skipping tag extraction (as ratio of limit)
-      # If fulltext returns >= this ratio of requested results, skip expensive tag extraction
-      TAG_EXTRACTION_THRESHOLD = 0.5
-      # Uncached hybrid search
+      # Hybrid search using Reciprocal Rank Fusion
       #
-      # Generates query embedding client-side, then combines:
-      # 1. Full-text search for content matching
-      # 2. Tag matching for categorical relevance (lazy - skipped if fulltext sufficient)
-      # 3. Vector similarity for semantic ranking
+      # Runs vector, fulltext, and tag searches independently, then merges
+      # results using RRF scoring. Nodes appearing in multiple searches
+      # get contributions from each, naturally boosting them.
       #
-      # @param timeframe [nil, Range, Array<Range>] Time range(s) to search (nil = no filter)
+      # @param timeframe [nil, Range, Array<Range>] Time range(s) to search
       # @param query [String] Search query
       # @param limit [Integer] Maximum results
       # @param embedding_service [Object] Service to generate query embedding
-      # @param prefilter_limit [Integer] Candidates to consider
-      # @param metadata [Hash] Filter by metadata fields (default: {})
-      # @return [Array<Hash>] Matching nodes with similarity and tag_boost scores
+      # @param candidate_limit [Integer] Candidates to fetch from each search
+      # @param metadata [Hash] Filter by metadata fields
+      # @return [Array<Hash>] Merged results with RRF scores
       #
-      def search_hybrid_uncached(timeframe:, query:, limit:, embedding_service:, prefilter_limit:, metadata: {})
-        # Generate query embedding client-side
-        query_embedding = embedding_service.embed(query)
-        # Validate embedding before use
-        unless query_embedding.is_a?(Array) && query_embedding.any?
-          HTM.logger.error("Invalid embedding returned from embedding service")
-          return []
-        end
-        # Pad embedding to 2000 dimensions if needed
-        padded_embedding = HTM::SqlBuilder.pad_embedding(query_embedding)
-        # Sanitize embedding for safe SQL use (validates all values are numeric)
-        embedding_str = HTM::SqlBuilder.sanitize_embedding(padded_embedding)
-        # Build filter conditions (with table alias for CTEs)
-        timeframe_condition = HTM::SqlBuilder.timeframe_condition(timeframe, table_alias: 'n')
-        metadata_condition = HTM::SqlBuilder.metadata_condition(metadata, table_alias: 'n')
-        additional_conditions = []
-        additional_conditions << timeframe_condition if timeframe_condition
-        additional_conditions << metadata_condition if metadata_condition
-        additional_sql = additional_conditions.any? ? "AND #{additional_conditions.join(' AND ')}" : ""
-        # Same for non-aliased queries
-        timeframe_condition_bare = HTM::SqlBuilder.timeframe_condition(timeframe)
-        metadata_condition_bare = HTM::SqlBuilder.metadata_condition(metadata)
+      def search_hybrid_rrf(timeframe:, query:, limit:, embedding_service:, candidate_limit:, metadata: {})
+        # Run all three searches independently
+        vector_results = fetch_vector_candidates(
+          query: query,
+          embedding_service: embedding_service,
+          timeframe: timeframe,
+          metadata: metadata,
+          limit: candidate_limit
+        )
-        additional_conditions_bare = []
-        additional_conditions_bare << timeframe_condition_bare if timeframe_condition_bare
-        additional_conditions_bare << metadata_condition_bare if metadata_condition_bare
-        additional_sql_bare = additional_conditions_bare.any? ? "AND #{additional_conditions_bare.join(' AND ')}" : ""
+        fulltext_results = fetch_fulltext_candidates(
+          query: query,
+          timeframe: timeframe,
+          metadata: metadata,
+          limit: candidate_limit
+        )
-        # OPTIMIZATION: Lazy tag extraction
-        # Only extract tags if fulltext results are insufficient.
-        # This skips the expensive LLM call (~500-3000ms) when fulltext alone
-        # provides enough results.
-        fulltext_count = count_fulltext_matches(
+        # Extract tags from query and find matching nodes
+        tag_results = fetch_tag_candidates(
           query: query,
-          additional_sql_bare: additional_sql_bare,
-          limit: prefilter_limit
+          timeframe: timeframe,
+          metadata: metadata,
+          limit: candidate_limit
         )
-        # Only call expensive tag extraction if fulltext results are below threshold
-        matching_tags = if fulltext_count < (limit * TAG_EXTRACTION_THRESHOLD)
-          find_query_matching_tags(query)
-        else
-          []
-        end
+        # Merge using RRF
+        merged = merge_with_rrf(vector_results, fulltext_results, tag_results)
-        # Build the hybrid query
-        # NOTE: Hybrid search includes nodes without embeddings using a default
-        # similarity score of 0.5. This allows newly created nodes to appear in
-        # search results immediately (via fulltext matching) before their embeddings
-        # are generated by background jobs.
-        result = if matching_tags.any?
-          search_hybrid_with_tags(
-            query: query,
-            embedding_str: embedding_str,
-            matching_tags: matching_tags,
-            additional_sql: additional_sql,
-            prefilter_limit: prefilter_limit,
-            limit: limit
-          )
-        else
-          search_hybrid_without_tags(
-            query: query,
-            embedding_str: embedding_str,
-            additional_sql_bare: additional_sql_bare,
-            prefilter_limit: prefilter_limit,
-            limit: limit
-          )
-        end
+        # Take top results
+        top_results = merged.first(limit)
         # Track access for retrieved nodes
-        node_ids = result.map { |r| r['id'] }
+        node_ids = top_results.map { |r| r['id'] }
         track_access(node_ids)
-        result.to_a
+        top_results
       end
-      # Count fulltext matches quickly (for lazy tag extraction decision)
+      # Fetch candidates using vector similarity search
       #
       # @param query [String] Search query
-      # @param additional_sql_bare [String] Additional SQL conditions
-      # @param limit [Integer] Maximum to count up to
-      # @return [Integer] Number of fulltext matches (capped at limit)
+      # @param embedding_service [Object] Service to generate embeddings
+      # @param timeframe [nil, Range, Array<Range>] Time filter
+      # @param metadata [Hash] Metadata filter
+      # @param limit [Integer] Maximum candidates
+      # @return [Array<Hash>] Results with similarity scores
       #
-      def count_fulltext_matches(query:, additional_sql_bare:, limit:)
+      def fetch_vector_candidates(query:, embedding_service:, timeframe:, metadata:, limit:)
+        # Generate query embedding
+        query_embedding = embedding_service.embed(query)
+        unless query_embedding.is_a?(Array) && query_embedding.any?
+          HTM.logger.error("Invalid embedding returned from embedding service")
+          return []
+        end
+        padded_embedding = HTM::SqlBuilder.pad_embedding(query_embedding)
+        embedding_str = HTM::SqlBuilder.sanitize_embedding(padded_embedding)
+        # Build filter conditions
+        timeframe_condition = HTM::SqlBuilder.timeframe_condition(timeframe)
+        metadata_condition = HTM::SqlBuilder.metadata_condition(metadata)
+        conditions = ["embedding IS NOT NULL", "deleted_at IS NULL"]
+        conditions << timeframe_condition if timeframe_condition
+        conditions << metadata_condition if metadata_condition
+        where_clause = "WHERE #{conditions.join(' AND ')}"
+        # Note: Using Sequel.lit for the vector comparison since it needs special handling
+        embedding_literal = HTM.db.literal(embedding_str)
         sql = <<~SQL
-          SELECT COUNT(*) FROM (
-            SELECT 1 FROM nodes
-            WHERE deleted_at IS NULL
-            AND to_tsvector('english', content) @@ plainto_tsquery('english', ?)
-            #{additional_sql_bare}
-            LIMIT ?
-          ) AS limited_count
+          SELECT id, content, access_count, created_at, token_count,
+                 1 - (embedding <=> #{embedding_literal}::vector) as similarity
+          FROM nodes
+          #{where_clause}
+          ORDER BY embedding <=> #{embedding_literal}::vector
+          LIMIT ?
         SQL
-        result = ActiveRecord::Base.connection.select_value(
-          ActiveRecord::Base.sanitize_sql_array([sql, query, limit])
-        )
-        result.to_i
+        HTM.db.fetch(sql, limit).all.map { |r| r.transform_keys(&:to_s) }
       end
-      # Hybrid search with tag matching
-      #
-      # Uses parameterized queries and LEFT JOIN for efficient tag boosting.
+      # Fetch candidates using full-text search
       #
       # @param query [String] Search query
-      # @param embedding_str [String] Sanitized embedding string
-      # @param matching_tags [Array<String>] Tags matching the query
-      # @param additional_sql [String] Additional SQL conditions
-      # @param prefilter_limit [Integer] Candidates to consider
-      # @param limit [Integer] Maximum results
-      # @return [ActiveRecord::Result] Query results
+      # @param timeframe [nil, Range, Array<Range>] Time filter
+      # @param metadata [Hash] Metadata filter
+      # @param limit [Integer] Maximum candidates
+      # @return [Array<Hash>] Results with text rank scores
       #
-      def search_hybrid_with_tags(query:, embedding_str:, matching_tags:, additional_sql:, prefilter_limit:, limit:)
-        # Build tag placeholders for parameterized query
-        tag_placeholders = matching_tags.map { '?' }.join(', ')
-        tag_count = matching_tags.length.to_f
+      def fetch_fulltext_candidates(query:, timeframe:, metadata:, limit:)
+        timeframe_condition = HTM::SqlBuilder.timeframe_condition(timeframe)
+        metadata_condition = HTM::SqlBuilder.metadata_condition(metadata)
+        additional_conditions = []
+        additional_conditions << timeframe_condition if timeframe_condition
+        additional_conditions << metadata_condition if metadata_condition
+        additional_sql = additional_conditions.any? ? "AND #{additional_conditions.join(' AND ')}" : ""
-        # Use parameterized query with proper placeholder binding
-        # LEFT JOIN replaces correlated subquery for O(n) instead of O(n²)
+        # Combined tsvector + trigram search (same as fulltext_search.rb)
+        # Escape the query for safe interpolation in trigram comparisons
+        query_literal = HTM.db.literal(query)
         sql = <<~SQL
-          WITH fulltext_candidates AS (
-            -- Nodes matching full-text search (with or without embeddings)
-            SELECT n.id, n.content, n.access_count, n.created_at, n.token_count, n.embedding
-            FROM nodes n
-            WHERE n.deleted_at IS NULL
-            AND to_tsvector('english', n.content) @@ plainto_tsquery('english', ?)
+          WITH tsvector_matches AS (
+            SELECT id, content, access_count, created_at, token_count,
+                   (1.0 + ts_rank(to_tsvector('english', content), plainto_tsquery('english', #{query_literal}))) as text_rank
+            FROM nodes
+            WHERE deleted_at IS NULL
+            AND to_tsvector('english', content) @@ plainto_tsquery('english', #{query_literal})
             #{additional_sql}
-            LIMIT ?
           ),
-          tag_candidates AS (
-            -- Nodes matching relevant tags (with or without embeddings)
-            SELECT n.id, n.content, n.access_count, n.created_at, n.token_count, n.embedding
-            FROM nodes n
-            JOIN node_tags nt ON nt.node_id = n.id
-            JOIN tags t ON t.id = nt.tag_id
-            WHERE n.deleted_at IS NULL
-            AND t.name IN (#{tag_placeholders})
+          trigram_matches AS (
+            SELECT id, content, access_count, created_at, token_count,
+                   similarity(content, #{query_literal}) as text_rank
+            FROM nodes
+            WHERE deleted_at IS NULL
+            AND similarity(content, #{query_literal}) >= 0.1
+            AND id NOT IN (SELECT id FROM tsvector_matches)
             #{additional_sql}
-            LIMIT ?
-          ),
-          all_candidates AS (
-            SELECT * FROM fulltext_candidates
-            UNION
-            SELECT * FROM tag_candidates
-          ),
-          tag_counts AS (
-            -- Pre-compute tag counts using JOIN instead of correlated subquery
-            SELECT nt.node_id, COUNT(DISTINCT t.name)::float AS matched_tags
-            FROM node_tags nt
-            JOIN tags t ON t.id = nt.tag_id
-            WHERE t.name IN (#{tag_placeholders})
-            GROUP BY nt.node_id
           ),
-          scored AS (
-            SELECT
-              ac.id, ac.content, ac.access_count, ac.created_at, ac.token_count,
-              CASE
-                WHEN ac.embedding IS NOT NULL THEN 1 - (ac.embedding <=> ?::vector)
-                ELSE 0.5
-              END as similarity,
-              COALESCE(tc.matched_tags / ?, 0) as tag_boost
-            FROM all_candidates ac
-            LEFT JOIN tag_counts tc ON tc.node_id = ac.id
+          combined AS (
+            SELECT * FROM tsvector_matches
+            UNION ALL
+            SELECT * FROM trigram_matches
           )
-          SELECT id, content, access_count, created_at, token_count,
-                 similarity, tag_boost,
-                 (similarity * 0.7 + tag_boost * 0.3) as combined_score
-          FROM scored
-          ORDER BY combined_score DESC
+          SELECT id, content, access_count, created_at, token_count, text_rank
+          FROM combined
+          ORDER BY text_rank DESC
           LIMIT ?
         SQL
-        # Build parameter array: query, prefilter, tags (first IN), prefilter, tags (second IN), embedding, tag_count, limit
-        params = [
-          query,
-          prefilter_limit,
-          *matching_tags,
-          prefilter_limit,
-          *matching_tags,
-          embedding_str,
-          tag_count,
-          limit
-        ]
-        ActiveRecord::Base.connection.select_all(
-          ActiveRecord::Base.sanitize_sql_array([sql, *params])
-        )
+        HTM.db.fetch(sql, limit).all.map { |r| r.transform_keys(&:to_s) }
       end
-      # Hybrid search without tag matching (fallback)
+      # Fetch candidates using tag-based search with hierarchical scoring
+      #
+      # Extracts tags from the query, finds nodes with matching tags,
+      # and scores based on hierarchical depth match.
+      #
+      # Scoring: For a query tag "database:postgresql:extensions" (3 levels):
+      # - Node with "database:postgresql:extensions" = 3/3 = 1.0
+      # - Node with "database:postgresql" = 2/3 = 0.67
+      # - Node with "database" = 1/3 = 0.33
       #
       # @param query [String] Search query
-      # @param embedding_str [String] Sanitized embedding string
-      # @param additional_sql_bare [String] Additional SQL conditions (no alias)
-      # @param prefilter_limit [Integer] Candidates to consider
-      # @param limit [Integer] Maximum results
-      # @return [ActiveRecord::Result] Query results
+      # @param timeframe [nil, Range, Array<Range>] Time filter
+      # @param metadata [Hash] Metadata filter
+      # @param limit [Integer] Maximum candidates
+      # @return [Array<Hash>] Results with tag_depth_score
       #
-      def search_hybrid_without_tags(query:, embedding_str:, additional_sql_bare:, prefilter_limit:, limit:)
-        # No matching tags, fall back to standard hybrid (fulltext + vector)
-        # Include nodes without embeddings with a default similarity score
-        # Optimized: compute similarity once in CTE, reuse for combined_score
+      def fetch_tag_candidates(query:, timeframe:, metadata:, limit:)
+        # Extract tags from query using the existing tag extraction infrastructure
+        tag_extraction = find_query_matching_tags(query, include_extracted: true)
+        extracted_tags = tag_extraction[:extracted] || []
+        matched_db_tags = tag_extraction[:matched] || []
+        return [] if extracted_tags.empty? && matched_db_tags.empty?
+        # Build a map of tag prefixes to their max depth
+        # This allows us to score partial matches
+        tag_depth_map = build_tag_depth_map(extracted_tags)
+        # Use matched_db_tags if available, otherwise use extracted_tags
+        search_tags = matched_db_tags.any? ? matched_db_tags : extracted_tags
+        return [] if search_tags.empty?
+        # Build filter conditions
+        timeframe_condition = HTM::SqlBuilder.timeframe_condition(timeframe, table_alias: 'n')
+        metadata_condition = HTM::SqlBuilder.metadata_condition(metadata, table_alias: 'n')
+        additional_conditions = []
+        additional_conditions << timeframe_condition if timeframe_condition
+        additional_conditions << metadata_condition if metadata_condition
+        additional_sql = additional_conditions.any? ? "AND #{additional_conditions.join(' AND ')}" : ""
+        # Find nodes with matching tags
+        # Use Sequel's literal to safely quote tag names
+        tag_literals = search_tags.map { |tag| HTM.db.literal(tag) }.join(', ')
         sql = <<~SQL
-          WITH candidates AS (
-            SELECT id, content, access_count, created_at, token_count, embedding
-            FROM nodes
-            WHERE deleted_at IS NULL
-            AND to_tsvector('english', content) @@ plainto_tsquery('english', ?)
-            #{additional_sql_bare}
-            LIMIT ?
-          ),
-          scored AS (
-            SELECT id, content, access_count, created_at, token_count,
-                   CASE
-                     WHEN embedding IS NOT NULL THEN 1 - (embedding <=> ?::vector)
-                     ELSE 0.5
-                   END as similarity
-            FROM candidates
-          )
-          SELECT id, content, access_count, created_at, token_count,
-                 similarity,
-                 0.0 as tag_boost,
-                 similarity as combined_score
-          FROM scored
-          ORDER BY combined_score DESC
+          SELECT DISTINCT n.id, n.content, n.access_count, n.created_at, n.token_count,
+                 array_agg(t.name) as matched_tags
+          FROM nodes n
+          JOIN node_tags nt ON nt.node_id = n.id
+          JOIN tags t ON t.id = nt.tag_id
+          WHERE n.deleted_at IS NULL
+          AND t.name IN (#{tag_literals})
+          #{additional_sql}
+          GROUP BY n.id, n.content, n.access_count, n.created_at, n.token_count
           LIMIT ?
         SQL
-        ActiveRecord::Base.connection.select_all(
-          ActiveRecord::Base.sanitize_sql_array([
-            sql,
-            query,
-            prefilter_limit,
-            embedding_str,
-            limit
-          ])
-        )
+        results = HTM.db.fetch(sql, limit).all
+        # Calculate depth scores for each result
+        results.map do |result|
+          matched_tags = parse_pg_array(result[:matched_tags])
+          depth_score = calculate_tag_depth_score(matched_tags, tag_depth_map)
+          result.transform_keys(&:to_s).merge('tag_depth_score' => depth_score, 'matched_tags' => matched_tags)
+        end.sort_by { |r| -r['tag_depth_score'] }
+      end
+      # Build a map of tag prefixes to their depth information
+      #
+      # For tag "database:postgresql:extensions":
+      # - "database" => { depth: 1, max_depth: 3 }
+      # - "database:postgresql" => { depth: 2, max_depth: 3 }
+      # - "database:postgresql:extensions" => { depth: 3, max_depth: 3 }
+      #
+      # @param extracted_tags [Array<String>] Tags extracted from query
+      # @return [Hash] Map of tag/prefix to depth info
+      #
+      def build_tag_depth_map(extracted_tags)
+        depth_map = {}
+        extracted_tags.each do |tag|
+          levels = tag.split(':')
+          max_depth = levels.size
+          # Add entry for each prefix level
+          (1..max_depth).each do |depth|
+            prefix = levels[0, depth].join(':')
+            # Keep the highest max_depth if prefix appears in multiple tags
+            if !depth_map.key?(prefix) || depth_map[prefix][:max_depth] < max_depth
+              depth_map[prefix] = { depth: depth, max_depth: max_depth }
+            end
+          end
+        end
+        depth_map
+      end
+      # Calculate depth score for a node's matched tags
+      #
+      # The score is based on how deeply the matched tags align with
+      # the extracted query tags. More levels matched = higher score.
+      #
+      # @param matched_tags [Array<String>] Tags the node has that matched
+      # @param tag_depth_map [Hash] Map of tag/prefix to depth info
+      # @return [Float] Normalized score (0.0 to 1.0)
+      #
+      def calculate_tag_depth_score(matched_tags, tag_depth_map)
+        return 0.0 if matched_tags.empty? || tag_depth_map.empty?
+        # Find the best depth match for each matched tag
+        best_score = 0.0
+        matched_tags.each do |tag|
+          if tag_depth_map.key?(tag)
+            info = tag_depth_map[tag]
+            # Score is depth / max_depth
+            # e.g., "database:postgresql" matching query "database:postgresql:extensions"
+            # gives 2/3 = 0.67
+            score = info[:depth].to_f / info[:max_depth].to_f
+            best_score = [best_score, score].max
+          else
+            # Check if this tag is a parent of any extracted tag
+            tag_depth_map.each do |prefix, info|
+              if prefix.start_with?(tag + ':') || prefix == tag
+                score = tag.split(':').size.to_f / info[:max_depth].to_f
+                best_score = [best_score, score].max
+              end
+            end
+          end
+        end
+        # Bonus for multiple tag matches (capped at 0.2 extra)
+        multi_match_bonus = [(matched_tags.size - 1) * 0.05, 0.2].min
+        [best_score + multi_match_bonus, 1.0].min
+      end
+      # Parse PostgreSQL array string to Ruby array
+      #
+      # @param pg_array [String, Array, Sequel::Postgres::PGArray] PostgreSQL array or Ruby array
+      # @return [Array<String>] Parsed array
+      #
+      def parse_pg_array(pg_array)
+        # Handle Sequel::Postgres::PGArray (wraps Ruby Array)
+        return pg_array.to_a if pg_array.respond_to?(:to_a) && !pg_array.is_a?(String)
+        return pg_array if pg_array.is_a?(Array)
+        return [] if pg_array.nil? || (pg_array.respond_to?(:empty?) && pg_array.empty?)
+        # Handle raw PostgreSQL array format: {val1,val2,val3}
+        pg_str = pg_array.to_s
+        if pg_str.start_with?('{') && pg_str.end_with?('}')
+          pg_str[1..-2].split(',').map { |s| s.gsub(/^"|"$/, '') }
+        else
+          [pg_str]
+        end
+      end
+      # Merge three result sets using Reciprocal Rank Fusion
+      #
+      # RRF score = Σ 1/(k + rank) for each list where the item appears
+      #
+      # Items appearing in multiple lists naturally get higher scores
+      # because they receive contributions from multiple ranks.
+      #
+      # @param vector_results [Array<Hash>] Vector search results (ordered by similarity)
+      # @param fulltext_results [Array<Hash>] Fulltext search results (ordered by text_rank)
+      # @param tag_results [Array<Hash>] Tag search results (ordered by tag_depth_score)
+      # @return [Array<Hash>] Merged results sorted by RRF score
+      #
+      def merge_with_rrf(vector_results, fulltext_results, tag_results = [])
+        # Build RRF scores
+        # Key: node_id, Value: { node_data:, rrf_score:, sources: }
+        merged = {}
+        # Process vector results
+        vector_results.each_with_index do |result, index|
+          id = result['id']
+          rank = index + 1  # 1-based rank
+          rrf_contribution = 1.0 / (RRF_K + rank)
+          merged[id] = {
+            'id' => result['id'],
+            'content' => result['content'],
+            'access_count' => result['access_count'],
+            'created_at' => result['created_at'],
+            'token_count' => result['token_count'],
+            'similarity' => result['similarity'],
+            'text_rank' => 0.0,
+            'tag_depth_score' => 0.0,
+            'matched_tags' => [],
+            'rrf_score' => rrf_contribution,
+            'vector_rank' => rank,
+            'fulltext_rank' => nil,
+            'tag_rank' => nil,
+            'sources' => ['vector']
+          }
+        end
+        # Process fulltext results
+        fulltext_results.each_with_index do |result, index|
+          id = result['id']
+          rank = index + 1  # 1-based rank
+          rrf_contribution = 1.0 / (RRF_K + rank)
+          if merged.key?(id)
+            # Node appears in both - add RRF contribution (this is the boost!)
+            merged[id]['rrf_score'] += rrf_contribution
+            merged[id]['text_rank'] = result['text_rank']
+            merged[id]['fulltext_rank'] = rank
+            merged[id]['sources'] << 'fulltext'
+          else
+            # Node only in fulltext
+            merged[id] = {
+              'id' => result['id'],
+              'content' => result['content'],
+              'access_count' => result['access_count'],
+              'created_at' => result['created_at'],
+              'token_count' => result['token_count'],
+              'similarity' => 0.0,
+              'text_rank' => result['text_rank'],
+              'tag_depth_score' => 0.0,
+              'matched_tags' => [],
+              'rrf_score' => rrf_contribution,
+              'vector_rank' => nil,
+              'fulltext_rank' => rank,
+              'tag_rank' => nil,
+              'sources' => ['fulltext']
+            }
+          end
+        end
+        # Process tag results
+        tag_results.each_with_index do |result, index|
+          id = result['id']
+          rank = index + 1  # 1-based rank
+          rrf_contribution = 1.0 / (RRF_K + rank)
+          if merged.key?(id)
+            # Node already found - add RRF contribution (boost!)
+            merged[id]['rrf_score'] += rrf_contribution
+            merged[id]['tag_depth_score'] = result['tag_depth_score']
+            merged[id]['matched_tags'] = result['matched_tags']
+            merged[id]['tag_rank'] = rank
+            merged[id]['sources'] << 'tags'
+          else
+            # Node only found via tags
+            merged[id] = {
+              'id' => result['id'],
+              'content' => result['content'],
+              'access_count' => result['access_count'],
+              'created_at' => result['created_at'],
+              'token_count' => result['token_count'],
+              'similarity' => 0.0,
+              'text_rank' => 0.0,
+              'tag_depth_score' => result['tag_depth_score'],
+              'matched_tags' => result['matched_tags'],
+              'rrf_score' => rrf_contribution,
+              'vector_rank' => nil,
+              'fulltext_rank' => nil,
+              'tag_rank' => rank,
+              'sources' => ['tags']
+            }
+          end
+        end
+        # Sort by RRF score descending
+        merged.values.sort_by { |r| -r['rrf_score'] }
       end
     end
   end