RubyGems - htm - Versions diffs - 0.0.1 → 0.0.10 - Mend

htm 0.0.1 → 0.0.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (184) hide show

checksums.yaml +4 -4
data/.aigcm_msg +1 -0
data/.architecture/reviews/comprehensive-codebase-review.md +577 -0
data/.claude/settings.local.json +92 -0
data/.envrc +1 -0
data/.irbrc +283 -80
data/.tbls.yml +31 -0
data/CHANGELOG.md +314 -16
data/CLAUDE.md +603 -0
data/README.md +76 -5
data/Rakefile +5 -0
data/SETUP.md +132 -101
data/db/migrate/{20250101000001_enable_extensions.rb → 00001_enable_extensions.rb} +0 -1
data/db/migrate/00002_create_robots.rb +11 -0
data/db/migrate/00003_create_file_sources.rb +20 -0
data/db/migrate/00004_create_nodes.rb +65 -0
data/db/migrate/00005_create_tags.rb +13 -0
data/db/migrate/00006_create_node_tags.rb +18 -0
data/db/migrate/00007_create_robot_nodes.rb +26 -0
data/db/migrate/00009_add_working_memory_to_robot_nodes.rb +12 -0
data/db/schema.sql +390 -36
data/docs/api/database.md +19 -232
data/docs/api/embedding-service.md +1 -7
data/docs/api/htm.md +305 -364
data/docs/api/index.md +1 -7
data/docs/api/long-term-memory.md +342 -590
data/docs/api/yard/HTM/ActiveRecordConfig.md +23 -0
data/docs/api/yard/HTM/AuthorizationError.md +11 -0
data/docs/api/yard/HTM/CircuitBreaker.md +92 -0
data/docs/api/yard/HTM/CircuitBreakerOpenError.md +34 -0
data/docs/api/yard/HTM/Configuration.md +175 -0
data/docs/api/yard/HTM/Database.md +99 -0
data/docs/api/yard/HTM/DatabaseError.md +14 -0
data/docs/api/yard/HTM/EmbeddingError.md +18 -0
data/docs/api/yard/HTM/EmbeddingService.md +58 -0
data/docs/api/yard/HTM/Error.md +11 -0
data/docs/api/yard/HTM/JobAdapter.md +39 -0
data/docs/api/yard/HTM/LongTermMemory.md +342 -0
data/docs/api/yard/HTM/NotFoundError.md +17 -0
data/docs/api/yard/HTM/Observability.md +107 -0
data/docs/api/yard/HTM/QueryTimeoutError.md +19 -0
data/docs/api/yard/HTM/Railtie.md +27 -0
data/docs/api/yard/HTM/ResourceExhaustedError.md +13 -0
data/docs/api/yard/HTM/TagError.md +18 -0
data/docs/api/yard/HTM/TagService.md +67 -0
data/docs/api/yard/HTM/Timeframe/Result.md +24 -0
data/docs/api/yard/HTM/Timeframe.md +40 -0
data/docs/api/yard/HTM/TimeframeExtractor/Result.md +24 -0
data/docs/api/yard/HTM/TimeframeExtractor.md +45 -0
data/docs/api/yard/HTM/ValidationError.md +20 -0
data/docs/api/yard/HTM/WorkingMemory.md +131 -0
data/docs/api/yard/HTM.md +80 -0
data/docs/api/yard/index.csv +179 -0
data/docs/api/yard-reference.md +51 -0
data/docs/architecture/adrs/001-postgresql-timescaledb.md +1 -1
data/docs/architecture/adrs/003-ollama-embeddings.md +1 -1
data/docs/architecture/adrs/010-redis-working-memory-rejected.md +2 -27
data/docs/architecture/adrs/index.md +2 -13
data/docs/architecture/hive-mind.md +165 -166
data/docs/architecture/index.md +2 -2
data/docs/architecture/overview.md +5 -171
data/docs/architecture/two-tier-memory.md +1 -35
data/docs/assets/images/adr-010-current-architecture.svg +37 -0
data/docs/assets/images/adr-010-proposed-architecture.svg +48 -0
data/docs/assets/images/adr-dependency-tree.svg +93 -0
data/docs/assets/images/class-hierarchy.svg +55 -0
data/docs/assets/images/exception-hierarchy.svg +45 -0
data/docs/assets/images/htm-architecture-overview.svg +83 -0
data/docs/assets/images/htm-complete-memory-flow.svg +160 -0
data/docs/assets/images/htm-context-assembly-flow.svg +148 -0
data/docs/assets/images/htm-eviction-process.svg +141 -0
data/docs/assets/images/htm-memory-addition-flow.svg +138 -0
data/docs/assets/images/htm-memory-recall-flow.svg +152 -0
data/docs/assets/images/htm-node-states.svg +123 -0
data/docs/assets/images/project-structure.svg +78 -0
data/docs/assets/images/test-directory-structure.svg +38 -0
data/{dbdoc → docs/database}/README.md +127 -125
data/docs/database/public.file_sources.md +42 -0
data/docs/database/public.file_sources.svg +211 -0
data/{dbdoc → docs/database}/public.node_tags.md +7 -8
data/docs/database/public.node_tags.svg +239 -0
data/{dbdoc → docs/database}/public.nodes.md +22 -17
data/docs/database/public.nodes.svg +271 -0
data/docs/database/public.robot_nodes.md +46 -0
data/docs/database/public.robot_nodes.svg +243 -0
data/{dbdoc → docs/database}/public.robots.md +2 -3
data/docs/database/public.robots.svg +161 -0
data/docs/database/public.tags.svg +139 -0
data/{dbdoc → docs/database}/schema.json +941 -630
data/docs/database/schema.svg +282 -0
data/docs/development/index.md +1 -29
data/docs/development/schema.md +134 -309
data/docs/development/testing.md +1 -9
data/docs/getting-started/index.md +47 -0
data/docs/{installation.md → getting-started/installation.md} +2 -2
data/docs/{quick-start.md → getting-started/quick-start.md} +5 -5
data/docs/guides/adding-memories.md +295 -643
data/docs/guides/recalling-memories.md +36 -1
data/docs/guides/search-strategies.md +85 -51
data/docs/images/htm-er-diagram.svg +156 -0
data/docs/index.md +16 -31
data/docs/multi_framework_support.md +4 -4
data/examples/README.md +280 -0
data/examples/basic_usage.rb +18 -16
data/examples/cli_app/htm_cli.rb +146 -8
data/examples/cli_app/temp.log +93 -0
data/examples/custom_llm_configuration.rb +1 -2
data/examples/example_app/app.rb +11 -14
data/examples/file_loader_usage.rb +177 -0
data/examples/robot_groups/lib/robot_group.rb +419 -0
data/examples/robot_groups/lib/working_memory_channel.rb +140 -0
data/examples/robot_groups/multi_process.rb +286 -0
data/examples/robot_groups/robot_worker.rb +136 -0
data/examples/robot_groups/same_process.rb +229 -0
data/examples/sinatra_app/Gemfile +1 -0
data/examples/sinatra_app/Gemfile.lock +166 -0
data/examples/sinatra_app/app.rb +219 -24
data/examples/timeframe_demo.rb +276 -0
data/lib/htm/active_record_config.rb +10 -3
data/lib/htm/circuit_breaker.rb +202 -0
data/lib/htm/configuration.rb +313 -80
data/lib/htm/database.rb +67 -36
data/lib/htm/embedding_service.rb +39 -2
data/lib/htm/errors.rb +131 -11
data/lib/htm/{sinatra.rb → integrations/sinatra.rb} +87 -12
data/lib/htm/job_adapter.rb +10 -3
data/lib/htm/jobs/generate_embedding_job.rb +5 -4
data/lib/htm/jobs/generate_tags_job.rb +4 -0
data/lib/htm/loaders/markdown_loader.rb +263 -0
data/lib/htm/loaders/paragraph_chunker.rb +112 -0
data/lib/htm/long_term_memory.rb +601 -321
data/lib/htm/models/file_source.rb +99 -0
data/lib/htm/models/node.rb +116 -12
data/lib/htm/models/robot.rb +53 -4
data/lib/htm/models/robot_node.rb +51 -0
data/lib/htm/models/tag.rb +302 -0
data/lib/htm/observability.rb +395 -0
data/lib/htm/tag_service.rb +60 -3
data/lib/htm/tasks.rb +29 -0
data/lib/htm/timeframe.rb +194 -0
data/lib/htm/timeframe_extractor.rb +307 -0
data/lib/htm/version.rb +1 -1
data/lib/htm/working_memory.rb +165 -70
data/lib/htm.rb +352 -133
data/lib/tasks/doc.rake +300 -0
data/lib/tasks/files.rake +299 -0
data/lib/tasks/htm.rake +188 -2
data/lib/tasks/jobs.rake +10 -12
data/lib/tasks/tags.rake +194 -0
data/mkdocs.yml +91 -9
data/notes/ARCHITECTURE_REVIEW.md +1167 -0
data/notes/IMPLEMENTATION_SUMMARY.md +606 -0
data/notes/MULTI_FRAMEWORK_IMPLEMENTATION.md +451 -0
data/notes/next_steps.md +100 -0
data/notes/plan.md +627 -0
data/notes/tag_ontology_enhancement_ideas.md +222 -0
data/notes/timescaledb_removal_summary.md +200 -0
metadata +177 -37
data/db/migrate/20250101000002_create_robots.rb +0 -14
data/db/migrate/20250101000003_create_nodes.rb +0 -42
data/db/migrate/20250101000005_create_tags.rb +0 -38
data/db/migrate/20250101000007_add_node_vector_indexes.rb +0 -30
data/dbdoc/public.node_tags.svg +0 -112
data/dbdoc/public.nodes.svg +0 -118
data/dbdoc/public.robots.svg +0 -90
data/dbdoc/public.tags.svg +0 -60
data/dbdoc/schema.svg +0 -154
data/{dbdoc → docs/database}/public.node_stats.md +0 -0
data/{dbdoc → docs/database}/public.node_stats.svg +0 -0
data/{dbdoc → docs/database}/public.nodes_tags.md +0 -0
data/{dbdoc → docs/database}/public.nodes_tags.svg +0 -0
data/{dbdoc → docs/database}/public.ontology_structure.md +0 -0
data/{dbdoc → docs/database}/public.ontology_structure.svg +0 -0
data/{dbdoc → docs/database}/public.operations_log.md +0 -0
data/{dbdoc → docs/database}/public.operations_log.svg +0 -0
data/{dbdoc → docs/database}/public.relationships.md +0 -0
data/{dbdoc → docs/database}/public.relationships.svg +0 -0
data/{dbdoc → docs/database}/public.robot_activity.md +0 -0
data/{dbdoc → docs/database}/public.robot_activity.svg +0 -0
data/{dbdoc → docs/database}/public.schema_migrations.md +0 -0
data/{dbdoc → docs/database}/public.schema_migrations.svg +0 -0
data/{dbdoc → docs/database}/public.tags.md +3 -3
/data/{dbdoc → docs/database}/public.topic_relationships.md +0 -0
/data/{dbdoc → docs/database}/public.topic_relationships.svg +0 -0

data/lib/htm/configuration.rb CHANGED Viewed

@@ -6,10 +6,44 @@ require 'logger'
 class HTM
   # HTM Configuration
   #
-  # Applications using HTM should configure LLM access by providing two methods:
-  # 1. embedding_generator - Converts text to vector embeddings
-  # 2. tag_extractor - Extracts hierarchical tags from text
-  # 3. logger - Logger instance for HTM operations
+  # HTM uses RubyLLM for multi-provider LLM support. Supported providers:
+  # - :openai (OpenAI API)
+  # - :anthropic (Anthropic Claude)
+  # - :gemini (Google Gemini)
+  # - :azure (Azure OpenAI)
+  # - :ollama (Local Ollama - default)
+  # - :huggingface (HuggingFace Inference API)
+  # - :openrouter (OpenRouter)
+  # - :bedrock (AWS Bedrock)
+  # - :deepseek (DeepSeek)
+  #
+  # @example Configure with OpenAI
+  #   HTM.configure do |config|
+  #     config.embedding_provider = :openai
+  #     config.embedding_model = 'text-embedding-3-small'
+  #     config.tag_provider = :openai
+  #     config.tag_model = 'gpt-4o-mini'
+  #     config.openai_api_key = ENV['OPENAI_API_KEY']
+  #   end
+  #
+  # @example Configure with Ollama (default)
+  #   HTM.configure do |config|
+  #     config.embedding_provider = :ollama
+  #     config.embedding_model = 'nomic-embed-text'
+  #     config.tag_provider = :ollama
+  #     config.tag_model = 'llama3'
+  #     config.ollama_url = 'http://localhost:11434'
+  #   end
+  #
+  # @example Configure with Anthropic for tags, OpenAI for embeddings
+  #   HTM.configure do |config|
+  #     config.embedding_provider = :openai
+  #     config.embedding_model = 'text-embedding-3-small'
+  #     config.openai_api_key = ENV['OPENAI_API_KEY']
+  #     config.tag_provider = :anthropic
+  #     config.tag_model = 'claude-3-haiku-20240307'
+  #     config.anthropic_api_key = ENV['ANTHROPIC_API_KEY']
+  #   end
   #
   # @example Configure with custom methods
   #   HTM.configure do |config|
@@ -19,39 +53,73 @@ class HTM
   #     config.tag_extractor = ->(text, ontology) {
   #       MyApp::LLMService.extract_tags(text, ontology)  # Returns Array<String>
   #     }
-  #     config.logger = Rails.logger  # Use Rails logger
+  #     config.logger = Rails.logger
   #   end
   #
-  # @example Use defaults with custom timeouts
-  #   HTM.configure do |config|
-  #     config.embedding_timeout = 60      # 1 minute for faster models
-  #     config.tag_timeout = 300           # 5 minutes for larger models
-  #     config.connection_timeout = 10     # 10 seconds connection timeout
-  #     config.reset_to_defaults  # Apply default implementations with new timeouts
-  #   end
-  #
-  # @example Use defaults
-  #   HTM.configure  # Uses default implementations
-  #
   class Configuration
     attr_accessor :embedding_generator, :tag_extractor, :token_counter
     attr_accessor :embedding_model, :embedding_provider, :embedding_dimensions
     attr_accessor :tag_model, :tag_provider
-    attr_accessor :ollama_url
     attr_accessor :embedding_timeout, :tag_timeout, :connection_timeout
     attr_accessor :logger
     attr_accessor :job_backend
+    attr_accessor :week_start
+    # Provider-specific API keys and endpoints
+    attr_accessor :openai_api_key, :openai_organization, :openai_project
+    attr_accessor :anthropic_api_key
+    attr_accessor :gemini_api_key
+    attr_accessor :azure_api_key, :azure_endpoint, :azure_api_version
+    attr_accessor :ollama_url
+    attr_accessor :huggingface_api_key
+    attr_accessor :openrouter_api_key
+    attr_accessor :bedrock_access_key, :bedrock_secret_key, :bedrock_region
+    attr_accessor :deepseek_api_key
+    # Supported providers
+    SUPPORTED_PROVIDERS = %i[
+      openai anthropic gemini azure ollama
+      huggingface openrouter bedrock deepseek
+    ].freeze
+    # Default embedding dimensions by provider/model
+    DEFAULT_DIMENSIONS = {
+      openai: 1536,      # text-embedding-3-small
+      anthropic: 1024,   # voyage embeddings
+      gemini: 768,       # text-embedding-004
+      azure: 1536,       # same as OpenAI
+      ollama: 768,       # nomic-embed-text
+      huggingface: 768,  # varies by model
+      openrouter: 1536,  # varies by model
+      bedrock: 1536,     # titan-embed-text
+      deepseek: 1536     # varies by model
+    }.freeze
     def initialize
-      # Default configuration
+      # Default configuration - Ollama for local development
       @embedding_provider = :ollama
-      @embedding_model = 'nomic-embed-text'
+      @embedding_model = 'nomic-embed-text:latest'  # Include tag for Ollama models
       @embedding_dimensions = 768
       @tag_provider = :ollama
-      @tag_model = 'llama3'
-      @ollama_url = ENV['OLLAMA_URL'] || 'http://localhost:11434'
+      @tag_model = 'gemma3:latest'  # Include tag for Ollama models
+      # Provider credentials from environment variables
+      @openai_api_key = ENV['OPENAI_API_KEY']
+      @openai_organization = ENV['OPENAI_ORGANIZATION']
+      @openai_project = ENV['OPENAI_PROJECT']
+      @anthropic_api_key = ENV['ANTHROPIC_API_KEY']
+      @gemini_api_key = ENV['GEMINI_API_KEY']
+      @azure_api_key = ENV['AZURE_OPENAI_API_KEY']
+      @azure_endpoint = ENV['AZURE_OPENAI_ENDPOINT']
+      @azure_api_version = ENV['AZURE_OPENAI_API_VERSION'] || '2024-02-01'
+      @ollama_url = ENV['OLLAMA_API_BASE'] || ENV['OLLAMA_URL'] || 'http://localhost:11434'
+      @huggingface_api_key = ENV['HUGGINGFACE_API_KEY']
+      @openrouter_api_key = ENV['OPENROUTER_API_KEY']
+      @bedrock_access_key = ENV['AWS_ACCESS_KEY_ID']
+      @bedrock_secret_key = ENV['AWS_SECRET_ACCESS_KEY']
+      @bedrock_region = ENV['AWS_REGION'] || 'us-east-1'
+      @deepseek_api_key = ENV['DEEPSEEK_API_KEY']
       # Timeout settings (in seconds) - apply to all LLM providers
       @embedding_timeout = 120      # 2 minutes for embedding generation
@@ -64,6 +132,14 @@ class HTM
       # Auto-detect job backend based on environment
       @job_backend = detect_job_backend
+      # Timeframe parsing configuration
+      # :sunday (default) or :monday for week start day
+      @week_start = :sunday
+      # Thread-safe Ollama model refresh tracking
+      @ollama_models_refreshed = false
+      @ollama_refresh_mutex = Mutex.new
       # Set default implementations
       reset_to_defaults
     end
@@ -96,6 +172,80 @@ class HTM
       unless [:active_job, :sidekiq, :inline, :thread].include?(@job_backend)
         raise HTM::ValidationError, "job_backend must be one of: :active_job, :sidekiq, :inline, :thread (got #{@job_backend.inspect})"
       end
+      unless [:sunday, :monday].include?(@week_start)
+        raise HTM::ValidationError, "week_start must be :sunday or :monday (got #{@week_start.inspect})"
+      end
+      # Validate provider if specified
+      if @embedding_provider && !SUPPORTED_PROVIDERS.include?(@embedding_provider)
+        raise HTM::ValidationError, "embedding_provider must be one of: #{SUPPORTED_PROVIDERS.join(', ')} (got #{@embedding_provider.inspect})"
+      end
+      if @tag_provider && !SUPPORTED_PROVIDERS.include?(@tag_provider)
+        raise HTM::ValidationError, "tag_provider must be one of: #{SUPPORTED_PROVIDERS.join(', ')} (got #{@tag_provider.inspect})"
+      end
+    end
+    # Normalize Ollama model name to include tag if missing
+    #
+    # Ollama models require a tag (e.g., :latest, :7b, :13b). If the user
+    # specifies a model without a tag, we append :latest by default.
+    #
+    # @param model_name [String] Original model name
+    # @return [String] Normalized model name with tag
+    #
+    def normalize_ollama_model(model_name)
+      return model_name if model_name.nil? || model_name.empty?
+      return model_name if model_name.include?(':')
+      "#{model_name}:latest"
+    end
+    # Configure RubyLLM with the appropriate provider credentials
+    #
+    # @param provider [Symbol] The provider to configure (:openai, :anthropic, etc.)
+    #
+    def configure_ruby_llm(provider = nil)
+      require 'ruby_llm' unless defined?(RubyLLM)
+      provider ||= @embedding_provider
+      RubyLLM.configure do |config|
+        case provider
+        when :openai
+          config.openai_api_key = @openai_api_key if @openai_api_key
+          config.openai_organization = @openai_organization if @openai_organization && config.respond_to?(:openai_organization=)
+          config.openai_project = @openai_project if @openai_project && config.respond_to?(:openai_project=)
+        when :anthropic
+          config.anthropic_api_key = @anthropic_api_key if @anthropic_api_key
+        when :gemini
+          config.gemini_api_key = @gemini_api_key if @gemini_api_key
+        when :azure
+          config.azure_api_key = @azure_api_key if @azure_api_key && config.respond_to?(:azure_api_key=)
+          config.azure_endpoint = @azure_endpoint if @azure_endpoint && config.respond_to?(:azure_endpoint=)
+          config.azure_api_version = @azure_api_version if @azure_api_version && config.respond_to?(:azure_api_version=)
+        when :ollama
+          # Ollama exposes OpenAI-compatible API at /v1
+          # Ensure URL has /v1 suffix (add if missing, don't duplicate if present)
+          ollama_api_base = if @ollama_url.end_with?('/v1') || @ollama_url.end_with?('/v1/')
+            @ollama_url.sub(%r{/+$}, '')  # Just remove trailing slashes
+          else
+            "#{@ollama_url.sub(%r{/+$}, '')}/v1"
+          end
+          config.ollama_api_base = ollama_api_base
+        when :huggingface
+          config.huggingface_api_key = @huggingface_api_key if @huggingface_api_key && config.respond_to?(:huggingface_api_key=)
+        when :openrouter
+          config.openrouter_api_key = @openrouter_api_key if @openrouter_api_key && config.respond_to?(:openrouter_api_key=)
+        when :bedrock
+          config.bedrock_api_key = @bedrock_access_key if @bedrock_access_key && config.respond_to?(:bedrock_api_key=)
+          config.bedrock_secret_key = @bedrock_secret_key if @bedrock_secret_key && config.respond_to?(:bedrock_secret_key=)
+          config.bedrock_region = @bedrock_region if @bedrock_region && config.respond_to?(:bedrock_region=)
+        when :deepseek
+          config.deepseek_api_key = @deepseek_api_key if @deepseek_api_key && config.respond_to?(:deepseek_api_key=)
+        end
+      end
     end
     private
@@ -153,50 +303,101 @@ class HTM
       end
     end
-    # Default embedding generator using Ollama HTTP API
+    # Default embedding generator using RubyLLM
     #
     # @return [Proc] Callable that takes text and returns embedding vector
     #
     def default_embedding_generator
       lambda do |text|
-        require 'net/http'
-        require 'json'
-        case @embedding_provider
-        when :ollama
-          uri = URI("#{@ollama_url}/api/embeddings")
-          request = Net::HTTP::Post.new(uri)
-          request['Content-Type'] = 'application/json'
-          request.body = { model: @embedding_model, prompt: text }.to_json
-          response = Net::HTTP.start(uri.hostname, uri.port,
-            read_timeout: @embedding_timeout,
-            open_timeout: @connection_timeout) do |http|
-            http.request(request)
+        require 'ruby_llm' unless defined?(RubyLLM)
+        # Configure RubyLLM for the embedding provider
+        configure_ruby_llm(@embedding_provider)
+        # Refresh models for Ollama to discover local models (thread-safe)
+        if @embedding_provider == :ollama
+          @ollama_refresh_mutex.synchronize do
+            unless @ollama_models_refreshed
+              RubyLLM.models.refresh!
+              @ollama_models_refreshed = true
+            end
           end
+        end
-          data = JSON.parse(response.body)
-          embedding = data['embedding']
+        # Normalize Ollama model name (ensure it has a tag like :latest)
+        model = @embedding_provider == :ollama ? normalize_ollama_model(@embedding_model) : @embedding_model
-          unless embedding.is_a?(Array)
-            raise HTM::EmbeddingError, "Invalid embedding response format"
-          end
+        # Generate embedding using RubyLLM
+        response = RubyLLM.embed(text, model: model)
-          embedding
-        else
-          raise HTM::EmbeddingError, "Unsupported embedding provider: #{@embedding_provider}. Only :ollama is currently supported."
+        # Extract embedding vector from response
+        embedding = extract_embedding_from_response(response)
+        unless embedding.is_a?(Array) && embedding.all? { |v| v.is_a?(Numeric) }
+          raise HTM::EmbeddingError, "Invalid embedding response format from #{@embedding_provider}"
         end
+        embedding
       end
     end
-    # Default tag extractor using Ollama HTTP API
+    # Extract embedding vector from RubyLLM response
+    #
+    # @param response [Object] RubyLLM embed response
+    # @return [Array<Float>] Embedding vector
+    #
+    def extract_embedding_from_response(response)
+      return nil unless response
+      # Handle different response formats from RubyLLM
+      case response
+      when Array
+        # Direct array response
+        response
+      when ->(r) { r.respond_to?(:vectors) }
+        # RubyLLM::Embedding object with vectors method
+        vectors = response.vectors
+        vectors.is_a?(Array) && vectors.first.is_a?(Array) ? vectors.first : vectors
+      when ->(r) { r.respond_to?(:to_a) }
+        # Can be converted to array
+        response.to_a
+      when ->(r) { r.respond_to?(:embedding) }
+        # Has embedding attribute
+        response.embedding
+      else
+        # Try to extract vectors from instance variables
+        if response.respond_to?(:instance_variable_get)
+          vectors = response.instance_variable_get(:@vectors)
+          return vectors.first if vectors.is_a?(Array) && vectors.first.is_a?(Array)
+          return vectors if vectors.is_a?(Array)
+        end
+        raise HTM::EmbeddingError, "Cannot extract embedding from response: #{response.class}"
+      end
+    end
+    # Default tag extractor using RubyLLM chat
     #
     # @return [Proc] Callable that takes text and ontology, returns array of tags
     #
     def default_tag_extractor
       lambda do |text, existing_ontology = []|
-        require 'net/http'
-        require 'json'
+        require 'ruby_llm' unless defined?(RubyLLM)
+        # Configure RubyLLM for the tag provider
+        configure_ruby_llm(@tag_provider)
+        # Refresh models for Ollama to discover local models (thread-safe)
+        if @tag_provider == :ollama
+          @ollama_refresh_mutex.synchronize do
+            unless @ollama_models_refreshed
+              RubyLLM.models.refresh!
+              @ollama_models_refreshed = true
+            end
+          end
+        end
+        # Normalize Ollama model name (ensure it has a tag like :latest)
+        model = @tag_provider == :ollama ? normalize_ollama_model(@tag_model) : @tag_model
         # Build prompt
         ontology_context = if existing_ontology.any?
@@ -214,52 +415,84 @@ class HTM
           Rules:
           - Use lowercase letters, numbers, and hyphens only
-          - Maximum depth: 5 levels
+          - Maximum depth: 4 levels (to prevent excessive nesting)
           - Return 2-5 tags per text
           - Tags should be reusable and consistent
           - Prefer existing ontology tags when applicable
           - Use hyphens for multi-word terms (e.g., natural-language-processing)
-          Text: #{text}
+          CRITICAL CONSTRAINTS:
+          - NO CIRCULAR REFERENCES: A concept cannot appear at both the root and leaf of the same path
+          - NO REDUNDANT DUPLICATES: Do not create the same concept in multiple branches
+            Example (WRONG): database:postgresql vs database-management:relational-databases:postgresql
+            Example (RIGHT): Choose ONE primary location
+          - CONSISTENT DEPTH: Similar concept types should be at similar depth levels
+            Example (WRONG): age:numeric vs name:individual:specific-name:john
+            Example (RIGHT): Both should be at similar depths under personal-data
+          - NO SELF-CONTAINMENT: A parent concept should never contain itself as a descendant
+            Example (WRONG): age:personal-information:personal-data:age
+            Example (RIGHT): personal-information:personal-data:age
+          - AVOID AMBIGUOUS CROSS-DOMAIN CONCEPTS: Each concept should have ONE primary parent
+            If a concept truly belongs in multiple domains, use the most specific/primary domain
+          TEXT: #{text}
           Return ONLY the topic tags, one per line, no explanations.
         PROMPT
-        case @tag_provider
-        when :ollama
-          uri = URI("#{@ollama_url}/api/generate")
-          request = Net::HTTP::Post.new(uri)
-          request['Content-Type'] = 'application/json'
-          request.body = {
-            model: @tag_model,
-            prompt: prompt,
-            system: 'You are a precise topic extraction system. Output only topic tags in hierarchical format: root:subtopic:detail',
-            stream: false,
-            options: { temperature: 0 }
-          }.to_json
-          response = Net::HTTP.start(uri.hostname, uri.port,
-            read_timeout: @tag_timeout,
-            open_timeout: @connection_timeout) do |http|
-            http.request(request)
-          end
+        system_prompt = <<~SYSTEM.strip
+          You are a precise topic extraction system that prevents ontological errors.
-          data = JSON.parse(response.body)
-          response_text = data['response']
+          Your job is to:
+          1. Extract hierarchical tags in format: root:subtopic:detail
+          2. Maintain consistency with existing ontology (no duplicates)
+          3. Prevent circular references and self-containing concepts
+          4. Keep hierarchies at consistent depth levels
+          5. Choose PRIMARY locations for concepts (no multi-parent confusion)
-          # Parse and validate tags
-          tags = response_text.to_s.split("\n").map(&:strip).reject(&:empty?)
+          Output ONLY topic tags, one per line.
+        SYSTEM
-          # Validate format: lowercase alphanumeric + hyphens + colons
-          valid_tags = tags.select do |tag|
-            tag =~ /^[a-z0-9\-]+(:[a-z0-9\-]+)*$/
-          end
+        # Use RubyLLM chat for tag extraction
+        chat = RubyLLM.chat(model: model)
+        chat.with_instructions(system_prompt)
+        response = chat.ask(prompt)
-          # Limit depth to 5 levels (4 colons maximum)
-          valid_tags.select { |tag| tag.count(':') < 5 }
-        else
-          raise HTM::TagError, "Unsupported tag provider: #{@tag_provider}. Only :ollama is currently supported."
+        # Extract text from response
+        response_text = extract_text_from_response(response)
+        # Parse and validate tags
+        tags = response_text.to_s.split("\n").map(&:strip).reject(&:empty?)
+        # Validate format: lowercase alphanumeric + hyphens + colons
+        valid_tags = tags.select do |tag|
+          tag =~ /^[a-z0-9\-]+(:[a-z0-9\-]+)*$/
         end
+        # Limit depth to 4 levels (3 colons maximum)
+        valid_tags.select { |tag| tag.count(':') < 4 }
+      end
+    end
+    # Extract text content from RubyLLM chat response
+    #
+    # @param response [Object] RubyLLM chat response
+    # @return [String] Response text
+    #
+    def extract_text_from_response(response)
+      return '' unless response
+      case response
+      when String
+        response
+      when ->(r) { r.respond_to?(:content) }
+        response.content.to_s
+      when ->(r) { r.respond_to?(:text) }
+        response.text.to_s
+      when ->(r) { r.respond_to?(:to_s) }
+        response.to_s
+      else
+        ''
       end
     end
   end

data/lib/htm/database.rb CHANGED Viewed

@@ -116,7 +116,7 @@ class HTM
         conn = PG.connect(config)
-        tables = ['nodes', 'node_tags', 'tags', 'robots', 'operations_log', 'schema_migrations']
+        tables = ['nodes', 'node_tags', 'tags', 'robots', 'robot_nodes', 'file_sources', 'schema_migrations']
         puts "Dropping HTM tables..."
         tables.each do |table|
@@ -282,7 +282,8 @@ class HTM
       # Generate database documentation using tbls
       #
-      # Creates comprehensive database documentation in dbdoc/ directory including:
+      # Uses .tbls.yml configuration file for output directory and settings.
+      # Creates comprehensive database documentation including:
       # - Entity-relationship diagrams
       # - Table schemas with comments
       # - Index information
@@ -292,23 +293,6 @@ class HTM
       # @return [void]
       #
       def generate_docs(db_url = nil)
-        config = parse_connection_url(db_url || ENV['HTM_DBURL'])
-        raise "Database configuration not found" unless config
-        dbdoc_dir = File.expand_path('../../dbdoc', __dir__)
-        puts "Generating database documentation in #{dbdoc_dir}..."
-        # Create dbdoc directory if it doesn't exist
-        Dir.mkdir(dbdoc_dir) unless Dir.exist?(dbdoc_dir)
-        # Build PostgreSQL connection string for tbls
-        pg_url = if config[:password]
-          "postgresql://#{config[:user]}:#{config[:password]}@#{config[:host]}:#{config[:port]}/#{config[:dbname]}?sslmode=#{config[:sslmode] || 'prefer'}"
-        else
-          "postgresql://#{config[:user]}@#{config[:host]}:#{config[:port]}/#{config[:dbname]}?sslmode=#{config[:sslmode] || 'prefer'}"
-        end
         # Check if tbls is installed
         unless system('which tbls > /dev/null 2>&1')
           puts "✗ Error: 'tbls' is not installed"
@@ -322,9 +306,31 @@ class HTM
           exit 1
         end
-        # Run tbls doc command with --force to allow updates
+        # Find the project root (where .tbls.yml should be)
+        project_root = File.expand_path('../..', __dir__)
+        tbls_config = File.join(project_root, '.tbls.yml')
+        unless File.exist?(tbls_config)
+          puts "✗ Error: .tbls.yml not found at #{tbls_config}"
+          exit 1
+        end
+        # Get database URL
+        dsn = db_url || ENV['HTM_DBURL']
+        raise "Database configuration not found. Set HTM_DBURL environment variable." unless dsn
+        # Ensure sslmode is set for local development (tbls requires it)
+        unless dsn.include?('sslmode=')
+          separator = dsn.include?('?') ? '&' : '?'
+          dsn = "#{dsn}#{separator}sslmode=disable"
+        end
+        puts "Generating database documentation using #{tbls_config}..."
+        # Run tbls doc command with config file and DSN override
+        # The --dsn flag overrides the dsn in .tbls.yml but other settings are preserved
         require 'open3'
-        cmd = ['tbls', 'doc', '--force', pg_url, dbdoc_dir]
+        cmd = ['tbls', 'doc', '--config', tbls_config, '--dsn', dsn, '--force']
         stdout, stderr, status = Open3.capture3(*cmd)
@@ -336,15 +342,18 @@ class HTM
         end
         puts stdout if stdout && !stdout.empty?
+        # Read docPath from config to show correct output location
+        doc_path = 'docs/database'  # default from .tbls.yml
         puts "✓ Database documentation generated successfully"
         puts ""
         puts "Documentation files:"
-        puts "  #{dbdoc_dir}/README.md       - Main documentation"
-        puts "  #{dbdoc_dir}/schema.svg      - ER diagram (if generated)"
-        puts "  #{dbdoc_dir}/*.md            - Individual table documentation"
+        puts "  #{doc_path}/README.md       - Main documentation"
+        puts "  #{doc_path}/schema.svg      - ER diagram"
+        puts "  #{doc_path}/*.md            - Individual table documentation"
         puts ""
         puts "View documentation:"
-        puts "  open #{dbdoc_dir}/README.md"
+        puts "  open #{doc_path}/README.md"
       end
       # Show database info
@@ -382,7 +391,7 @@ class HTM
         # Table info
         puts "\nHTM Tables:"
-        tables = ['nodes', 'tags', 'robots', 'operations_log', 'schema_migrations']
+        tables = ['nodes', 'node_tags', 'tags', 'robots', 'robot_nodes', 'file_sources', 'schema_migrations']
         tables.each do |table|
           begin
             count = conn.exec("SELECT COUNT(*) FROM #{table}").first['count']
@@ -405,23 +414,41 @@ class HTM
       # Parse database connection URL
       #
-      # @param url [String] Connection URL
+      # @param url [String] Connection URL (e.g., postgresql://user:pass@host:port/dbname)
       # @return [Hash, nil] Connection configuration hash
+      # @raise [ArgumentError] If URL format is invalid
       #
       def parse_connection_url(url)
         return nil unless url
         uri = URI.parse(url)
+        # Validate URL format
+        unless uri.scheme&.match?(/\Apostgres(?:ql)?\z/i)
+          raise ArgumentError, "Invalid database URL scheme: #{uri.scheme}. Expected 'postgresql' or 'postgres'."
+        end
+        unless uri.host && !uri.host.empty?
+          raise ArgumentError, "Database URL must include a host"
+        end
+        dbname = uri.path&.slice(1..-1)  # Remove leading /
+        if dbname.nil? || dbname.empty?
+          raise ArgumentError, "Database URL must include a database name (path segment)"
+        end
         params = URI.decode_www_form(uri.query || '').to_h
         {
           host: uri.host,
-          port: uri.port,
-          dbname: uri.path[1..-1],  # Remove leading /
+          port: uri.port || 5432,
+          dbname: dbname,
           user: uri.user,
           password: uri.password,
           sslmode: params['sslmode'] || 'prefer'
         }
+      rescue URI::InvalidURIError => e
+        raise ArgumentError, "Invalid database URL format: #{e.message}"
       end
       # Build config from individual environment variables
@@ -432,12 +459,12 @@ class HTM
         return nil unless ENV['HTM_DBNAME']
         {
-          host: ENV['HTM_DBHOST'] || 'cw7rxj91bm.srbbwwxn56.tsdb.cloud.timescale.com',
-          port: (ENV['HTM_DBPORT'] || 37807).to_i,
+          host: ENV['HTM_DBHOST'] || 'localhost',
+          port: (ENV['HTM_DBPORT'] || 5432).to_i,
           dbname: ENV['HTM_DBNAME'],
           user: ENV['HTM_DBUSER'],
           password: ENV['HTM_DBPASS'],
-          sslmode: 'require'
+          sslmode: ENV['HTM_DBSSLMODE'] || 'prefer'
         }
       end
@@ -506,9 +533,11 @@ class HTM
           version = File.basename(file).split('_').first
           name = File.basename(file, '.rb')
-          # Check if already run
+          # Check if already run (use parameterized query to prevent SQL injection)
           already_run = conn.select_value(
-            "SELECT COUNT(*) FROM schema_migrations WHERE version = '#{version}'"
+            ActiveRecord::Base.sanitize_sql_array(
+              ["SELECT COUNT(*) FROM schema_migrations WHERE version = ?", version]
+            )
           ).to_i > 0
           if already_run
@@ -525,9 +554,11 @@ class HTM
             migration = migration_class.new
             migration.migrate(:up)
-            # Record in schema_migrations
+            # Record in schema_migrations (use parameterized query to prevent SQL injection)
             conn.execute(
-              "INSERT INTO schema_migrations (version) VALUES ('#{version}')"
+              ActiveRecord::Base.sanitize_sql_array(
+                ["INSERT INTO schema_migrations (version) VALUES (?)", version]
+              )
             )
             puts "    ✓ Completed"