RubyGems - htm - Versions diffs - 0.0.18 → 0.0.30 - Mend

htm 0.0.18 → 0.0.30

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (216) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +119 -1
data/README.md +12 -0
data/Rakefile +104 -18
data/db/migrate/00001_enable_extensions.rb +9 -5
data/db/migrate/00002_create_robots.rb +18 -6
data/db/migrate/00003_create_file_sources.rb +30 -17
data/db/migrate/00004_create_nodes.rb +60 -48
data/db/migrate/00005_create_tags.rb +24 -12
data/db/migrate/00006_create_node_tags.rb +28 -13
data/db/migrate/00007_create_robot_nodes.rb +40 -26
data/db/schema.sql +17 -1
data/db/seeds.rb +34 -34
data/docs/api/embedding-service.md +140 -110
data/docs/api/yard/HTM/ActiveRecordConfig.md +6 -0
data/docs/api/yard/HTM/Config.md +173 -0
data/docs/api/yard/HTM/ConfigSection.md +28 -0
data/docs/api/yard/HTM/Database.md +1 -1
data/docs/api/yard/HTM/Railtie.md +2 -2
data/docs/api/yard/HTM.md +0 -57
data/docs/api/yard/index.csv +76 -61
data/docs/api/yard-reference.md +2 -1
data/docs/architecture/adrs/003-ollama-embeddings.md +45 -36
data/docs/architecture/adrs/004-hive-mind.md +1 -1
data/docs/architecture/adrs/008-robot-identification.md +1 -1
data/docs/architecture/index.md +11 -9
data/docs/architecture/overview.md +11 -7
data/docs/assets/images/balanced-strategy-decay.svg +41 -0
data/docs/assets/images/class-hierarchy.svg +1 -1
data/docs/assets/images/eviction-priority.svg +43 -0
data/docs/assets/images/exception-hierarchy.svg +2 -2
data/docs/assets/images/hive-mind-shared-memory.svg +52 -0
data/docs/assets/images/htm-architecture-overview.svg +3 -3
data/docs/assets/images/htm-core-components.svg +4 -4
data/docs/assets/images/htm-layered-architecture.svg +1 -1
data/docs/assets/images/htm-memory-addition-flow.svg +2 -2
data/docs/assets/images/htm-memory-recall-flow.svg +2 -2
data/docs/assets/images/memory-topology.svg +53 -0
data/docs/assets/images/two-tier-memory-architecture.svg +55 -0
data/docs/database/naming-convention.md +244 -0
data/docs/database_rake_tasks.md +31 -0
data/docs/development/rake-tasks.md +80 -35
data/docs/development/setup.md +76 -44
data/docs/examples/basic-usage.md +133 -0
data/docs/examples/config-files.md +170 -0
data/docs/examples/file-loading.md +208 -0
data/docs/examples/index.md +116 -0
data/docs/examples/llm-configuration.md +168 -0
data/docs/examples/mcp-client.md +172 -0
data/docs/examples/rails-integration.md +173 -0
data/docs/examples/robot-groups.md +210 -0
data/docs/examples/sinatra-integration.md +218 -0
data/docs/examples/standalone-app.md +216 -0
data/docs/examples/telemetry.md +224 -0
data/docs/examples/timeframes.md +143 -0
data/docs/getting-started/installation.md +97 -40
data/docs/getting-started/quick-start.md +28 -11
data/docs/guides/configuration.md +515 -0
data/docs/guides/file-loading.md +322 -0
data/docs/guides/getting-started.md +40 -9
data/docs/guides/index.md +3 -3
data/docs/guides/mcp-server.md +100 -13
data/docs/guides/propositions.md +264 -0
data/docs/guides/recalling-memories.md +4 -4
data/docs/guides/search-strategies.md +3 -3
data/docs/guides/tags.md +318 -0
data/docs/guides/telemetry.md +229 -0
data/docs/index.md +8 -16
data/docs/{architecture → robots}/hive-mind.md +8 -111
data/docs/robots/index.md +73 -0
data/docs/{guides → robots}/multi-robot.md +3 -3
data/docs/{guides → robots}/robot-groups.md +8 -7
data/docs/{architecture → robots}/two-tier-memory.md +13 -149
data/docs/robots/why-robots.md +85 -0
data/examples/.envrc +6 -0
data/examples/.gitignore +2 -0
data/examples/00_create_examples_db.rb +94 -0
data/examples/{basic_usage.rb → 01_basic_usage.rb} +12 -16
data/examples/{custom_llm_configuration.rb → 03_custom_llm_configuration.rb} +13 -3
data/examples/{file_loader_usage.rb → 04_file_loader_usage.rb} +11 -14
data/examples/{timeframe_demo.rb → 05_timeframe_demo.rb} +10 -3
data/examples/{example_app → 06_example_app}/app.rb +15 -15
data/examples/{cli_app → 07_cli_app}/htm_cli.rb +15 -22
data/examples/08_sinatra_app/Gemfile.lock +241 -0
data/examples/{sinatra_app → 08_sinatra_app}/app.rb +19 -18
data/examples/{mcp_client.rb → 09_mcp_client.rb} +5 -8
data/examples/{telemetry → 10_telemetry}/SETUP_README.md +1 -1
data/examples/{telemetry → 10_telemetry}/demo.rb +14 -10
data/examples/11_robot_groups/README.md +335 -0
data/examples/{robot_groups → 11_robot_groups/lib}/robot_worker.rb +17 -3
data/examples/{robot_groups → 11_robot_groups}/multi_process.rb +9 -9
data/examples/{robot_groups → 11_robot_groups}/same_process.rb +9 -12
data/examples/{rails_app → 12_rails_app}/Gemfile +3 -0
data/examples/{rails_app → 12_rails_app}/Gemfile.lock +87 -58
data/examples/{rails_app → 12_rails_app}/app/controllers/dashboard_controller.rb +10 -6
data/examples/{rails_app → 12_rails_app}/app/controllers/files_controller.rb +5 -5
data/examples/{rails_app → 12_rails_app}/app/controllers/memories_controller.rb +11 -7
data/examples/{rails_app → 12_rails_app}/app/controllers/robots_controller.rb +8 -8
data/examples/12_rails_app/app/controllers/tags_controller.rb +36 -0
data/examples/{rails_app → 12_rails_app}/app/views/dashboard/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/files/new.html.erb +5 -2
data/examples/{rails_app → 12_rails_app}/app/views/memories/_memory_card.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/deleted.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/edit.html.erb +3 -3
data/examples/{rails_app → 12_rails_app}/app/views/memories/show.html.erb +4 -4
data/examples/{rails_app → 12_rails_app}/app/views/robots/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/robots/show.html.erb +4 -4
data/examples/{rails_app → 12_rails_app}/app/views/search/index.html.erb +1 -1
data/examples/{rails_app → 12_rails_app}/app/views/tags/index.html.erb +2 -2
data/examples/{rails_app → 12_rails_app}/app/views/tags/show.html.erb +1 -1
data/examples/12_rails_app/config/initializers/htm.rb +7 -0
data/examples/12_rails_app/config/initializers/rack.rb +5 -0
data/examples/README.md +230 -211
data/examples/examples_helper.rb +138 -0
data/lib/htm/config/builder.rb +167 -0
data/lib/htm/config/database.rb +317 -0
data/lib/htm/config/defaults.yml +41 -13
data/lib/htm/config/section.rb +74 -0
data/lib/htm/config/validator.rb +83 -0
data/lib/htm/config.rb +65 -361
data/lib/htm/database.rb +85 -127
data/lib/htm/errors.rb +14 -0
data/lib/htm/integrations/sinatra.rb +13 -44
data/lib/htm/job_adapter.rb +75 -1
data/lib/htm/jobs/generate_embedding_job.rb +3 -4
data/lib/htm/jobs/generate_propositions_job.rb +4 -5
data/lib/htm/jobs/generate_tags_job.rb +16 -15
data/lib/htm/loaders/defaults_loader.rb +23 -0
data/lib/htm/loaders/markdown_loader.rb +17 -15
data/lib/htm/loaders/xdg_config_loader.rb +9 -9
data/lib/htm/long_term_memory/fulltext_search.rb +14 -14
data/lib/htm/long_term_memory/hybrid_search.rb +396 -229
data/lib/htm/long_term_memory/node_operations.rb +24 -23
data/lib/htm/long_term_memory/relevance_scorer.rb +23 -20
data/lib/htm/long_term_memory/robot_operations.rb +4 -4
data/lib/htm/long_term_memory/tag_operations.rb +91 -77
data/lib/htm/long_term_memory/vector_search.rb +4 -5
data/lib/htm/long_term_memory.rb +13 -13
data/lib/htm/mcp/cli.rb +115 -8
data/lib/htm/mcp/resources.rb +4 -3
data/lib/htm/mcp/server.rb +5 -4
data/lib/htm/mcp/tools.rb +37 -28
data/lib/htm/migration.rb +72 -0
data/lib/htm/models/file_source.rb +52 -31
data/lib/htm/models/node.rb +224 -108
data/lib/htm/models/node_tag.rb +49 -28
data/lib/htm/models/robot.rb +38 -27
data/lib/htm/models/robot_node.rb +63 -35
data/lib/htm/models/tag.rb +126 -123
data/lib/htm/observability.rb +45 -41
data/lib/htm/proposition_service.rb +76 -7
data/lib/htm/railtie.rb +2 -2
data/lib/htm/robot_group.rb +30 -18
data/lib/htm/sequel_config.rb +215 -0
data/lib/htm/sql_builder.rb +14 -16
data/lib/htm/tag_service.rb +78 -0
data/lib/htm/tasks.rb +3 -0
data/lib/htm/version.rb +1 -1
data/lib/htm/workflows/remember_workflow.rb +213 -0
data/lib/htm.rb +27 -22
data/lib/tasks/db.rake +0 -2
data/lib/tasks/doc.rake +2 -2
data/lib/tasks/files.rake +11 -18
data/lib/tasks/htm.rake +190 -62
data/lib/tasks/jobs.rake +179 -54
data/lib/tasks/tags.rake +8 -13
data/mkdocs.yml +33 -8
data/scripts/backfill_parent_tags.rb +376 -0
data/scripts/normalize_plural_tags.rb +335 -0
metadata +168 -86
data/docs/api/yard/HTM/Configuration.md +0 -240
data/docs/telemetry.md +0 -391
data/examples/rails_app/app/controllers/tags_controller.rb +0 -30
data/examples/sinatra_app/Gemfile.lock +0 -166
data/lib/htm/active_record_config.rb +0 -104
/data/examples/{config_file_example → 02_config_file_example}/README.md +0 -0
/data/examples/{config_file_example → 02_config_file_example}/config/htm.local.yml +0 -0
/data/examples/{config_file_example → 02_config_file_example}/custom_config.yml +0 -0
/data/examples/{config_file_example → 02_config_file_example}/show_config.rb +0 -0
/data/examples/{example_app → 06_example_app}/Rakefile +0 -0
/data/examples/{cli_app → 07_cli_app}/README.md +0 -0
/data/examples/{sinatra_app → 08_sinatra_app}/Gemfile +0 -0
/data/examples/{telemetry → 10_telemetry}/README.md +0 -0
/data/examples/{telemetry → 10_telemetry}/grafana/dashboards/htm-metrics.json +0 -0
/data/examples/{rails_app → 12_rails_app}/.gitignore +0 -0
/data/examples/{rails_app → 12_rails_app}/Procfile.dev +0 -0
/data/examples/{rails_app → 12_rails_app}/README.md +0 -0
/data/examples/{rails_app → 12_rails_app}/Rakefile +0 -0
/data/examples/{rails_app → 12_rails_app}/app/assets/stylesheets/application.css +0 -0
/data/examples/{rails_app → 12_rails_app}/app/assets/stylesheets/inter-font.css +0 -0
/data/examples/{rails_app → 12_rails_app}/app/controllers/application_controller.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/controllers/search_controller.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/application.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/controllers/application.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/javascript/controllers/index.js +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/files/index.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/files/show.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/layouts/application.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/memories/index.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/memories/new.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/robots/new.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/shared/_navbar.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/app/views/shared/_stat_card.html.erb +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/dev +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/rails +0 -0
/data/examples/{rails_app → 12_rails_app}/bin/rake +0 -0
/data/examples/{rails_app → 12_rails_app}/config/application.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/boot.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/database.yml +0 -0
/data/examples/{rails_app → 12_rails_app}/config/environment.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/importmap.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/routes.rb +0 -0
/data/examples/{rails_app → 12_rails_app}/config/tailwind.config.js +0 -0
/data/examples/{rails_app → 12_rails_app}/config.ru +0 -0
/data/examples/{rails_app → 12_rails_app}/log/.keep +0 -0
/data/examples/{rails_app → 12_rails_app}/tmp/local_secret.txt +0 -0

data/docs/api/embedding-service.md CHANGED Viewed

@@ -4,15 +4,21 @@ Client-side embedding generation service for HTM.
 ## Overview
-`HTM::EmbeddingService` generates vector embeddings for text content before database insertion. It supports multiple embedding providers:
+`HTM::EmbeddingService` generates vector embeddings for text content before database insertion. It uses RubyLLM to support multiple embedding providers:
-- **Ollama** - Local embedding server (default, via `nomic-embed-text` model)
-- **OpenAI** - OpenAI's `text-embedding-3-small` model
+- **Ollama** - Local embedding server (default for development)
+- **OpenAI** - OpenAI's embedding models
+- **Anthropic** - For tag extraction (via chat models)
+- **Gemini** - Google's embedding models
+- **Azure** - Azure OpenAI deployments
+- **Bedrock** - AWS Bedrock models
+- **DeepSeek** - DeepSeek embeddings
 The service also provides token counting for working memory management.
 **Architecture:**
-- Ruby application generates embeddings via HTTP call to Ollama/OpenAI
+- Ruby application generates embeddings via RubyLLM
+- RubyLLM handles provider-specific API calls
 - Embeddings are passed to PostgreSQL during INSERT
 - Simple, reliable, cross-platform operation
@@ -34,7 +40,6 @@ Create a new embedding service instance.
 HTM::EmbeddingService.new(
   provider = :ollama,
   model: 'nomic-embed-text',
-  ollama_url: nil,
   dimensions: nil
 )
 ```
@@ -43,11 +48,12 @@ HTM::EmbeddingService.new(
 | Parameter | Type | Default | Description |
 |-----------|------|---------|-------------|
-| `provider` | Symbol | `:ollama` | Embedding provider (`:ollama`, `:openai`) |
-| `model` | String | `'nomic-embed-text'` | Model name for the provider |
-| `ollama_url` | String, nil | `ENV['OLLAMA_URL']` or `'http://localhost:11434'` | Ollama server URL |
+| `provider` | Symbol | `:ollama` | Embedding provider (`:ollama`, `:openai`, `:gemini`, `:azure`, `:bedrock`, `:deepseek`) |
+| `model` | String | Provider-dependent | Model name for the provider |
 | `dimensions` | Integer, nil | Auto-detected | Expected embedding dimensions |
+**Provider-specific configuration** is handled via environment variables (see RubyLLM documentation).
 #### Returns
 `HTM::EmbeddingService` - Configured embedding service instance
@@ -58,20 +64,19 @@ HTM::EmbeddingService.new(
 #### Examples
-**Default Ollama configuration:**
+**Default configuration (uses Ollama):**
 ```ruby
 service = HTM::EmbeddingService.new
-# Uses Ollama at http://localhost:11434 with nomic-embed-text (768 dimensions)
+# Uses Ollama with nomic-embed-text (768 dimensions)
 ```
-**Custom Ollama model:**
+**Ollama with custom model:**
 ```ruby
 service = HTM::EmbeddingService.new(
   :ollama,
   model: 'mxbai-embed-large',
-  ollama_url: 'http://localhost:11434',
   dimensions: 1024
 )
 ```
@@ -87,15 +92,27 @@ service = HTM::EmbeddingService.new(
 )
 ```
-**HTM automatically initializes EmbeddingService:**
+**Gemini configuration:**
 ```ruby
-htm = HTM.new(
-  robot_name: "Assistant",
-  embedding_provider: :ollama,
-  embedding_model: 'nomic-embed-text'
+# Requires GEMINI_API_KEY environment variable
+service = HTM::EmbeddingService.new(
+  :gemini,
+  model: 'text-embedding-004',
+  dimensions: 768
 )
-# EmbeddingService configured automatically
+```
+**HTM global configuration (recommended):**
+```ruby
+HTM.configure do |config|
+  config.embedding.provider = :openai  # or :ollama, :gemini, etc.
+  config.embedding.model = 'text-embedding-3-small'
+end
+htm = HTM.new(robot_name: "Assistant")
+# EmbeddingService configured automatically from global config
 ```
 ---
@@ -144,21 +161,24 @@ begin
   embedding = service.embed("some text")
 rescue HTM::EmbeddingError => e
   puts "Embedding failed: #{e.message}"
-  # Check Ollama is running: curl http://localhost:11434/api/tags
+  # For Ollama: Check if running with `curl http://localhost:11434/api/tags`
+  # For cloud providers: Check API key is set correctly
 end
 ```
 #### Implementation Details
-**Ollama provider:**
-- Makes HTTP POST to `/api/embeddings`
-- Returns dense vector representation
-- Requires Ollama server running locally
+All providers are handled through RubyLLM, which provides a consistent interface across providers.
+**Ollama:** Local HTTP calls, requires Ollama server running
-**OpenAI provider:**
-- Makes HTTP POST to OpenAI API
-- Requires `OPENAI_API_KEY` environment variable
-- API costs: $0.0001 per 1K tokens
+**OpenAI:** Cloud API calls, requires `OPENAI_API_KEY`
+**Gemini:** Cloud API calls, requires `GEMINI_API_KEY`
+**Azure:** Cloud API calls, requires Azure credentials
+**Bedrock:** AWS API calls, requires AWS credentials
 ---
@@ -207,11 +227,13 @@ htm.add_message(
 ## Embedding Providers
-### Ollama (Default)
+HTM uses RubyLLM which supports multiple providers. Choose based on your requirements for privacy, cost, and quality.
+### Ollama (Default for Development)
 **Status**: ✅ Fully implemented
-Local embedding server with various models, accessed via HTTP.
+Local embedding server with various models.
 **Installation:**
@@ -234,25 +256,10 @@ ollama pull nomic-embed-text
 **Configuration:**
 ```ruby
-service = HTM::EmbeddingService.new(
-  :ollama,
-  model: 'nomic-embed-text',
-  ollama_url: 'http://localhost:11434'
-)
-embedding = service.embed("test text")
-```
-**Troubleshooting:**
-If Ollama is unavailable, embedding generation will fail:
-```ruby
-# Check Ollama is running
-system("curl http://localhost:11434/api/tags")
-# Start Ollama if needed
-system("ollama serve")
+HTM.configure do |config|
+  config.embedding.provider = :ollama
+  config.embedding.model = 'nomic-embed-text'
+end
 ```
 **Advantages:**
@@ -264,15 +271,14 @@ system("ollama serve")
 **Disadvantages:**
 - ❌ Requires local installation
 - ❌ Uses local compute resources
-- ❌ Slightly lower quality than OpenAI
 ---
-### OpenAI
+### OpenAI (Recommended for Production)
 **Status**: ✅ Fully implemented
-Uses OpenAI's embedding API, accessed via HTTP.
+Uses OpenAI's embedding API.
 **Configuration:**
@@ -281,13 +287,10 @@ export OPENAI_API_KEY="sk-..."
 ```
 ```ruby
-service = HTM::EmbeddingService.new(
-  :openai,
-  model: 'text-embedding-3-small'
-)
-# Add message - embedding generated via OpenAI API
-embedding = service.embed("test text")
+HTM.configure do |config|
+  config.embedding.provider = :openai
+  config.embedding.model = 'text-embedding-3-small'
+end
 ```
 **Models:**
@@ -295,20 +298,7 @@ embedding = service.embed("test text")
 | Model | Dimensions | Speed | Cost |
 |-------|------------|-------|------|
 | `text-embedding-3-small` | 1536 | Fast | $0.0001/1K tokens |
-| `text-embedding-ada-002` | 1536 | Fast | $0.0001/1K tokens |
-**Error Handling:**
-```ruby
-begin
-  service = HTM::EmbeddingService.new(:openai)
-  embedding = service.embed("test")
-rescue HTM::EmbeddingError => e
-  if e.message.include?("API key")
-    puts "Set OPENAI_API_KEY environment variable"
-  end
-end
-```
+| `text-embedding-3-large` | 3072 | Fast | $0.00013/1K tokens |
 **Advantages:**
 - ✅ High quality embeddings
@@ -316,10 +306,44 @@ end
 - ✅ Managed service
 **Disadvantages:**
-- ❌ API costs ($0.0001 per 1K tokens)
+- ❌ API costs
 - ❌ Requires internet connection
-- ❌ Data sent to OpenAI servers
-- ❌ Requires API key management
+- ❌ Data sent to cloud
+---
+### Other Providers
+**Gemini:**
+```bash
+export GEMINI_API_KEY="..."
+```
+```ruby
+HTM.configure do |config|
+  config.embedding.provider = :gemini
+  config.embedding.model = 'text-embedding-004'
+end
+```
+**Azure OpenAI:**
+```bash
+export AZURE_OPENAI_API_KEY="..."
+export AZURE_OPENAI_ENDPOINT="https://your-resource.openai.azure.com"
+```
+**AWS Bedrock:**
+```bash
+export AWS_ACCESS_KEY_ID="..."
+export AWS_SECRET_ACCESS_KEY="..."
+export AWS_REGION="us-east-1"
+```
+**DeepSeek:**
+```bash
+export DEEPSEEK_API_KEY="..."
+```
+See the [RubyLLM documentation](https://rubyllm.com/) for complete provider configuration.
 ---
@@ -335,15 +359,17 @@ end
 system("ollama serve")
 ```
-**OpenAI API key missing:**
+**API key missing (cloud providers):**
 ```ruby
-# Error: OPENAI_API_KEY not set
+# Error: API key not set
 # Solution: Set environment variable
-ENV['OPENAI_API_KEY'] = 'sk-...'
+ENV['OPENAI_API_KEY'] = 'sk-...'     # For OpenAI
+ENV['ANTHROPIC_API_KEY'] = 'sk-...'  # For Anthropic
+ENV['GEMINI_API_KEY'] = '...'        # For Gemini
 ```
-**Invalid model:**
+**Invalid model (Ollama):**
 ```ruby
 # Error: Model not found
@@ -368,9 +394,10 @@ Based on typical production workloads:
 | Ollama | nomic-embed-text | 20ms | 40ms | Free |
 | Ollama | mxbai-embed-large | 30ms | 60ms | Free |
 | OpenAI | text-embedding-3-small | 40ms | 80ms | $0.10 |
+| Gemini | text-embedding-004 | 50ms | 90ms | Varies |
 **Factors affecting latency:**
-- Network latency (Ollama local vs OpenAI remote)
+- Network latency (local providers vs cloud)
 - Text length (longer text = more tokens = slower)
 - Model size (larger models = slower)
 - System load (CPU/GPU utilization)
@@ -380,14 +407,17 @@ Based on typical production workloads:
 **Use appropriate model size:**
 ```ruby
-# Fast but lower quality
-service = HTM::EmbeddingService.new(:ollama, model: 'all-minilm')
+# Fast but lower quality (Ollama)
+HTM.configure { |c| c.embedding.model = 'all-minilm' }
-# Balanced (recommended)
-service = HTM::EmbeddingService.new(:ollama, model: 'nomic-embed-text')
+# Balanced - Ollama (recommended for development)
+HTM.configure { |c| c.embedding.model = 'nomic-embed-text' }
-# Slower but higher quality
-service = HTM::EmbeddingService.new(:ollama, model: 'mxbai-embed-large')
+# High quality - OpenAI (recommended for production)
+HTM.configure do |c|
+  c.embedding.provider = :openai
+  c.embedding.model = 'text-embedding-3-small'
+end
 ```
 **Batch operations:**
@@ -410,12 +440,12 @@ end
 HTM initializes `EmbeddingService` automatically:
 ```ruby
-htm = HTM.new(
-  robot_name: "Assistant",
-  embedding_provider: :ollama,        # Optional, default
-  embedding_model: 'nomic-embed-text' # Optional, default
-)
+HTM.configure do |config|
+  config.embedding.provider = :ollama  # or :openai, :gemini, etc.
+  config.embedding.model = 'nomic-embed-text'
+end
+htm = HTM.new(robot_name: "Assistant")
 # EmbeddingService is ready to use internally
 ```
@@ -426,13 +456,13 @@ sequenceDiagram
     participant App as Application
     participant HTM as HTM
     participant ES as EmbeddingService
-    participant Ollama as Ollama/OpenAI
+    participant LLM as LLM Provider (via RubyLLM)
     participant DB as PostgreSQL
     App->>HTM: add_message(content)
     HTM->>ES: embed(content)
-    ES->>Ollama: HTTP POST /api/embeddings
-    Ollama->>ES: embedding vector
+    ES->>LLM: Generate embedding
+    LLM->>ES: embedding vector
     ES->>HTM: Array<Float>
     HTM->>DB: INSERT with embedding
     DB->>HTM: node_id
@@ -484,21 +514,20 @@ puts "Token count: #{tokens}"
 ### Multiple Providers
 ```ruby
-# Ollama for development
-dev_service = HTM::EmbeddingService.new(
-  :ollama,
-  model: 'nomic-embed-text'
-)
+# Configure for development (Ollama)
+HTM.configure do |config|
+  config.embedding.provider = :ollama
+  config.embedding.model = 'nomic-embed-text'
+end
-# OpenAI for production
-prod_service = HTM::EmbeddingService.new(
-  :openai,
-  model: 'text-embedding-3-small'
-)
+# Configure for production (OpenAI)
+HTM.configure do |config|
+  config.embedding.provider = :openai
+  config.embedding.model = 'text-embedding-3-small'
+end
-# Same interface
-dev_embedding = dev_service.embed("test")
-prod_embedding = prod_service.embed("test")
+# Same interface regardless of provider
+embedding = HTM::EmbeddingService.new.embed("test")
 ```
 ### Custom Model Dimensions
@@ -521,6 +550,7 @@ embedding = service.embed("text")
 - [HTM API](htm.md) - Main HTM class
 - [LongTermMemory API](long-term-memory.md) - Storage layer
-- [ADR-003: Ollama Embeddings](../architecture/adrs/003-ollama-embeddings.md) - Architecture decision
-- [Ollama Documentation](https://ollama.ai/docs) - Ollama setup guide
-- [OpenAI Embeddings](https://platform.openai.com/docs/guides/embeddings) - OpenAI API docs
+- [ADR-003: Default Embedding Provider](../architecture/adrs/003-ollama-embeddings.md) - Architecture decision for defaults
+- [RubyLLM Documentation](https://rubyllm.com/) - Multi-provider LLM interface
+- [Ollama Documentation](https://ollama.ai/docs) - Local LLM provider
+- [OpenAI Embeddings](https://platform.openai.com/docs/guides/embeddings) - Cloud embeddings

data/docs/api/yard/HTM/ActiveRecordConfig.md CHANGED Viewed

@@ -4,6 +4,10 @@
 ActiveRecord database configuration and model loading
+Uses HTM::Config for database settings. Configuration can come from:
+*   Environment variables (HTM_DATABASE__URL, HTM_DATABASE__HOST, etc.)
+*   Programmatic configuration via HTM.configure
 # Class Methods
 ## connected?() {: #method-c-connected? }
@@ -18,6 +22,8 @@ Close all database connections
 Establish database connection from HTM::Config
 ## load_database_config() {: #method-c-load_database_config }
 Load database configuration from HTM::Config
+**`@return`** [Hash] ActiveRecord-compatible configuration hash
 ## verify_extensions!() {: #method-c-verify_extensions! }
 Verify required extensions are available

data/docs/api/yard/HTM/Config.md ADDED Viewed

@@ -0,0 +1,173 @@
+# Class: HTM::Config
+**Inherits:** Anyway::Config
+HTM Configuration using Anyway Config
+Schema is defined in lib/htm/config/defaults.yml (single source of truth)
+Configuration uses nested sections for better organization:
+    - HTM.config.database.host
+    - HTM.config.embedding.provider
+    - HTM.config.providers.openai.api_key
+Configuration sources (lowest to highest priority):
+1.  Bundled defaults: lib/htm/config/defaults.yml (ships with gem)
+2.  XDG user config:
+    *   ~/Library/Application Support/htm/htm.yml (macOS only)
+    *   ~/.config/htm/htm.yml (XDG default)
+    *   $XDG_CONFIG_HOME/htm/htm.yml (if XDG_CONFIG_HOME is set)
+3.  Project config: ./config/htm.yml (environment-specific)
+4.  Local overrides: ./config/htm.local.yml (gitignored)
+5.  Environment variables (HTM_*)
+6.  Explicit values passed to configure block
+**`@example`**
+```ruby
+export HTM_EMBEDDING__PROVIDER=openai
+export HTM_EMBEDDING__MODEL=text-embedding-3-small
+export HTM_PROVIDERS__OPENAI__API_KEY=sk-xxx
+```
+**`@example`**
+```ruby
+embedding:
+  provider: ollama
+  model: nomic-embed-text:latest
+providers:
+  ollama:
+    url: http://localhost:11434
+```
+**`@example`**
+```ruby
+HTM.configure do |config|
+  config.embedding.provider = :openai
+  config.embedding.model = 'text-embedding-3-small'
+end
+```
+# Class Methods
+## active_xdg_config_file() {: #method-c-active_xdg_config_file }
+## config_section_with_defaults(section_key ) {: #method-c-config_section_with_defaults }
+Create a coercion that merges incoming value with SCHEMA defaults for a
+section. This ensures env vars like HTM_DATABASE__URL don't lose other
+defaults.
+## deep_merge_hashes(base , overlay ) {: #method-c-deep_merge_hashes }
+Deep merge helper for coercion
+## env() {: #method-c-env }
+## xdg_config_file() {: #method-c-xdg_config_file }
+## xdg_config_paths() {: #method-c-xdg_config_paths }
+XDG Config Path Helpers
+# Attributes
+## embedding_generator[RW] {: #attribute-i-embedding_generator }
+Callable Accessors (not loaded from config sources)
+## logger[RW] {: #attribute-i-logger }
+Returns the value of attribute logger.
+## proposition_extractor[RW] {: #attribute-i-proposition_extractor }
+Callable Accessors (not loaded from config sources)
+## tag_extractor[RW] {: #attribute-i-tag_extractor }
+Callable Accessors (not loaded from config sources)
+## token_counter[RW] {: #attribute-i-token_counter }
+Returns the value of attribute token_counter.
+# Instance Methods
+## anthropic_api_key() {: #method-i-anthropic_api_key }
+## azure_api_key() {: #method-i-azure_api_key }
+## azure_api_version() {: #method-i-azure_api_version }
+## azure_endpoint() {: #method-i-azure_endpoint }
+## bedrock_access_key() {: #method-i-bedrock_access_key }
+## bedrock_region() {: #method-i-bedrock_region }
+## bedrock_secret_key() {: #method-i-bedrock_secret_key }
+## chunk_overlap() {: #method-i-chunk_overlap }
+## chunk_size() {: #method-i-chunk_size }
+Chunking convenience accessors
+## circuit_breaker_failure_threshold() {: #method-i-circuit_breaker_failure_threshold }
+Circuit breaker convenience accessors
+## circuit_breaker_half_open_max_calls() {: #method-i-circuit_breaker_half_open_max_calls }
+## circuit_breaker_reset_timeout() {: #method-i-circuit_breaker_reset_timeout }
+## configure_ruby_llm(providernil) {: #method-i-configure_ruby_llm }
+## database_config() {: #method-i-database_config }
+## database_configured?() {: #method-i-database_configured? }
+**`@return`** [Boolean]
+## database_url() {: #method-i-database_url }
+Database convenience methods
+## deepseek_api_key() {: #method-i-deepseek_api_key }
+## development?() {: #method-i-development? }
+**`@return`** [Boolean]
+## embedding_dimensions() {: #method-i-embedding_dimensions }
+## embedding_model() {: #method-i-embedding_model }
+## embedding_provider() {: #method-i-embedding_provider }
+Embedding convenience accessors
+## embedding_timeout() {: #method-i-embedding_timeout }
+## environment() {: #method-i-environment }
+## extract_propositions() {: #method-i-extract_propositions }
+## gemini_api_key() {: #method-i-gemini_api_key }
+## huggingface_api_key() {: #method-i-huggingface_api_key }
+## initialize() {: #method-i-initialize }
+Instance Methods
+**`@return`** [Config] a new instance of Config
+## job_backend() {: #method-i-job_backend }
+Job backend convenience accessor
+## max_embedding_dimension() {: #method-i-max_embedding_dimension }
+## max_tag_depth() {: #method-i-max_tag_depth }
+## normalize_ollama_model(model_name) {: #method-i-normalize_ollama_model }
+Ollama Helpers
+## ollama_url() {: #method-i-ollama_url }
+## openai_api_key() {: #method-i-openai_api_key }
+Provider credential convenience accessors
+## openai_organization() {: #method-i-openai_organization }
+## openai_project() {: #method-i-openai_project }
+## openrouter_api_key() {: #method-i-openrouter_api_key }
+## production?() {: #method-i-production? }
+**`@return`** [Boolean]
+## proposition_model() {: #method-i-proposition_model }
+## proposition_provider() {: #method-i-proposition_provider }
+Proposition convenience accessors
+## proposition_timeout() {: #method-i-proposition_timeout }
+## refresh_ollama_models!() {: #method-i-refresh_ollama_models! }
+## relevance_access_weight() {: #method-i-relevance_access_weight }
+## relevance_recency_half_life_hours() {: #method-i-relevance_recency_half_life_hours }
+## relevance_recency_weight() {: #method-i-relevance_recency_weight }
+## relevance_semantic_weight() {: #method-i-relevance_semantic_weight }
+Relevance scoring convenience accessors
+## relevance_tag_weight() {: #method-i-relevance_tag_weight }
+## reset_to_defaults() {: #method-i-reset_to_defaults }
+## service_name() {: #method-i-service_name }
+Service name convenience accessor
+## tag_model() {: #method-i-tag_model }
+## tag_provider() {: #method-i-tag_provider }
+Tag convenience accessors
+## tag_timeout() {: #method-i-tag_timeout }
+## test?() {: #method-i-test? }
+Environment Helpers
+**`@return`** [Boolean]
+## validate!() {: #method-i-validate! }
+## validate_settings!() {: #method-i-validate_settings! }

data/docs/api/yard/HTM/ConfigSection.md ADDED Viewed

@@ -0,0 +1,28 @@
+# Class: HTM::ConfigSection
+**Inherits:** Object
+ConfigSection provides method access to nested configuration hashes
+**`@example`**
+```ruby
+section = ConfigSection.new(host: 'localhost', port: 5432)
+section.host  # => 'localhost'
+section.port  # => 5432
+```
+# Instance Methods
+## `[](key)` {: #method-i-[] }
+## `[]=(key, value)` {: #method-i-[]= }
+## `each(&block)` {: #method-i-each }
+## `initialize(hash = {})` {: #method-i-initialize }
+**`@return`** [ConfigSection] a new instance of ConfigSection
+## `keys()` {: #method-i-keys }
+## `merge(other)` {: #method-i-merge }
+## `method_missing(method, *args, &block)` {: #method-i-method_missing }
+## `respond_to_missing?(method, include_private = false)` {: #method-i-respond_to_missing? }
+**`@return`** [Boolean]
+## `to_h()` {: #method-i-to_h }

data/docs/api/yard/HTM/Database.md CHANGED Viewed

@@ -8,7 +8,7 @@ initialization
 # Class Methods
 ## default_config() {: #method-c-default_config }
-Get default database configuration (respects HTM_ENV)
+Get default database configuration
 Uses HTM::Config for database settings.
 **`@return`** [Hash, nil] Connection configuration hash with PG-style keys

data/docs/api/yard/HTM/Railtie.md CHANGED Viewed

@@ -20,8 +20,8 @@ This railtie automatically configures HTM when Rails boots:
 ```ruby
 # config/initializers/htm.rb
 HTM.configure do |config|
-  config.embedding.model = 'custom-model'
-  config.tag.model = 'custom-tag-model'
+  config.embedding_model = 'custom-model'
+  config.tag_model = 'custom-tag-model'
 end
 ```