RubyGems - legion-llm - Versions diffs - 0.6.1 → 0.6.2 - Mend

legion-llm 0.6.1 → 0.6.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +6 -0
data/lib/legion/llm/embeddings.rb +11 -5
data/lib/legion/llm/version.rb +1 -1
metadata +1 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: bca23ecab222b8337fa88d7b2c62558334a547f24a86eb5cfb2a91e19cdddaaa
-  data.tar.gz: e6ef75f61a86d8a6e6bb1ed73a775180d2a70e3c5e42dbacb66ca43762b95dac
+  metadata.gz: f52899e131c7b40d4dba1576584fa0e9709022db8c83dfc6c2bf21044c58efe4
+  data.tar.gz: a45b7ba54bd018efbdaa61c1b13d53608560c432cb804ccb565aea5e99e0087e
 SHA512:
-  metadata.gz: 4e5d23bc887ceffee4e66212c45b83211deb7ad7d2da73fe199701ca894175cafe6245db62d4a330e2f2c3642e2b33d8d9e7d1751c8ff43294c473cefd876f18
-  data.tar.gz: ed094dfd2c7ff7771a9d8eeb0ecd05114ebe49cf79e402e5c69cf4f573746b0c53d51ad7fe5ba47cbd18fe3a9fe8d91b059cd73f399b3d082a1123dac3414485
+  metadata.gz: ea38c1ca6a6298e7aae10524afa822a2e85a83d0958ea8c830cf046470a3260db3605a0a59fed85bca08939a1914c86e226e306a11bbb602ffb6b6b13cfa6181
+  data.tar.gz: a57924ff5d697c34160d1fb5aa4ce515f55a7e0f52e5bab8d740bcbe31bfb6a947d475e44404f3f84b8078441df6087f1b8f466d25a0eb6e937781c601c99b7b

data/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,12 @@
 ## [Unreleased]
+## [0.6.2] - 2026-03-31
+### Fixed
+- Reduce `OLLAMA_CONTEXT_CHARS` from 2048 to 1400 for 512-token models (mxbai-embed-large, bge-large, snowflake-arctic-embed) to account for real tokenization ratios (~3 chars/token)
+- `generate_ollama` now catches context-length rejections and retries with chunking at 60% char limit instead of failing over to a potentially broken provider
 ## [0.6.1] - 2026-03-31
 ### Added

data/lib/legion/llm/embeddings.rb CHANGED Viewed

@@ -17,12 +17,12 @@ module Legion
       TARGET_DIMENSION = 1024
       OLLAMA_CONTEXT_CHARS = {
-        'mxbai-embed-large'      => 2048,
-        'bge-large'              => 2048,
-        'snowflake-arctic-embed' => 2048,
-        'nomic-embed-text'       => 32_768
+        'mxbai-embed-large'      => 1400,
+        'bge-large'              => 1400,
+        'snowflake-arctic-embed' => 1400,
+        'nomic-embed-text'       => 24_000
       }.freeze
-      OLLAMA_DEFAULT_CONTEXT_CHARS = 2048
+      OLLAMA_DEFAULT_CONTEXT_CHARS = 1400
       PREFIX_REGISTRY = {
         'nomic-embed-text'  => { document: 'search_document: ', query: 'search_query: ' },
@@ -219,6 +219,12 @@ module Legion
           return dimension_error(model, :ollama, vector) if vector.is_a?(String)
           { vector: vector, model: model, provider: :ollama, dimensions: vector&.size || 0, tokens: 0 }
+        rescue RuntimeError => e
+          raise unless e.message.include?('input length exceeds')
+          reduced = (max_chars * 0.6).to_i
+          Legion::Logging.info("Ollama context exceeded, retrying with chunking at #{reduced} chars") if defined?(Legion::Logging)
+          generate_ollama_chunked(text: text, model: model, max_chars: reduced)
         end
         def generate_ollama_chunked(text:, model:, max_chars:)

data/lib/legion/llm/version.rb CHANGED Viewed

@@ -2,6 +2,6 @@
 module Legion
   module LLM
-    VERSION = '0.6.1'
+    VERSION = '0.6.2'
   end
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: legion-llm
 version: !ruby/object:Gem::Version
-  version: 0.6.1
+  version: 0.6.2
 platform: ruby
 authors:
 - Esity