RubyGems - lex-llm-vllm - Versions diffs - 0.1.6 → 0.1.7 - Mend

lex-llm-vllm 0.1.6 → 0.1.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +6 -0
data/lib/legion/extensions/llm/vllm/provider.rb +26 -0
data/lib/legion/extensions/llm/vllm/version.rb +1 -1
metadata +1 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 3d9ce01c4d82eba349cdbe37aca5fa4b577dfc7bcf8d2b96c54353760f2162b0
-  data.tar.gz: dfe94103d8c4b71a7af0b5108e4bb021080406f065ad4cf16ae99ea67f696c16
+  metadata.gz: 3b6bccbfd1d8e01fd38459107474d9ca3853f7d847ff3b5d71a8df3ff7a66c4b
+  data.tar.gz: f2bd935851929d113f078301a08119a425a68c35907094ee66d69d10af3e5f6f
 SHA512:
-  metadata.gz: e0dff8aa6b171711dde2fc016f0a899e56b3ee54ed83868a19c8cd9420f7ff9b8e16cb2164df41cda3ae2c6d3e0c0400591a04dc6308abeca72ed31ec0627241
-  data.tar.gz: 283a82ff2cad5658fa7250e7c3a2a0492dd0f7d2de471352a89449b8874957f2f8062265b4497f46a43e83e0308458b64d01915d7d170e240ab0f5ffddaf50e9
+  metadata.gz: 837e7ea4d14a09dd44922cb6193e4650b92aea3c4eea8cd85ed7916d766c84b7f8887961b0fb72ab8a1578d4005742f61ed44435d181235bb4f26042aa6aecf8
+  data.tar.gz: 8c73bfdd7921d1f99d788d4a311be574fc7cb9f61c7ebb6a79bdf7ea4a68622f020ace60858134288eea85186beb3d4c32b97c5ac714515a124b8110f3253679

data/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,11 @@
 # Changelog
+## 0.1.7 - 2026-04-30
+- Enable stream_usage_supported? for streaming token usage reporting
+- Add render_payload override with chat_template_kwargs for vLLM thinking mode
+- Add thinking_enabled? setting support from Legion::Settings
 ## 0.1.6 - 2026-04-28
 - Publish best-effort `llm.registry` readiness and discovered-model availability events when transport is loaded.

data/lib/legion/extensions/llm/vllm/provider.rb CHANGED Viewed

@@ -45,6 +45,8 @@ module Legion
             end
           end
+          def stream_usage_supported? = true
           def api_base
             config.vllm_api_base || 'http://localhost:8000'
           end
@@ -102,6 +104,30 @@ module Legion
           private
+          def render_payload(messages, tools:, temperature:, model:, stream:, schema:, thinking:, tool_prefs:) # rubocop:disable Metrics/ParameterLists
+            payload = super
+            payload.delete(:reasoning_effort)
+            payload[:chat_template_kwargs] = { enable_thinking: true } if thinking_enabled?(thinking)
+            payload
+          end
+          def thinking_enabled?(thinking)
+            return true if thinking.is_a?(Hash) && (thinking[:enabled] != false)
+            return true if thinking.respond_to?(:enabled?) && thinking.enabled?
+            return vllm_thinking_setting unless thinking
+            false
+          end
+          def vllm_thinking_setting
+            return false unless defined?(Legion::Settings)
+            vllm = Legion::Settings.dig(:llm, :providers, :vllm)
+            vllm.is_a?(Hash) && (vllm[:enable_thinking] == true || vllm['enable_thinking'] == true)
+          rescue StandardError
+            false
+          end
           def with_query(path, positional = [], **params)
             pairs = positional + params.compact.map { |key, value| [key.to_s, value] }
             return path if pairs.empty?

data/lib/legion/extensions/llm/vllm/version.rb CHANGED Viewed

@@ -4,7 +4,7 @@ module Legion
   module Extensions
     module Llm
       module Vllm
-        VERSION = '0.1.6'
+        VERSION = '0.1.7'
       end
     end
   end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: lex-llm-vllm
 version: !ruby/object:Gem::Version
-  version: 0.1.6
+  version: 0.1.7
 platform: ruby
 authors:
 - LegionIO