RubyGems - lex-llm-openai - Versions diffs - 0.3.10 → 0.3.11 - Mend

lex-llm-openai 0.3.10 → 0.3.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +4 -0
data/README.md +214 -59
data/lib/legion/extensions/llm/openai/actors/discovery_refresh.rb +48 -0
data/lib/legion/extensions/llm/openai/version.rb +1 -1
metadata +2 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 35f7b923651392686a2c504e6ec30249ee8efa6c3f51c7171e18a11d124bc1d8
-  data.tar.gz: 7bc891da29aee08bb0bfa4600cd7cea7f0562703b210774d67b543682715143a
+  metadata.gz: 570527e7fb80e2b480eafd36844264bbb59ccfbc11fc4424213cc57cc1e539ea
+  data.tar.gz: 9ec953777f2f1b2a0c91dd63c697c5760c9264b6577ded5a50d39ae6ced7d991
 SHA512:
-  metadata.gz: 2efc2485c6e46d476c654cab015262030455c366546a649011e16be3fc4e0613d1d46d45ff5122d68a7335612bda14c9cebee0cff37012bfce7ee2df1a35687f
-  data.tar.gz: 72c4c111bf0c447e0e8646067508382e52524de22f66381824f143f8717edbadf17d424ff12c4935c773e670d8a46aa8e0a2a2c5307f648fbc33ebeaf2b230d8
+  metadata.gz: 077412edd3903af264268d9863f7ce69f522940d12abc47fb63b9f948ef607d5b39da14a8d5bf42912fd2143494577882aaf34c2656fd4df6d91ed3dadf4d09d
+  data.tar.gz: f6b2c1f473e83012b548d80763320b8d66263ade5438b13743b35b7bd4716bb72f2bf333a03679608f79dd520682b5c6d3f1778c7c4197eecde8869aa0338f57

data/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,9 @@
 # Changelog
+## 0.3.11 - 2026-06-05
+- Fix missing top-level documentation comment in `DiscoveryRefresh` actor (RuboCop `Style/Documentation`).
 ## 0.3.10 - 2026-05-21
 - api_base reads from settings[:endpoint] fallback

data/README.md CHANGED Viewed

@@ -2,53 +2,138 @@
 LegionIO LLM provider extension for OpenAI.
-This gem lives under `Legion::Extensions::Llm::Openai` and depends on `lex-llm >= 0.4.3` for shared provider-neutral routing, response normalization, fleet envelopes, fleet responder execution, and schema primitives.
+This gem provides the `:openai` provider family implementation, enabling LegionIO to route chat, streaming, embedding, moderation, image, and audio requests to OpenAI-compatible APIs through the shared `lex-llm` provider contract.
-Load it with `require 'legion/extensions/llm/openai'`.
+**Namespace:** `Legion::Extensions::Llm::Openai`
+**Version:** 0.3.11
+**Load:** `require 'legion/extensions/llm/openai'`
+## Quick Start
+```ruby
+require 'legion/extensions/llm/openai'
+# Configure via the shared LLM configuration API
+Legion::Extensions::Llm.configure do |config|
+  config.openai_api_key = ENV.fetch("OPENAI_API_KEY")
+  config.default_model = "gpt-5.5"
+end
+# Use through the standard provider interface
+provider = Legion::Extensions::Llm::Openai::Provider.new
+provider.chat(model: "gpt-5.5", messages: [{ role: "user", content: "Hello" }])
+```
 ## What It Provides
-- OpenAI provider discovery under the `:openai` provider family
-- Chat completions via `POST /v1/chat/completions`
-- Streaming chat completions (same endpoint, `stream: true`)
-- Model discovery via `GET /v1/models`
-- Model retrieval via `GET /v1/models/{model}`
-- Embeddings via `POST /v1/embeddings`
-- Moderation via `POST /v1/moderations`
-- Image generation via `POST /v1/images/generations`
-- Image editing via `POST /v1/images/edits`
-- Image variation via `POST /v1/images/variations`
-- Audio transcription via `POST /v1/audio/transcriptions`
-- Streaming token usage reporting (`stream_usage_supported?`)
-- Shared OpenAI-compatible request/response mapping via `Legion::Extensions::Llm::Provider::OpenAICompatible`
-- Normalized chat, embedding, moderation, image, and audio capability mapping for discovered models
-- Shared fleet/default settings via `Legion::Extensions::Llm.provider_settings`
-- Best-effort `llm.registry` availability event publishing for discovered models
-- Provider-owned fleet request handling through `Legion::Extensions::Llm::Fleet::ProviderResponder`
+| Capability | Endpoint | Notes |
+|---|---|---|
+| Chat completions | `POST /v1/chat/completions` | Includes function calling, vision, structured output |
+| Streaming chat | Same endpoint, `stream: true` | Token usage reported via `stream_usage_supported?` |
+| Model listing | `GET /v1/models` | Enriched with static capability map; publishes registry events |
+| Model retrieval | `GET /v1/models/{model}` | |
+| Embeddings | `POST /v1/embeddings` | |
+| Moderation | `POST /v1/moderations` | |
+| Image generation | `POST /v1/images/generations` | |
+| Image editing | `POST /v1/images/edits` | |
+| Image variation | `POST /v1/images/variations` | |
+| Audio transcription | `POST /v1/audio/transcriptions` | Whisper, gpt-4o-transcribe |
 ## Architecture
 ```
 Legion::Extensions::Llm::Openai
-|-- Provider                              # OpenAI provider implementation (chat, models, embeddings, etc.)
-|   `-- Capabilities                      # Model family capability predicates
-|-- Actor::FleetWorker                    # Subscription actor gate for provider-owned fleet requests
-`-- Runners::FleetWorker                  # Delegates request execution to lex-llm ProviderResponder
+|-- Openai                              # Root module — settings, discovery, auto-registration
+|   |-- default_settings                # Provider family defaults (endpoint, models, fleet)
+|   |-- discover_instances              # Credential scanning across env, Codex, Claude, settings
+|   |-- normalize_instance_config       # Normalizes generic keys to canonical OpenAI keys
+|   `-- sanitize_instance_config        # Strips temporary credential fields
+|
+|-- Provider                            # OpenAI provider implementation
+|   |-- Capabilities                    # Model family predicates (chat?, streaming?, vision?, etc.)
+|   |-- CAPABILITY_MAP                  # Static capability matrix for 14 known model families
+|   |-- list_models                     # Enriches raw API response with capability metadata
+|   |-- retrieve_model                  # Fetches single model detail
+|   |-- chat_url, models_url, etc.      # Endpoint builders
+|   `-- maybe_normalize_temperature     # Adjusts temperature for o*/gpt-5 reasoning models
+|
+|-- Actor::FleetWorker                  # Subscription actor for fleet request consumption
+|   |-- enabled?                        # Checks if any instance has respond_to_requests: true
+|   `-- Delegates to lex-llm ProviderResponder
+|
+|-- Actor::DiscoveryRefresh             # Periodic actor that refreshes the model discovery cache
+|   |-- time                            # Reads discovery_interval from settings (default 1800s)
+|   `-- Calls Legion::LLM::Discovery.refresh_discovered_models!
+|
+`-- Runners::FleetWorker                # Execution entrypoint for fleet requests
+    `-- handle_fleet_request            # Routes to lex-llm ProviderResponder.call
 ```
-Registry publishing, event envelope construction, fleet protocol handling, and fleet response/error transport live in `lex-llm`. This provider intentionally does not depend on `legion-llm` at runtime.
+### Design Boundaries
-## Observability
+- **Response normalization, request payload mapping** lives in `Lex-llm::Provider::OpenAICompatible` (mixed in)
+- **Fleet responder logic** (ack/reject, response publication) lives in `Lex-llm::Fleet::ProviderResponder`
+- **Registry event publishing** is delegated to `Lex-llm::RegistryPublisher`
+- This extension depends **only** on `lex-llm` at runtime; it does not depend on `legion-llm`
-The provider and root extension namespace use `Legion::Logging::Helper` for:
+## Instance Discovery
-- Structured `handle_exception` calls on every rescue block
-- Info-level action logging for model listing, model retrieval, and registry publishing
-- Automatic log segment derivation and component type tagging
+`Openai.discover_instances` scans 7 credential sources, deduplicates by key, and injects `default_model`:
-Fleet actor and runner code stays thin and delegates execution, ack/reject handling, and response publication to the shared `lex-llm` responder helper.
+| Priority | Source | Key |
+|---|---|---|
+| 1 | `OPENAI_API_KEY` environment variable | `:env` |
+| 2 | `CODEX_API_KEY` environment variable | `:codex_env` |
+| 3 | Codex bearer token (`~/.codex/auth.json`) | `:codex` |
+| 4 | Codex OpenAI key (`~/.codex/auth.json`) | `:codex_key` |
+| 5 | Claude config (`openaiApiKey`) | `:claude` |
+| 6 | Extension settings (`extensions.llm.openai`) | `:settings` |
+| 7 | Named instances in extension settings | Named keys |
+## Configuration
+### Via Legion Settings (YAML)
+```yaml
+extensions:
+  llm:
+    openai:
+      api_key: "sk-..."
+      default_model: "gpt-5.5"
+      endpoint: "https://api.openai.com"
+      discovery_interval: 1800    # Seconds between model list refresh (used by DiscoveryRefresh actor)
+      instances:
+        primary:
+          openai_api_key: "sk-..."
+          openai_api_base: "https://api.openai.com"
+          fleet:
+            enabled: true
+            respond_to_requests: true
+            capabilities:
+              - chat
+              - stream_chat
+              - embed
+              - image
+```
-## Defaults
+### Via Ruby Configuration API
+```ruby
+Legion::Extensions::Llm.configure do |config|
+  config.openai_api_key = ENV.fetch("OPENAI_API_KEY")
+  config.openai_api_base = nil                     # defaults to https://api.openai.com
+  config.openai_organization_id = nil              # optional OpenAI-Organization header
+  config.openai_project_id = nil                   # optional OpenAI-Project header
+  config.openai_use_system_role = true             # include system messages in requests
+  config.default_model = "gpt-5.5"
+  config.default_embedding_model = "text-embedding-3-small"
+  config.default_moderation_model = "omni-moderation-latest"
+  config.default_image_model = "gpt-image-1"
+  config.default_transcription_model = "gpt-4o-transcribe"
+end
+```
+### Default Settings
 ```ruby
 Legion::Extensions::Llm::Openai.default_settings
@@ -57,45 +142,78 @@ Legion::Extensions::Llm::Openai.default_settings
 #   instances: {
 #     default: {
 #       endpoint: "https://api.openai.com",
+#       default_model: "gpt-5.5",
 #       tier: :frontier,
 #       transport: :http,
-#       credentials: { api_key: "env://OPENAI_API_KEY" },
-#       usage: { inference: true, embedding: true, moderation: true, image: true, audio: true },
-#       limits: { concurrency: 4 }
+#       credentials: {
+#         api_key: "env://OPENAI_API_KEY",
+#         organization_id: nil,
+#         project_id: nil
+#       },
+#       usage: {
+#         inference: true,
+#         embedding: true,
+#         moderation: true,
+#         image: true,
+#         audio: true
+#       },
+#       limits: { concurrency: 4 },
+#       fleet: {
+#         enabled: false,
+#         respond_to_requests: false,
+#         capabilities: [:chat, :stream_chat, :embed, :image],
+#         lanes: [],
+#         concurrency: 4,
+#         queue_suffix: nil
+#       }
 #     }
 #   }
 # }
 ```
-## Configuration
+## Model Capability Map
-```ruby
-Legion::Extensions::Llm.configure do |config|
-  config.openai_api_key = ENV.fetch("OPENAI_API_KEY")
-  config.openai_api_base = nil                          # defaults to https://api.openai.com
-  config.openai_organization_id = nil                   # optional OpenAI-Organization header
-  config.openai_project_id = nil                        # optional OpenAI-Project header
-  config.default_model = "gpt-5.2"
-  config.default_embedding_model = "text-embedding-3-small"
-  config.default_moderation_model = "omni-moderation-latest"
-  config.default_image_model = "gpt-image-1"
-  config.default_transcription_model = "gpt-4o-transcribe"
-end
-```
+The provider maintains a static `CAPABILITY_MAP` covering 14 OpenAI model families. Each entry declares capabilities, input/output modalities, and context window size.
-## Dependencies
+| Prefix | Capabilities | Input | Output | Context |
+|---|---|---|---|---|
+| `gpt-4o` | completion, streaming, function_calling, vision, structured_output | text, image, audio | text | 128K |
+| `gpt-4.1` | completion, streaming, function_calling, vision, structured_output | text, image | text | 1M |
+| `gpt-4` | completion, streaming, function_calling, vision | text, image | text | 128K |
+| `gpt-5` | completion, streaming, function_calling, vision, structured_output, reasoning | text, image | text | 1M |
+| `o4` | completion, streaming, function_calling, vision, reasoning | text, image | text | 200K |
+| `o3` | completion, streaming, function_calling, vision, reasoning | text, image | text | 200K |
+| `o1` | completion, streaming, function_calling, vision, reasoning | text, image | text | 200K |
+| `text-embedding-*` | embedding | text | embeddings | 8K |
+| `omni-moderation` | moderation | text, image | moderation | - |
+| `text-moderation` | moderation | text | moderation | - |
+| `gpt-image` | image_generation | text, image | image | - |
+| `dall-e` | image_generation | text | image | - |
+| `whisper` | audio_transcription | audio | text | - |
+| `tts` | audio_generation | text | audio | - |
-| Gem | Purpose |
-|-----|---------|
-| `lex-llm` (>= 0.4.3) | Shared provider contract, response normalization, fleet settings, routing, and fleet responder execution |
-| `legion-transport` (>= 1.4.14) | AMQP subscriptions and replies |
-| `legion-json` (>= 1.2.1) | JSON serialization |
-| `legion-logging` (>= 1.3.2) | Structured logging via Helper |
-| `legion-settings` (>= 1.3.14) | Configuration management |
+Unknown models default to `{ capabilities: [:completion, :streaming], modalities: { input: ["text"], output: ["text"] } }`.
+## Capability Predicates
+`Provider::Capabilities` provides module functions for model routing decisions:
+| Method | Matches |
+|---|---|
+| `chat?(model)` | Any model that is not embedding, moderation, image, audio, tts, realtime, or sora |
+| `streaming?(model)` | Same as `chat?` |
+| `functions?(model)` | Models starting with `gpt` or `o\d` |
+| `vision?(model)` | Models starting with `gpt`, `o\d`, or `omni-moderation` |
+| `embeddings?(model)` | Models starting with `text-embedding-` |
+| `moderation?(model)` | Models containing `moderation` |
+| `images?(model)` | Models starting with `gpt-image` or `dall-e` |
+| `audio_transcription?(model)` | Models matching `gpt-4o.*transcribe` or `whisper` |
 ## Fleet Responder
-Provider instances can opt in to consuming Legion LLM fleet requests. The provider-owned fleet actor only starts when at least one configured instance enables `respond_to_requests`, and the runner delegates execution to `Legion::Extensions::Llm::Fleet::ProviderResponder` from `lex-llm`.
+Provider instances can opt in to consuming Legion LLM fleet requests via the shared `ProviderResponder`. The fleet actor starts automatically when any instance has `respond_to_requests: true`.
+### Fleet YAML Configuration
 ```yaml
 extensions:
@@ -113,12 +231,49 @@ extensions:
               - image
 ```
+### Fleet Components
+| Class | Role |
+|---|---|
+| `Actor::FleetWorker` | Subscription actor; checks `enabled?` against discovered instances |
+| `Runners::FleetWorker.handle_fleet_request` | Execution entrypoint; delegates to `ProviderResponder.call` |
+## Observability
+All classes include `Legion::Logging::Helper`:
+- **Structured error handling:** Every `rescue` calls `handle_exception` with operation context
+- **Debug-level request telemetry:** Model listing, retrieval, fleet dispatch, discovery refresh
+- **Info-level action logging:** Registry publishing, instance discovery results
+- **Automatic segment derivation:** Log lines tagged with provider family and component type
+## Dependencies
+| Gem | Purpose |
+|-----|---------|
+| `lex-llm` (>= 0.4.3) | Provider contract, OpenAICompatible mixin, fleet responder, registry publisher |
+| `legion-transport` (>= 1.4.14) | AMQP subscriptions and replies |
+| `legion-json` (>= 1.2.1) | JSON serialization |
+| `legion-logging` (>= 1.3.2) | Structured logging |
+| `legion-settings` (>= 1.3.14) | Configuration management |
+## Key Files
+| File | Purpose |
+|------|---------|
+| `lib/legion/extensions/llm/openai.rb` | Root module, settings, instance discovery, auto-registration |
+| `lib/legion/extensions/llm/openai/provider.rb` | Provider implementation, capability map, API methods |
+| `lib/legion/extensions/llm/openai/actors/discovery_refresh.rb` | Periodic model cache refresh actor |
+| `lib/legion/extensions/llm/openai/actors/fleet_worker.rb` | Fleet request subscription actor |
+| `lib/legion/extensions/llm/openai/runners/fleet_worker.rb` | Fleet request execution runner |
+| `lib/legion/extensions/llm/openai/version.rb` | Version constant |
 ## Development
 ```bash
 bundle install
-bundle exec rspec --format json --out tmp/rspec_results.json --format progress --out tmp/rspec_progress.txt
-bundle exec rubocop -A
+bundle exec rspec
+bundle exec rubocop
 ```
 ## License

data/lib/legion/extensions/llm/openai/actors/discovery_refresh.rb ADDED Viewed

@@ -0,0 +1,48 @@
+# frozen_string_literal: true
+begin
+  require 'legion/extensions/actors/every'
+rescue LoadError => e
+  warn(e.message) if $VERBOSE
+end
+return unless defined?(Legion::Extensions::Actors::Every)
+module Legion
+  module Extensions
+    module Llm
+      module Openai
+        module Actor
+          # Periodically refreshes the OpenAI model discovery cache.
+          class DiscoveryRefresh < Legion::Extensions::Actors::Every
+            include Legion::Logging::Helper
+            REFRESH_INTERVAL = 1800
+            def runner_class    = self.class
+            def runner_function = 'manual'
+            def run_now?        = true
+            def use_runner?     = false
+            def check_subtask?  = false
+            def generate_task?  = false
+            def time
+              return REFRESH_INTERVAL unless defined?(Legion::Settings)
+              Legion::Settings.dig(:extensions, :llm, :openai, :discovery_interval) || REFRESH_INTERVAL
+            end
+            def manual
+              log.debug('[openai][discovery_refresh] refreshing model list')
+              return unless defined?(Legion::LLM::Discovery)
+              Legion::LLM::Discovery.refresh_discovered_models!(provider: :openai)
+            rescue StandardError => e
+              handle_exception(e, level: :warn, handled: true, operation: 'openai.actor.discovery_refresh')
+            end
+          end
+        end
+      end
+    end
+  end
+end

data/lib/legion/extensions/llm/openai/version.rb CHANGED Viewed

@@ -4,7 +4,7 @@ module Legion
   module Extensions
     module Llm
       module Openai
-        VERSION = '0.3.10'
+        VERSION = '0.3.11'
       end
     end
   end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: lex-llm-openai
 version: !ruby/object:Gem::Version
-  version: 0.3.10
+  version: 0.3.11
 platform: ruby
 authors:
 - LegionIO
@@ -97,6 +97,7 @@ files:
 - README.md
 - lex-llm-openai.gemspec
 - lib/legion/extensions/llm/openai.rb
+- lib/legion/extensions/llm/openai/actors/discovery_refresh.rb
 - lib/legion/extensions/llm/openai/actors/fleet_worker.rb
 - lib/legion/extensions/llm/openai/provider.rb
 - lib/legion/extensions/llm/openai/runners/fleet_worker.rb