RubyGems - llm.rb - Versions diffs - 8.1.0 → 10.0.0 - Mend

llm.rb 8.1.0 → 10.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (86) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +196 -6
data/README.md +233 -518
data/data/anthropic.json +278 -258
data/data/bedrock.json +1288 -1561
data/data/deepseek.json +38 -38
data/data/google.json +656 -579
data/data/openai.json +860 -818
data/data/xai.json +243 -552
data/data/zai.json +168 -168
data/lib/llm/active_record/acts_as_agent.rb +5 -0
data/lib/llm/active_record/acts_as_llm.rb +7 -8
data/lib/llm/active_record.rb +1 -6
data/lib/llm/agent.rb +121 -82
data/lib/llm/context.rb +79 -74
data/lib/llm/contract/completion.rb +45 -0
data/lib/llm/cost.rb +81 -4
data/lib/llm/error.rb +1 -1
data/lib/llm/function/array.rb +8 -5
data/lib/llm/function/call_group.rb +39 -0
data/lib/llm/function/call_task.rb +46 -0
data/lib/llm/function/fork/task.rb +6 -0
data/lib/llm/function/ractor/task.rb +6 -0
data/lib/llm/function/task.rb +10 -0
data/lib/llm/function.rb +28 -1
data/lib/llm/mcp/transport/http.rb +26 -46
data/lib/llm/mcp/transport/stdio.rb +0 -8
data/lib/llm/mcp.rb +6 -23
data/lib/llm/provider.rb +30 -20
data/lib/llm/providers/anthropic/error_handler.rb +6 -7
data/lib/llm/providers/anthropic/files.rb +2 -2
data/lib/llm/providers/anthropic/response_adapter/completion.rb +30 -0
data/lib/llm/providers/anthropic/stream_parser.rb +2 -2
data/lib/llm/providers/anthropic.rb +1 -1
data/lib/llm/providers/bedrock/error_handler.rb +8 -9
data/lib/llm/providers/bedrock/models.rb +13 -13
data/lib/llm/providers/bedrock/response_adapter/completion.rb +30 -0
data/lib/llm/providers/bedrock/stream_parser.rb +2 -2
data/lib/llm/providers/bedrock.rb +1 -1
data/lib/llm/providers/google/error_handler.rb +6 -7
data/lib/llm/providers/google/files.rb +2 -4
data/lib/llm/providers/google/images.rb +1 -1
data/lib/llm/providers/google/models.rb +0 -2
data/lib/llm/providers/google/response_adapter/completion.rb +30 -0
data/lib/llm/providers/google/stream_parser.rb +2 -2
data/lib/llm/providers/google.rb +1 -1
data/lib/llm/providers/ollama/error_handler.rb +6 -7
data/lib/llm/providers/ollama/models.rb +0 -2
data/lib/llm/providers/ollama/response_adapter/completion.rb +30 -0
data/lib/llm/providers/ollama.rb +1 -1
data/lib/llm/providers/openai/audio.rb +3 -3
data/lib/llm/providers/openai/error_handler.rb +6 -7
data/lib/llm/providers/openai/files.rb +2 -2
data/lib/llm/providers/openai/images.rb +3 -3
data/lib/llm/providers/openai/models.rb +1 -1
data/lib/llm/providers/openai/response_adapter/completion.rb +42 -0
data/lib/llm/providers/openai/response_adapter/responds.rb +39 -0
data/lib/llm/providers/openai/responses/stream_parser.rb +2 -2
data/lib/llm/providers/openai/responses.rb +2 -2
data/lib/llm/providers/openai/stream_parser.rb +2 -2
data/lib/llm/providers/openai/vector_stores.rb +1 -1
data/lib/llm/providers/openai.rb +1 -1
data/lib/llm/response.rb +10 -8
data/lib/llm/schema.rb +11 -0
data/lib/llm/sequel/agent.rb +5 -0
data/lib/llm/sequel/plugin.rb +8 -14
data/lib/llm/stream/queue.rb +15 -42
data/lib/llm/stream.rb +15 -40
data/lib/llm/tool/param.rb +1 -8
data/lib/llm/transport/execution.rb +67 -0
data/lib/llm/transport/http.rb +134 -0
data/lib/llm/transport/persistent_http.rb +152 -0
data/lib/llm/transport/response/http.rb +113 -0
data/lib/llm/transport/response.rb +112 -0
data/lib/llm/{provider/transport/http → transport}/stream_decoder.rb +8 -4
data/lib/llm/transport.rb +139 -0
data/lib/llm/usage.rb +14 -5
data/lib/llm/utils.rb +24 -14
data/lib/llm/version.rb +1 -1
data/lib/llm.rb +3 -12
data/llm.gemspec +2 -16
metadata +13 -20
data/lib/llm/bot.rb +0 -3
data/lib/llm/provider/transport/http/execution.rb +0 -115
data/lib/llm/provider/transport/http/interruptible.rb +0 -114
data/lib/llm/provider/transport/http.rb +0 -145

data/lib/llm/providers/anthropic/response_adapter/completion.rb CHANGED Viewed

@@ -27,6 +27,36 @@ module LLM::Anthropic::ResponseAdapter
       0
     end
+    ##
+    # (see LLM::Contract::Completion#input_audio_tokens)
+    def input_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#output_audio_tokens)
+    def output_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#input_image_tokens)
+    def input_image_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_read_tokens)
+    def cache_read_tokens
+      body.usage&.cache_read_input_tokens || 0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_write_tokens)
+    def cache_write_tokens
+      body.usage&.cache_creation_input_tokens || 0
+    end
     ##
     # (see LLM::Contract::Completion#total_tokens)
     def total_tokens

data/lib/llm/providers/anthropic/stream_parser.rb CHANGED Viewed

@@ -105,14 +105,14 @@ class LLM::Anthropic
     end
     def resolve_tool(tool)
-      registered = @stream.find_tool(tool["name"])
+      registered = @stream.__find__(tool["name"])
       fn = (registered || LLM::Function.new(tool["name"])).dup.tap do |fn|
         fn.id = tool["id"]
         fn.arguments = LLM::Anthropic.parse_tool_input(tool["input"])
         fn.tracer = @stream.extra[:tracer]
         fn.model = @stream.extra[:model]
       end
-      [fn, (registered ? nil : @stream.tool_not_found(fn))]
+      [fn, (registered ? nil : fn.unavailable)]
     end
   end
 end

data/lib/llm/providers/anthropic.rb CHANGED Viewed

@@ -161,7 +161,7 @@ module LLM
       payload = adapt(messages)
       body = LLM.json.dump(payload.merge!(params))
       req = Net::HTTP::Post.new("/v1/messages", headers)
-      set_body_stream(req, StringIO.new(body))
+      transport.set_body_stream(req, StringIO.new(body))
       req
     end

data/lib/llm/providers/bedrock/error_handler.rb CHANGED Viewed

@@ -11,7 +11,7 @@ class LLM::Bedrock
   # @api private
   class ErrorHandler
     ##
-    # @return [Net::HTTPResponse]
+    # @return [LLM::Transport::Response]
     attr_reader :res
     ##
@@ -21,12 +21,12 @@ class LLM::Bedrock
     ##
     # @param [LLM::Tracer] tracer
     # @param [Object, nil] span
-    # @param [Net::HTTPResponse] res
+    # @param [LLM::Transport::Response, Net::HTTPResponse] res
     # @return [LLM::Bedrock::ErrorHandler]
     def initialize(tracer, span, res)
       @tracer = tracer
       @span = span
-      @res = res
+      @res = LLM::Transport::Response.from(res)
     end
     ##
@@ -44,16 +44,15 @@ class LLM::Bedrock
     # @return [LLM::Error]
     def error
       message = extract_message
-      case res
-      when Net::HTTPServerError
+      if res.server_error?
         LLM::ServerError.new(message).tap { _1.response = res }
-      when Net::HTTPUnauthorized
+      elsif res.unauthorized?
         LLM::UnauthorizedError.new(message).tap { _1.response = res }
-      when Net::HTTPForbidden
+      elsif res.forbidden?
         LLM::UnauthorizedError.new(message).tap { _1.response = res }
-      when Net::HTTPTooManyRequests
+      elsif res.rate_limited?
         LLM::RateLimitError.new(message).tap { _1.response = res }
-      when Net::HTTPNotFound
+      elsif res.not_found?
         LLM::Error.new("Bedrock model not found: #{message}").tap { _1.response = res }
       else
         LLM::Error.new(message).tap { _1.response = res }

data/lib/llm/providers/bedrock/models.rb CHANGED Viewed

@@ -8,8 +8,9 @@ class LLM::Bedrock
   #
   # Unlike the Converse API (which lives on `bedrock-runtime.<region>.amazonaws.com`),
   # the models endpoint lives on the control plane at
-  # `bedrock.<region>.amazonaws.com`. This class manages its own HTTP
-  # connection since the provider's transport is pinned to the runtime host.
+  # `bedrock.<region>.amazonaws.com`. This class builds a matching
+  # transport for the control-plane host from the provider's current
+  # transport class.
   #
   # @example
   #   llm = LLM.bedrock(
@@ -39,19 +40,18 @@ class LLM::Bedrock
     # @return [LLM::Response]
     def all(**params)
       host = credentials.host
-      handle_response http(host).request(build_request(host, params))
+      req = build_request(host, params)
+      res = build_transport(host).request(req, owner: self)
+      handle_response(res)
     end
     private
     ##
     # @param [String] host
-    # @return [Net::HTTP]
-    def http(host)
-      http = Net::HTTP.new(host, 443)
-      http.use_ssl = true
-      http.read_timeout = timeout
-      http
+    # @return [LLM::Transport]
+    def build_transport(host)
+      transport.class.new(host:, port: 443, timeout:, ssl: true)
     end
     ##
@@ -68,12 +68,12 @@ class LLM::Bedrock
     end
     ##
-    # @param [Net::HTTPResponse] res
+    # @param [LLM::Transport::Response, Net::HTTPResponse] res
     # @return [LLM::Response]
     # @raise [LLM::Error]
     def handle_response(res)
-      case res
-      when Net::HTTPSuccess
+      res = LLM::Transport::Response.from(res)
+      if res.success?
         res.body = LLM::Object.from(LLM.json.load(res.body || "{}"))
         LLM::Bedrock::ResponseAdapter.adapt(res, type: :models)
       else
@@ -102,7 +102,7 @@ class LLM::Bedrock
       end
     end
-    [:timeout, :tracer].each do |m|
+    [:timeout, :tracer, :transport].each do |m|
       define_method(m) { @provider.send(m) }
     end
   end

data/lib/llm/providers/bedrock/response_adapter/completion.rb CHANGED Viewed

@@ -56,6 +56,36 @@ module LLM::Bedrock::ResponseAdapter
       0
     end
+    ##
+    # (see LLM::Contract::Completion#input_audio_tokens)
+    def input_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#output_audio_tokens)
+    def output_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#input_image_tokens)
+    def input_image_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_read_tokens)
+    def cache_read_tokens
+      0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_write_tokens)
+    def cache_write_tokens
+      0
+    end
     ##
     # (see LLM::Contract::Completion#total_tokens)
     def total_tokens

data/lib/llm/providers/bedrock/stream_parser.rb CHANGED Viewed

@@ -184,14 +184,14 @@ class LLM::Bedrock
     def resolve_tool(tool)
       payload = tool["toolUse"] || {}
-      registered = @stream.find_tool(payload["name"])
+      registered = @stream.__find__(payload["name"])
       fn = (registered || LLM::Function.new(payload["name"])).dup.tap do |f|
         f.id = payload["toolUseId"]
         f.arguments = payload["input"] || {}
         f.tracer = @stream.extra[:tracer]
         f.model = @stream.extra[:model]
       end
-      [fn, registered ? nil : @stream.tool_not_found(fn)]
+      [fn, registered ? nil : fn.unavailable]
     end
     def content

data/lib/llm/providers/bedrock.rb CHANGED Viewed

@@ -218,7 +218,7 @@ module LLM
       path = stream ? "/model/#{model_id}/converse-stream" \
                     : "/model/#{model_id}/converse"
       req = Net::HTTP::Post.new(path, headers)
-      set_body_stream(req, StringIO.new(body))
+      transport.set_body_stream(req, StringIO.new(body))
       [req, messages, body]
     end

data/lib/llm/providers/google/error_handler.rb CHANGED Viewed

@@ -5,7 +5,7 @@ class LLM::Google
   # @private
   class ErrorHandler
     ##
-    # @return [Net::HTTPResponse]
+    # @return [LLM::Transport::Response]
     #  Non-2XX response from the server
     attr_reader :res
@@ -19,13 +19,13 @@ class LLM::Google
     #  The tracer
     # @param [Object, nil] span
     #  The span
-    # @param [Net::HTTPResponse] res
+    # @param [LLM::Transport::Response, Net::HTTPResponse] res
     #  The response from the server
     # @return [LLM::Google::ErrorHandler]
     def initialize(tracer, span, res)
       @tracer = tracer
       @span = span
-      @res = res
+      @res = LLM::Transport::Response.from(res)
     end
     ##
@@ -49,17 +49,16 @@ class LLM::Google
     ##
     # @return [LLM::Error]
     def error
-      case res
-      when Net::HTTPServerError
+      if res.server_error?
         LLM::ServerError.new("Server error").tap { _1.response = res }
-      when Net::HTTPBadRequest
+      elsif res.bad_request?
         reason = body.dig("error", "details", 0, "reason")
         if reason == "API_KEY_INVALID"
           LLM::UnauthorizedError.new("Authentication error").tap { _1.response = res }
         else
           LLM::Error.new("Unexpected response").tap { _1.response = res }
         end
-      when Net::HTTPTooManyRequests
+      elsif res.rate_limited?
         LLM::RateLimitError.new("Too many requests").tap { _1.response = res }
       else
         LLM::Error.new("Unexpected response").tap { _1.response = res }

data/lib/llm/providers/google/files.rb CHANGED Viewed

@@ -69,7 +69,7 @@ class LLM::Google
       req["X-Goog-Upload-Offset"] = 0
       req["X-Goog-Upload-Command"] = "upload, finalize"
       file.with_io do |io|
-        set_body_stream(req, io)
+        transport.set_body_stream(req, io)
         res, span, tracer = execute(request: req, operation: "request")
         res = ResponseAdapter.adapt(res, type: :file)
         tracer.on_request_finish(operation: "request", res:, span:)
@@ -127,8 +127,6 @@ class LLM::Google
     private
-    include LLM::Utils
     def request_upload_url(file:)
       req = Net::HTTP::Post.new("/upload/v1beta/files?key=#{key}", headers)
       req["X-Goog-Upload-Protocol"] = "resumable"
@@ -146,7 +144,7 @@ class LLM::Google
       @provider.instance_variable_get(:@key)
     end
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :transport].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/google/images.rb CHANGED Viewed

@@ -91,7 +91,7 @@ class LLM::Google
       @provider.instance_variable_get(:@key)
     end
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/google/models.rb CHANGED Viewed

@@ -17,8 +17,6 @@ class LLM::Google
   #     print "id: ", model.id, "\n"
   #   end
   class Models
-    include LLM::Utils
     ##
     # Returns a new Models object
     # @param provider [LLM::Provider]

data/lib/llm/providers/google/response_adapter/completion.rb CHANGED Viewed

@@ -33,6 +33,36 @@ module LLM::Google::ResponseAdapter
       body.usageMetadata.thoughtsTokenCount || 0
     end
+    ##
+    # (see LLM::Contract::Completion#input_audio_tokens)
+    def input_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#output_audio_tokens)
+    def output_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#input_image_tokens)
+    def input_image_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_read_tokens)
+    def cache_read_tokens
+      0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_write_tokens)
+    def cache_write_tokens
+      0
+    end
     ##
     # (see LLM::Contract::Completion#total_tokens)
     def total_tokens

data/lib/llm/providers/google/stream_parser.rb CHANGED Viewed

@@ -153,14 +153,14 @@ class LLM::Google
     def resolve_tool(part, cindex, pindex)
       call = part["functionCall"]
-      registered = @stream.find_tool(call["name"])
+      registered = @stream.__find__(call["name"])
       fn = (registered || LLM::Function.new(call["name"])).dup.tap do |fn|
         fn.id = LLM::Google.tool_id(part:, cindex:, pindex:)
         fn.arguments = call["args"]
         fn.tracer = @stream.extra[:tracer]
         fn.model = @stream.extra[:model]
       end
-      [fn, (registered ? nil : @stream.tool_not_found(fn))]
+      [fn, (registered ? nil : fn.unavailable)]
     end
   end
 end

data/lib/llm/providers/google.rb CHANGED Viewed

@@ -208,7 +208,7 @@ module LLM
       req  = Net::HTTP::Post.new(path, headers)
       messages = build_complete_messages(prompt, params, role)
       body = LLM.json.dump({contents: adapt(messages)}.merge!(params))
-      set_body_stream(req, StringIO.new(body))
+      transport.set_body_stream(req, StringIO.new(body))
       req
     end

data/lib/llm/providers/ollama/error_handler.rb CHANGED Viewed

@@ -5,7 +5,7 @@ class LLM::Ollama
   # @private
   class ErrorHandler
     ##
-    # @return [Net::HTTPResponse]
+    # @return [LLM::Transport::Response]
     #  Non-2XX response from the server
     attr_reader :res
@@ -19,13 +19,13 @@ class LLM::Ollama
     #  The tracer
     # @param [Object, nil] span
     #  The span
-    # @param [Net::HTTPResponse] res
+    # @param [LLM::Transport::Response, Net::HTTPResponse] res
     #  The response from the server
     # @return [LLM::Ollama::ErrorHandler]
     def initialize(tracer, span, res)
       @tracer = tracer
       @span = span
-      @res = res
+      @res = LLM::Transport::Response.from(res)
     end
     ##
@@ -43,12 +43,11 @@ class LLM::Ollama
     ##
     # @return [LLM::Error]
     def error
-      case res
-      when Net::HTTPServerError
+      if res.server_error?
         LLM::ServerError.new("Server error").tap { _1.response = res }
-      when Net::HTTPUnauthorized
+      elsif res.unauthorized?
         LLM::UnauthorizedError.new("Authentication error").tap { _1.response = res }
-      when Net::HTTPTooManyRequests
+      elsif res.rate_limited?
         LLM::RateLimitError.new("Too many requests").tap { _1.response = res }
       else
         LLM::Error.new("Unexpected response").tap { _1.response = res }

data/lib/llm/providers/ollama/models.rb CHANGED Viewed

@@ -17,8 +17,6 @@ class LLM::Ollama
   #     print "id: ", model.id, "\n"
   #   end
   class Models
-    include LLM::Utils
     ##
     # Returns a new Models object
     # @param provider [LLM::Provider]

data/lib/llm/providers/ollama/response_adapter/completion.rb CHANGED Viewed

@@ -27,6 +27,36 @@ module LLM::Ollama::ResponseAdapter
       0
     end
+    ##
+    # (see LLM::Contract::Completion#input_audio_tokens)
+    def input_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#output_audio_tokens)
+    def output_audio_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#input_image_tokens)
+    def input_image_tokens
+      super
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_read_tokens)
+    def cache_read_tokens
+      0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_write_tokens)
+    def cache_write_tokens
+      0
+    end
     ##
     # (see LLM::Contract::Completion#total_tokens)
     def total_tokens

data/lib/llm/providers/ollama.rb CHANGED Viewed

@@ -130,7 +130,7 @@ module LLM
       messages = build_complete_messages(prompt, params, role)
       body = LLM.json.dump({messages: [adapt(messages)].flatten}.merge!(params))
       req = Net::HTTP::Post.new("/api/chat", headers)
-      set_body_stream(req, StringIO.new(body))
+      transport.set_body_stream(req, StringIO.new(body))
       req
     end

data/lib/llm/providers/openai/audio.rb CHANGED Viewed

@@ -57,7 +57,7 @@ class LLM::OpenAI
       multi = LLM::Multipart.new(params.merge!(file: LLM.File(file), model:))
       req = Net::HTTP::Post.new(path("/audio/transcriptions"), headers)
       req["content-type"] = multi.content_type
-      set_body_stream(req, multi.body)
+      transport.set_body_stream(req, multi.body)
       res, span, tracer = execute(request: req, operation: "request")
       res = LLM::Response.new(res)
       tracer.on_request_finish(operation: "request", model:, res:, span:)
@@ -81,7 +81,7 @@ class LLM::OpenAI
       multi = LLM::Multipart.new(params.merge!(file: LLM.File(file), model:))
       req = Net::HTTP::Post.new(path("/audio/translations"), headers)
       req["content-type"] = multi.content_type
-      set_body_stream(req, multi.body)
+      transport.set_body_stream(req, multi.body)
       res, span, tracer = execute(request: req, operation: "request")
       res = LLM::Response.new(res)
       tracer.on_request_finish(operation: "request", model:, res:, span:)
@@ -90,7 +90,7 @@ class LLM::OpenAI
     private
-    [:path, :headers, :execute, :set_body_stream].each do |m|
+    [:path, :headers, :execute, :transport].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/error_handler.rb CHANGED Viewed

@@ -5,7 +5,7 @@ class LLM::OpenAI
   # @private
   class ErrorHandler
     ##
-    # @return [Net::HTTPResponse]
+    # @return [LLM::Transport::Response]
     #  Non-2XX response from the server
     attr_reader :res
@@ -19,13 +19,13 @@ class LLM::OpenAI
     #  The tracer
     # @param [Object, nil] span
     #  The span
-    # @param [Net::HTTPResponse] res
+    # @param [LLM::Transport::Response, Net::HTTPResponse] res
     #  The response from the server
     # @return [LLM::OpenAI::ErrorHandler]
     def initialize(tracer, span, res)
       @tracer = tracer
       @span = span
-      @res = res
+      @res = LLM::Transport::Response.from(res)
     end
     ##
@@ -49,12 +49,11 @@ class LLM::OpenAI
     ##
     # @return [LLM::Error]
     def error
-      case res
-      when Net::HTTPServerError
+      if res.server_error?
         LLM::ServerError.new("Server error").tap { _1.response = res }
-      when Net::HTTPUnauthorized
+      elsif res.unauthorized?
         LLM::UnauthorizedError.new("Authentication error").tap { _1.response = res }
-      when Net::HTTPTooManyRequests
+      elsif res.rate_limited?
         LLM::RateLimitError.new("Too many requests").tap { _1.response = res }
       else
         error = body["error"] || {}

data/lib/llm/providers/openai/files.rb CHANGED Viewed

@@ -62,7 +62,7 @@ class LLM::OpenAI
       multi = LLM::Multipart.new(params.merge!(file: LLM.File(file), purpose:))
       req = Net::HTTP::Post.new(path("/files"), headers)
       req["content-type"] = multi.content_type
-      set_body_stream(req, multi.body)
+      transport.set_body_stream(req, multi.body)
       res, span, tracer = execute(request: req, operation: "request")
       res = ResponseAdapter.adapt(res, type: :file)
       tracer.on_request_finish(operation: "request", res:, span:)
@@ -134,7 +134,7 @@ class LLM::OpenAI
     private
-    [:path, :headers, :execute, :set_body_stream].each do |m|
+    [:path, :headers, :execute, :transport].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/images.rb CHANGED Viewed

@@ -78,7 +78,7 @@ class LLM::OpenAI
       multi = LLM::Multipart.new(params.merge!(image:, model:, response_format:))
       req = Net::HTTP::Post.new(path("/images/variations"), headers)
       req["content-type"] = multi.content_type
-      set_body_stream(req, multi.body)
+      transport.set_body_stream(req, multi.body)
       res, span, tracer = execute(request: req, operation: "request")
       res = ResponseAdapter.adapt(res, type: :image)
       tracer.on_request_finish(operation: "request", model:, res:, span:)
@@ -104,7 +104,7 @@ class LLM::OpenAI
       multi = LLM::Multipart.new(params.merge!(image:, prompt:, model:, response_format:))
       req = Net::HTTP::Post.new(path("/images/edits"), headers)
       req["content-type"] = multi.content_type
-      set_body_stream(req, multi.body)
+      transport.set_body_stream(req, multi.body)
       res, span, tracer = execute(request: req, operation: "request")
       res = ResponseAdapter.adapt(res, type: :image)
       tracer.on_request_finish(operation: "request", model:, res:, span:)
@@ -113,7 +113,7 @@ class LLM::OpenAI
     private
-    [:path, :headers, :execute, :set_body_stream].each do |m|
+    [:path, :headers, :execute, :transport].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/models.rb CHANGED Viewed

@@ -48,7 +48,7 @@ class LLM::OpenAI
     private
-    [:path, :headers, :execute, :set_body_stream].each do |m|
+    [:path, :headers, :execute].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/response_adapter/completion.rb CHANGED Viewed

@@ -40,6 +40,48 @@ module LLM::OpenAI::ResponseAdapter
         &.reasoning_tokens || 0
     end
+    ##
+    # (see LLM::Contract::Completion#input_audio_tokens)
+    def input_audio_tokens
+      body
+        .usage
+        &.prompt_tokens_details
+        &.audio_tokens || 0
+    end
+    ##
+    # (see LLM::Contract::Completion#output_audio_tokens)
+    def output_audio_tokens
+      body
+        .usage
+        &.completion_tokens_details
+        &.audio_tokens || 0
+    end
+    ##
+    # (see LLM::Contract::Completion#input_image_tokens)
+    def input_image_tokens
+      body
+        .usage
+        &.prompt_tokens_details
+        &.image_tokens || 0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_read_tokens)
+    def cache_read_tokens
+      body
+        .usage
+        &.prompt_tokens_details
+        &.cached_tokens || 0
+    end
+    ##
+    # (see LLM::Contract::Completion#cache_write_tokens)
+    def cache_write_tokens
+      0
+    end
     ##
     # (see LLM::Contract::Completion#total_tokens)
     def total_tokens