RubyGems - llm.rb - Versions diffs - 4.0.0 → 4.2.0 - Mend

llm.rb 4.0.0 → 4.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (50) hide show

checksums.yaml +4 -4
data/LICENSE +2 -2
data/README.md +226 -192
data/lib/llm/agent.rb +226 -0
data/lib/llm/bot.rb +57 -28
data/lib/llm/error.rb +4 -0
data/lib/llm/function/tracing.rb +19 -0
data/lib/llm/function.rb +16 -3
data/lib/llm/json_adapter.rb +1 -1
data/lib/llm/message.rb +7 -0
data/lib/llm/prompt.rb +85 -0
data/lib/llm/provider.rb +74 -10
data/lib/llm/providers/anthropic/error_handler.rb +27 -5
data/lib/llm/providers/anthropic/files.rb +22 -16
data/lib/llm/providers/anthropic/models.rb +4 -3
data/lib/llm/providers/anthropic.rb +6 -5
data/lib/llm/providers/deepseek.rb +3 -3
data/lib/llm/providers/gemini/error_handler.rb +34 -12
data/lib/llm/providers/gemini/files.rb +18 -13
data/lib/llm/providers/gemini/images.rb +4 -3
data/lib/llm/providers/gemini/models.rb +4 -3
data/lib/llm/providers/gemini.rb +36 -13
data/lib/llm/providers/llamacpp.rb +3 -3
data/lib/llm/providers/ollama/error_handler.rb +28 -6
data/lib/llm/providers/ollama/models.rb +4 -3
data/lib/llm/providers/ollama.rb +9 -7
data/lib/llm/providers/openai/audio.rb +10 -7
data/lib/llm/providers/openai/error_handler.rb +41 -14
data/lib/llm/providers/openai/files.rb +19 -14
data/lib/llm/providers/openai/images.rb +10 -7
data/lib/llm/providers/openai/models.rb +4 -3
data/lib/llm/providers/openai/moderations.rb +4 -3
data/lib/llm/providers/openai/responses.rb +10 -7
data/lib/llm/providers/openai/vector_stores.rb +34 -23
data/lib/llm/providers/openai.rb +9 -7
data/lib/llm/providers/xai.rb +3 -3
data/lib/llm/providers/zai.rb +2 -2
data/lib/llm/schema/object.rb +2 -2
data/lib/llm/schema.rb +16 -2
data/lib/llm/server_tool.rb +3 -3
data/lib/llm/session.rb +3 -0
data/lib/llm/tracer/logger.rb +192 -0
data/lib/llm/tracer/null.rb +49 -0
data/lib/llm/tracer/telemetry.rb +255 -0
data/lib/llm/tracer.rb +134 -0
data/lib/llm/version.rb +1 -1
data/lib/llm.rb +5 -3
data/llm.gemspec +4 -1
metadata +39 -3
data/lib/llm/builder.rb +0 -61

data/lib/llm/providers/ollama/error_handler.rb CHANGED Viewed

@@ -10,10 +10,21 @@ class LLM::Ollama
     attr_reader :res
     ##
+    # @return [Object, nil]
+    #  The span
+    attr_reader :span
+    ##
+    # @param [LLM::Tracer] tracer
+    #  The tracer
+    # @param [Object, nil] span
+    #  The span
     # @param [Net::HTTPResponse] res
     #  The response from the server
-    # @return [LLM::OpenAI::ErrorHandler]
-    def initialize(res)
+    # @return [LLM::Ollama::ErrorHandler]
+    def initialize(tracer, span, res)
+      @tracer = tracer
+      @span = span
       @res = res
     end
@@ -21,15 +32,26 @@ class LLM::Ollama
     # @raise [LLM::Error]
     #  Raises a subclass of {LLM::Error LLM::Error}
     def raise_error!
+      ex = error
+      @tracer.on_request_error(ex:, span:)
+    ensure
+      raise(ex)
+    end
+    private
+    ##
+    # @return [LLM::Error]
+    def error
       case res
       when Net::HTTPServerError
-        raise LLM::ServerError.new { _1.response = res }, "Server error"
+        LLM::ServerError.new("Server error").tap { _1.response = res }
       when Net::HTTPUnauthorized
-        raise LLM::UnauthorizedError.new { _1.response = res }, "Authentication error"
+        LLM::UnauthorizedError.new("Authentication error").tap { _1.response = res }
       when Net::HTTPTooManyRequests
-        raise LLM::RateLimitError.new { _1.response = res }, "Too many requests"
+        LLM::RateLimitError.new("Too many requests").tap { _1.response = res }
       else
-        raise LLM::Error.new { _1.response = res }, "Unexpected response"
+        LLM::Error.new("Unexpected response").tap { _1.response = res }
       end
     end
   end

data/lib/llm/providers/ollama/models.rb CHANGED Viewed

@@ -43,13 +43,14 @@ class LLM::Ollama
     def all(**params)
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/api/tags?#{query}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     private
-    [:headers, :execute].each do |m|
+    [:headers, :execute, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/ollama.rb CHANGED Viewed

@@ -12,9 +12,9 @@ module LLM
   #   require "llm"
   #
   #   llm = LLM.ollama(key: nil)
-  #   bot = LLM::Bot.new(llm, model: "llava")
-  #   bot.chat ["Tell me about this image", File.open("/images/parrot.png", "rb")]
-  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  #   ses = LLM::Session.new(llm, model: "llava")
+  #   ses.talk ["Tell me about this image", ses.local_file("/images/photo.png")]
+  #   ses.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class Ollama < Provider
     require_relative "ollama/error_handler"
     require_relative "ollama/request_adapter"
@@ -43,8 +43,9 @@ module LLM
       params   = {model:}.merge!(params)
       req      = Net::HTTP::Post.new("/v1/embeddings", headers)
       req.body = LLM.json.dump({input:}.merge!(params))
-      res      = execute(request: req)
-      ResponseAdapter.adapt(res, type: :embedding)
+      res, span = execute(request: req, operation: "embeddings", model:)
+      res = ResponseAdapter.adapt(res, type: :embedding)
+      finish_trace(operation: "embeddings", model:, res:, span:)
     end
     ##
@@ -60,9 +61,10 @@ module LLM
     def complete(prompt, params = {})
       params, stream, tools, role = normalize_complete_params(params)
       req = build_complete_request(prompt, params, role)
-      res = execute(request: req, stream: stream)
-      ResponseAdapter.adapt(res, type: :completion)
+      res, span = execute(request: req, stream: stream, operation: "chat", model: params[:model])
+      res = ResponseAdapter.adapt(res, type: :completion)
         .extend(Module.new { define_method(:__tools__) { tools } })
+      finish_trace(operation: "chat", model: params[:model], res:, span:)
     end
     ##

data/lib/llm/providers/openai/audio.rb CHANGED Viewed

@@ -35,8 +35,9 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/audio/speech", headers)
       req.body = LLM.json.dump({input:, voice:, model:, response_format:}.merge!(params))
       io = StringIO.new("".b)
-      res = execute(request: req) { _1.read_body { |chunk| io << chunk } }
-      LLM::Response.new(res).tap { _1.define_singleton_method(:audio) { io } }
+      res, span = execute(request: req, operation: "request") { _1.read_body { |chunk| io << chunk } }
+      res = LLM::Response.new(res).tap { _1.define_singleton_method(:audio) { io } }
+      finish_trace(operation: "request", model:, res:, span:)
     end
     ##
@@ -56,8 +57,9 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/audio/transcriptions", headers)
       req["content-type"] = multi.content_type
       set_body_stream(req, multi.body)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     ##
@@ -78,13 +80,14 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/audio/translations", headers)
       req["content-type"] = multi.content_type
       set_body_stream(req, multi.body)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     private
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/error_handler.rb CHANGED Viewed

@@ -10,10 +10,21 @@ class LLM::OpenAI
     attr_reader :res
     ##
+    # @return [Object, nil]
+    #  The span
+    attr_reader :span
+    ##
+    # @param [LLM::Tracer] tracer
+    #  The tracer
+    # @param [Object, nil] span
+    #  The span
     # @param [Net::HTTPResponse] res
     #  The response from the server
     # @return [LLM::OpenAI::ErrorHandler]
-    def initialize(res)
+    def initialize(tracer, span, res)
+      @tracer = tracer
+      @span = span
       @res = res
     end
@@ -21,36 +32,52 @@ class LLM::OpenAI
     # @raise [LLM::Error]
     #  Raises a subclass of {LLM::Error LLM::Error}
     def raise_error!
+      ex = error
+      @tracer.on_request_error(ex:, span:)
+    ensure
+      raise(ex)
+    end
+    private
+    ##
+    # @return [LLM::Object]
+    def body
+      @body ||= LLM.json.load(res.body)
+    end
+    ##
+    # @return [LLM::Error]
+    def error
       case res
       when Net::HTTPServerError
-        raise LLM::ServerError.new { _1.response = res }, "Server error"
+        LLM::ServerError.new("Server error").tap { _1.response = res }
       when Net::HTTPUnauthorized
-        raise LLM::UnauthorizedError.new { _1.response = res }, "Authentication error"
+        LLM::UnauthorizedError.new("Authentication error").tap { _1.response = res }
       when Net::HTTPTooManyRequests
-        raise LLM::RateLimitError.new { _1.response = res }, "Too many requests"
+        LLM::RateLimitError.new("Too many requests").tap { _1.response = res }
       else
         error = body["error"] || {}
         case error["type"]
         when "invalid_request_error" then handle_invalid_request(error)
-        when "server_error" then raise LLM::ServerError.new { _1.response = res }, error["message"]
-        else raise LLM::Error.new { _1.response = res }, error["message"] || "Unexpected response"
+        when "server_error"
+          LLM::ServerError.new(error["message"]).tap { _1.response = res }
+        else
+          LLM::Error.new(error["message"] || "Unexpected response").tap { _1.response = res }
         end
       end
     end
-    private
+    ##
+    # @param [Exception] error
+    # @return [LLM::Error]
     def handle_invalid_request(error)
       case error["code"]
       when "context_length_exceeded"
-        raise LLM::ContextWindowError.new { _1.response = res }, error["message"]
+        LLM::ContextWindowError.new(error["message"]).tap { _1.response = res }
       else
-        raise LLM::InvalidRequestError.new { _1.response = res }, error["message"]
+        LLM::InvalidRequestError.new(error["message"]).tap { _1.response = res }
       end
     end
-    def body
-      @body ||= LLM.json.load(res.body)
-    end
   end
 end

data/lib/llm/providers/openai/files.rb CHANGED Viewed

@@ -13,10 +13,10 @@ class LLM::OpenAI
   #   require "llm"
   #
   #   llm = LLM.openai(key: ENV["KEY"])
-  #   bot = LLM::Bot.new(llm)
+  #   ses = LLM::Session.new(llm)
   #   file = llm.files.create file: "/books/goodread.pdf"
-  #   bot.chat ["Tell me about this PDF", file]
-  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  #   ses.talk ["Tell me about this PDF", file]
+  #   ses.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class Files
     ##
     # Returns a new Files object
@@ -41,8 +41,9 @@ class LLM::OpenAI
     def all(**params)
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/files?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :enumerable)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :enumerable)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -61,8 +62,9 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/files", headers)
       req["content-type"] = multi.content_type
       set_body_stream(req, multi.body)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :file)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :file)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -80,8 +82,9 @@ class LLM::OpenAI
       file_id = file.respond_to?(:id) ? file.id : file
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/files/#{file_id}?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :file)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :file)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -101,8 +104,9 @@ class LLM::OpenAI
       file_id = file.respond_to?(:id) ? file.id : file
       req = Net::HTTP::Get.new("/v1/files/#{file_id}/content?#{query}", headers)
       io = StringIO.new("".b)
-      res = execute(request: req) { |res| res.read_body { |chunk| io << chunk } }
-      LLM::Response.new(res).tap { _1.define_singleton_method(:file) { io } }
+      res, span = execute(request: req, operation: "request") { |res| res.read_body { |chunk| io << chunk } }
+      res = LLM::Response.new(res).tap { _1.define_singleton_method(:file) { io } }
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -118,13 +122,14 @@ class LLM::OpenAI
     def delete(file:)
       file_id = file.respond_to?(:id) ? file.id : file
       req = Net::HTTP::Delete.new("/v1/files/#{file_id}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     private
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/images.rb CHANGED Viewed

@@ -50,8 +50,9 @@ class LLM::OpenAI
     def create(prompt:, model: "dall-e-3", **params)
       req = Net::HTTP::Post.new("/v1/images/generations", headers)
       req.body = LLM.json.dump({prompt:, n: 1, model:}.merge!(params))
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :image)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :image)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     ##
@@ -72,8 +73,9 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/images/variations", headers)
       req["content-type"] = multi.content_type
       set_body_stream(req, multi.body)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :image)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :image)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     ##
@@ -95,13 +97,14 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/images/edits", headers)
       req["content-type"] = multi.content_type
       set_body_stream(req, multi.body)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :image)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :image)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     private
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/models.rb CHANGED Viewed

@@ -40,13 +40,14 @@ class LLM::OpenAI
     def all(**params)
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/models?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :enumerable)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :enumerable)
+      finish_trace(operation: "request", res:, span:)
     end
     private
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/moderations.rb CHANGED Viewed

@@ -50,13 +50,14 @@ class LLM::OpenAI
       req = Net::HTTP::Post.new("/v1/moderations", headers)
       input = RequestAdapter::Moderation.new(input).adapt
       req.body = LLM.json.dump({input:, model:}.merge!(params))
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :moderations)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :moderations)
+      finish_trace(operation: "request", model:, res:, span:)
     end
     private
-    [:headers, :execute].each do |m|
+    [:headers, :execute, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai/responses.rb CHANGED Viewed

@@ -44,9 +44,10 @@ class LLM::OpenAI
       messages = [*(params.delete(:input) || []), LLM::Message.new(role, prompt)]
       body = LLM.json.dump({input: [adapt(messages, mode: :response)].flatten}.merge!(params))
       set_body_stream(req, StringIO.new(body))
-      res = execute(request: req, stream:, stream_parser:)
-      ResponseAdapter.adapt(res, type: :responds)
+      res, span = execute(request: req, stream:, stream_parser:, operation: "chat", model: params[:model])
+      res = ResponseAdapter.adapt(res, type: :responds)
         .extend(Module.new { define_method(:__tools__) { tools } })
+      finish_trace(operation: "chat", model: params[:model], res:, span:)
     end
     ##
@@ -59,8 +60,9 @@ class LLM::OpenAI
       response_id = response.respond_to?(:id) ? response.id : response
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/responses/#{response_id}?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :responds)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :responds)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -72,13 +74,14 @@ class LLM::OpenAI
     def delete(response)
       response_id = response.respond_to?(:id) ? response.id : response
       req = Net::HTTP::Delete.new("/v1/responses/#{response_id}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     private
-    [:headers, :execute, :set_body_stream, :resolve_tools].each do |m|
+    [:headers, :execute, :set_body_stream, :resolve_tools, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end

data/lib/llm/providers/openai/vector_stores.rb CHANGED Viewed

@@ -32,8 +32,9 @@ class LLM::OpenAI
     def all(**params)
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/vector_stores?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :enumerable)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :enumerable)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -47,8 +48,9 @@ class LLM::OpenAI
     def create(name:, file_ids: nil, **params)
       req = Net::HTTP::Post.new("/v1/vector_stores", headers)
       req.body = LLM.json.dump(params.merge({name:, file_ids:}).compact)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -69,8 +71,9 @@ class LLM::OpenAI
     def get(vector:)
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       req = Net::HTTP::Get.new("/v1/vector_stores/#{vector_id}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -85,8 +88,9 @@ class LLM::OpenAI
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       req = Net::HTTP::Post.new("/v1/vector_stores/#{vector_id}", headers)
       req.body = LLM.json.dump(params.merge({name:}).compact)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -98,8 +102,9 @@ class LLM::OpenAI
     def delete(vector:)
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       req = Net::HTTP::Delete.new("/v1/vector_stores/#{vector_id}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -114,8 +119,9 @@ class LLM::OpenAI
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       req = Net::HTTP::Post.new("/v1/vector_stores/#{vector_id}/search", headers)
       req.body = LLM.json.dump(params.merge({query:}).compact)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :enumerable)
+      res, span = execute(request: req, operation: "retrieval")
+      res = ResponseAdapter.adapt(res, type: :enumerable)
+      finish_trace(operation: "retrieval", res:, span:)
     end
     ##
@@ -129,8 +135,9 @@ class LLM::OpenAI
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/vector_stores/#{vector_id}/files?#{query}", headers)
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :enumerable)
+      res, span = execute(request: req, operation: "request")
+      res = ResponseAdapter.adapt(res, type: :enumerable)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -147,8 +154,9 @@ class LLM::OpenAI
       file_id = file.respond_to?(:id) ? file.id : file
       req = Net::HTTP::Post.new("/v1/vector_stores/#{vector_id}/files", headers)
       req.body = LLM.json.dump(params.merge({file_id:, attributes:}).compact)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     alias_method :create_file, :add_file
@@ -176,8 +184,9 @@ class LLM::OpenAI
       file_id = file.respond_to?(:id) ? file.id : file
       req = Net::HTTP::Post.new("/v1/vector_stores/#{vector_id}/files/#{file_id}", headers)
       req.body = LLM.json.dump(params.merge({attributes:}).compact)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -192,8 +201,9 @@ class LLM::OpenAI
       file_id = file.respond_to?(:id) ? file.id : file
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/vector_stores/#{vector_id}/files/#{file_id}?#{query}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -207,8 +217,9 @@ class LLM::OpenAI
       vector_id = vector.respond_to?(:id) ? vector.id : vector
       file_id = file.respond_to?(:id) ? file.id : file
       req = Net::HTTP::Delete.new("/v1/vector_stores/#{vector_id}/files/#{file_id}", headers)
-      res = execute(request: req)
-      LLM::Response.new(res)
+      res, span = execute(request: req, operation: "request")
+      res = LLM::Response.new(res)
+      finish_trace(operation: "request", res:, span:)
     end
     ##
@@ -237,7 +248,7 @@ class LLM::OpenAI
     private
-    [:headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream, :finish_trace].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/openai.rb CHANGED Viewed

@@ -10,9 +10,9 @@ module LLM
   #   require "llm"
   #
   #   llm = LLM.openai(key: ENV["KEY"])
-  #   bot = LLM::Bot.new(llm)
-  #   bot.chat ["Tell me about this photo", File.open("/images/capybara.jpg", "rb")]
-  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  #   ses = LLM::Session.new(llm)
+  #   ses.talk ["Tell me about this photo", ses.local_file("/images/photo.png")]
+  #   ses.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class OpenAI < Provider
     require_relative "openai/error_handler"
     require_relative "openai/request_adapter"
@@ -47,8 +47,9 @@ module LLM
     def embed(input, model: "text-embedding-3-small", **params)
       req = Net::HTTP::Post.new("/v1/embeddings", headers)
       req.body = LLM.json.dump({input:, model:}.merge!(params))
-      res = execute(request: req)
-      ResponseAdapter.adapt(res, type: :embedding)
+      res, span = execute(request: req, operation: "embeddings", model:)
+      res = ResponseAdapter.adapt(res, type: :embedding)
+      finish_trace(operation: "embeddings", model:, res:, span:)
     end
     ##
@@ -64,9 +65,10 @@ module LLM
     def complete(prompt, params = {})
       params, stream, tools, role = normalize_complete_params(params)
       req = build_complete_request(prompt, params, role)
-      res = execute(request: req, stream: stream)
-      ResponseAdapter.adapt(res, type: :completion)
+      res, span = execute(request: req, stream: stream, operation: "chat", model: params[:model])
+      res = ResponseAdapter.adapt(res, type: :completion)
         .extend(Module.new { define_method(:__tools__) { tools } })
+      finish_trace(operation: "chat", model: params[:model], res:, span:)
     end
     ##

data/lib/llm/providers/xai.rb CHANGED Viewed

@@ -11,9 +11,9 @@ module LLM
   #   require "llm"
   #
   #   llm = LLM.xai(key: ENV["KEY"])
-  #   bot = LLM::Bot.new(llm)
-  #   bot.chat ["Tell me about this photo", File.open("/images/crow.jpg", "rb")]
-  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  #   ses = LLM::Session.new(llm)
+  #   ses.talk ["Tell me about this photo", ses.local_file("/images/photo.png")]
+  #   ses.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class XAI < OpenAI
     require_relative "xai/images"

data/lib/llm/providers/zai.rb CHANGED Viewed

@@ -11,8 +11,8 @@ module LLM
   #   require "llm"
   #
   #   llm = LLM.zai(key: ENV["KEY"])
-  #   bot = LLM::Bot.new(llm, stream: $stdout)
-  #   bot.chat("Greetings Robot", role: :user).flush
+  #   ses = LLM::Session.new(llm, stream: $stdout)
+  #   ses.talk "Hello"
   class ZAI < OpenAI
     ##
     # @param [String] host A regional host or the default ("api.z.ai")

data/lib/llm/schema/object.rb CHANGED Viewed

@@ -36,7 +36,7 @@ class LLM::Schema
     ##
     # @return [Hash]
     def to_h
-      super.merge!({type: "object", properties:, required:})
+      super.merge!({type: "object", properties:, required: required_items})
     end
     ##
@@ -64,7 +64,7 @@ class LLM::Schema
     private
-    def required
+    def required_items
       @properties.filter_map {  _2.required? ? _1 : nil }
     end
   end