RubyGems - llm.rb - Versions diffs - 0.2.1 → 0.3.0 - Mend

llm.rb 0.2.1 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (65) hide show

checksums.yaml +4 -4
data/README.md +264 -110
data/lib/llm/buffer.rb +83 -0
data/lib/llm/chat.rb +131 -0
data/lib/llm/file.rb +26 -40
data/lib/llm/http_client.rb +10 -5
data/lib/llm/message.rb +14 -8
data/lib/llm/mime.rb +54 -0
data/lib/llm/multipart.rb +98 -0
data/lib/llm/provider.rb +96 -19
data/lib/llm/providers/anthropic/error_handler.rb +2 -0
data/lib/llm/providers/anthropic/format.rb +2 -0
data/lib/llm/providers/anthropic/response_parser.rb +3 -1
data/lib/llm/providers/anthropic.rb +14 -5
data/lib/llm/providers/gemini/audio.rb +77 -0
data/lib/llm/providers/gemini/error_handler.rb +2 -0
data/lib/llm/providers/gemini/files.rb +160 -0
data/lib/llm/providers/gemini/format.rb +12 -6
data/lib/llm/providers/gemini/images.rb +99 -0
data/lib/llm/providers/gemini/response_parser.rb +27 -1
data/lib/llm/providers/gemini.rb +62 -6
data/lib/llm/providers/ollama/error_handler.rb +2 -0
data/lib/llm/providers/ollama/format.rb +13 -5
data/lib/llm/providers/ollama/response_parser.rb +3 -1
data/lib/llm/providers/ollama.rb +30 -7
data/lib/llm/providers/openai/audio.rb +97 -0
data/lib/llm/providers/openai/error_handler.rb +2 -0
data/lib/llm/providers/openai/files.rb +148 -0
data/lib/llm/providers/openai/format.rb +21 -8
data/lib/llm/providers/openai/images.rb +109 -0
data/lib/llm/providers/openai/response_parser.rb +58 -5
data/lib/llm/providers/openai/responses.rb +78 -0
data/lib/llm/providers/openai.rb +52 -6
data/lib/llm/providers/voyageai.rb +2 -2
data/lib/llm/response/audio.rb +13 -0
data/lib/llm/response/audio_transcription.rb +14 -0
data/lib/llm/response/audio_translation.rb +14 -0
data/lib/llm/response/download_file.rb +15 -0
data/lib/llm/response/file.rb +42 -0
data/lib/llm/response/filelist.rb +18 -0
data/lib/llm/response/image.rb +29 -0
data/lib/llm/response/output.rb +56 -0
data/lib/llm/response.rb +18 -6
data/lib/llm/utils.rb +19 -0
data/lib/llm/version.rb +1 -1
data/lib/llm.rb +5 -2
data/llm.gemspec +1 -6
data/spec/anthropic/completion_spec.rb +1 -1
data/spec/gemini/completion_spec.rb +1 -1
data/spec/gemini/conversation_spec.rb +31 -0
data/spec/gemini/files_spec.rb +124 -0
data/spec/gemini/images_spec.rb +47 -0
data/spec/llm/conversation_spec.rb +101 -61
data/spec/ollama/completion_spec.rb +1 -1
data/spec/ollama/conversation_spec.rb +31 -0
data/spec/openai/audio_spec.rb +55 -0
data/spec/openai/completion_spec.rb +1 -1
data/spec/openai/files_spec.rb +150 -0
data/spec/openai/images_spec.rb +95 -0
data/spec/openai/responses_spec.rb +51 -0
data/spec/setup.rb +8 -0
metadata +31 -49
data/LICENSE.txt +0 -21
data/lib/llm/conversation.rb +0 -90
data/lib/llm/message_queue.rb +0 -54

data/lib/llm/providers/openai/error_handler.rb CHANGED Viewed

@@ -1,6 +1,8 @@
 # frozen_string_literal: true
 class LLM::OpenAI
+  ##
+  # @private
   class ErrorHandler
     ##
     # @return [Net::HTTPResponse]

data/lib/llm/providers/openai/files.rb ADDED Viewed

@@ -0,0 +1,148 @@
+# frozen_string_literal: true
+class LLM::OpenAI
+  ##
+  # The {LLM::OpenAI::Files LLM::OpenAI::Files} class provides a files
+  # object for interacting with [OpenAI's Files API](https://platform.openai.com/docs/api-reference/files/create).
+  # The files API allows a client to upload files for use with OpenAI's models
+  # and API endpoints. OpenAI supports multiple file formats, including text
+  # files, CSV files, JSON files, and more.
+  #
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #
+  #   llm = LLM.openai(ENV["KEY"])
+  #   bot = LLM::Chat.new(llm).lazy
+  #   file = llm.files.create file: LLM::File("/documents/freebsd.pdf")
+  #   bot.chat(file)
+  #   bot.chat("Describe the document")
+  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #
+  #   llm = LLM.openai(ENV["KEY"])
+  #   bot = LLM::Chat.new(llm).lazy
+  #   file = llm.files.create file: LLM::File("/documents/openbsd.pdf")
+  #   bot.chat(["Describe the document I sent to you", file])
+  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
+  class Files
+    ##
+    # Returns a new Files object
+    # @param provider [LLM::Provider]
+    # @return [LLM::OpenAI::Files]
+    def initialize(provider)
+      @provider = provider
+    end
+    ##
+    # List all files
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.files.all
+    #   res.each do |file|
+    #     print "id: ", file.id, "\n"
+    #   end
+    # @see https://platform.openai.com/docs/api-reference/files/list OpenAI docs
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::FileList]
+    def all(**params)
+      query = URI.encode_www_form(params)
+      req = Net::HTTP::Get.new("/v1/files?#{query}", headers)
+      res = request(http, req)
+      LLM::Response::FileList.new(res).tap { |filelist|
+        files = filelist.body["data"].map { OpenStruct.from_hash(_1) }
+        filelist.files = files
+      }
+    end
+    ##
+    # Create a file
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.files.create file: LLM::File("/documents/haiku.txt"),
+    # @see https://platform.openai.com/docs/api-reference/files/create OpenAI docs
+    # @param [File] file The file
+    # @param [String] purpose The purpose of the file (see OpenAI docs)
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::File]
+    def create(file:, purpose: "assistants", **params)
+      multi = LLM::Multipart.new(params.merge!(file:, purpose:))
+      req = Net::HTTP::Post.new("/v1/files", headers)
+      req["content-type"] = multi.content_type
+      req.body = multi.body
+      res = request(http, req)
+      LLM::Response::File.new(res)
+    end
+    ##
+    # Get a file
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.files.get(file: "file-1234567890")
+    #   print "id: ", res.id, "\n"
+    # @see https://platform.openai.com/docs/api-reference/files/get OpenAI docs
+    # @param [#id, #to_s] file The file ID
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::File]
+    def get(file:, **params)
+      file_id = file.respond_to?(:id) ? file.id : file
+      query = URI.encode_www_form(params)
+      req = Net::HTTP::Get.new("/v1/files/#{file_id}?#{query}", headers)
+      res = request(http, req)
+      LLM::Response::File.new(res)
+    end
+    ##
+    # Download the content of a file
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.files.download(file: "file-1234567890")
+    #   File.binwrite "haiku1.txt", res.file.read
+    #   print res.file.read, "\n"
+    # @see https://platform.openai.com/docs/api-reference/files/content OpenAI docs
+    # @param [#id, #to_s] file The file ID
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::DownloadFile]
+    def download(file:, **params)
+      query = URI.encode_www_form(params)
+      file_id = file.respond_to?(:id) ? file.id : file
+      req = Net::HTTP::Get.new("/v1/files/#{file_id}/content?#{query}", headers)
+      io = StringIO.new("".b)
+      res = request(http, req) { |res| res.read_body { |chunk| io << chunk } }
+      LLM::Response::DownloadFile.new(res).tap { _1.file = io }
+    end
+    ##
+    # Delete a file
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.files.delete(file: "file-1234567890")
+    #   print res.deleted, "\n"
+    # @see https://platform.openai.com/docs/api-reference/files/delete OpenAI docs
+    # @param [#id, #to_s] file The file ID
+    # @raise (see LLM::HTTPClient#request)
+    # @return [OpenStruct] Response body
+    def delete(file:)
+      file_id = file.respond_to?(:id) ? file.id : file
+      req = Net::HTTP::Delete.new("/v1/files/#{file_id}", headers)
+      res = request(http, req)
+      OpenStruct.from_hash JSON.parse(res.body)
+    end
+    private
+    def http
+      @provider.instance_variable_get(:@http)
+    end
+    [:headers, :request].each do |m|
+      define_method(m) { |*args, &b| @provider.send(m, *args, &b) }
+    end
+  end
+end

data/lib/llm/providers/openai/format.rb CHANGED Viewed

@@ -1,17 +1,21 @@
 # frozen_string_literal: true
 class LLM::OpenAI
+  ##
+  # @private
   module Format
     ##
     # @param [Array<LLM::Message>] messages
     #  The messages to format
+    # @param [Symbol] mode
+    #  The mode to format the messages for
     # @return [Array<Hash>]
-    def format(messages)
+    def format(messages, mode)
       messages.map do
         if Hash === _1
-          {role: _1[:role], content: format_content(_1[:content])}
+          {role: _1[:role], content: format_content(_1[:content], mode)}
         else
-          {role: _1.role, content: format_content(_1.content)}
+          {role: _1.role, content: format_content(_1.content, mode)}
         end
       end
     end
@@ -23,11 +27,20 @@ class LLM::OpenAI
     #  The content to format
     # @return [String, Hash]
     #  The formatted content
-    def format_content(content)
-      if URI === content
-        [{type: :image_url, image_url: {url: content.to_s}}]
-      else
-        content
+    def format_content(content, mode)
+      if mode == :complete
+        case content
+        when Array then content.flat_map { format_content(_1, mode) }
+        when URI then [{type: :image_url, image_url: {url: content.to_s}}]
+        else [{type: :text, text: content.to_s}]
+        end
+      elsif mode == :response
+        case content
+        when Array then content.flat_map { format_content(_1, mode) }
+        when URI then [{type: :image_url, image_url: {url: content.to_s}}]
+        when LLM::Response::File then [{type: :input_file, file_id: content.id}]
+        else [{type: :input_text, text: content.to_s}]
+        end
       end
     end
   end

data/lib/llm/providers/openai/images.rb ADDED Viewed

@@ -0,0 +1,109 @@
+# frozen_string_literal: true
+class LLM::OpenAI
+  ##
+  # The {LLM::OpenAI::Images LLM::OpenAI::Images} class provides an images
+  # object for interacting with [OpenAI's images API](https://platform.openai.com/docs/api-reference/images).
+  # OpenAI supports multiple response formats: temporary URLs, or binary strings
+  # encoded in base64. The default is to return temporary URLs.
+  #
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #   require "open-uri"
+  #   require "fileutils"
+  #
+  #   llm = LLM.openai(ENV["KEY"])
+  #   res = llm.images.create prompt: "A dog on a rocket to the moon"
+  #   FileUtils.mv OpenURI.open_uri(res.urls[0]).path,
+  #                "rocket.png"
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #
+  #   llm = LLM.openai(ENV["KEY"])
+  #   res = llm.images.create prompt: "A dog on a rocket to the moon",
+  #                           response_format: "b64_json"
+  #   File.binwrite("rocket.png", res.images[0].binary)
+  class Images
+    ##
+    # Returns a new Images object
+    # @param provider [LLM::Provider]
+    # @return [LLM::OpenAI::Responses]
+    def initialize(provider)
+      @provider = provider
+    end
+    ##
+    # Create an image
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.images.create prompt: "A dog on a rocket to the moon"
+    #   p res.urls
+    # @see https://platform.openai.com/docs/api-reference/images/create OpenAI docs
+    # @param [String] prompt The prompt
+    # @param [String] model The model to use
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::Image]
+    def create(prompt:, model: "dall-e-3", **params)
+      req = Net::HTTP::Post.new("/v1/images/generations", headers)
+      req.body = JSON.dump({prompt:, n: 1, model:}.merge!(params))
+      res = request(http, req)
+      LLM::Response::Image.new(res).extend(response_parser)
+    end
+    ##
+    # Create image variations
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.images.create_variation(image: LLM::File("/images/hat.png"), n: 5)
+    #   p res.urls
+    # @see https://platform.openai.com/docs/api-reference/images/createVariation OpenAI docs
+    # @param [File] image The image to create variations from
+    # @param [String] model The model to use
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::Image]
+    def create_variation(image:, model: "dall-e-2", **params)
+      multi = LLM::Multipart.new(params.merge!(image:, model:))
+      req = Net::HTTP::Post.new("/v1/images/variations", headers)
+      req["content-type"] = multi.content_type
+      req.body = multi.body
+      res = request(http, req)
+      LLM::Response::Image.new(res).extend(response_parser)
+    end
+    ##
+    # Edit an image
+    # @example
+    #   llm = LLM.openai(ENV["KEY"])
+    #   res = llm.images.edit(image: LLM::File("/images/hat.png"), prompt: "A cat wearing this hat")
+    #   p res.urls
+    # @see https://platform.openai.com/docs/api-reference/images/createEdit OpenAI docs
+    # @param [File] image The image to edit
+    # @param [String] prompt The prompt
+    # @param [String] model The model to use
+    # @param [Hash] params Other parameters (see OpenAI docs)
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::Image]
+    def edit(image:, prompt:, model: "dall-e-2", **params)
+      multi = LLM::Multipart.new(params.merge!(image:, prompt:, model:))
+      req = Net::HTTP::Post.new("/v1/images/edits", headers)
+      req["content-type"] = multi.content_type
+      req.body = multi.body
+      res = request(http, req)
+      LLM::Response::Image.new(res).extend(response_parser)
+    end
+    private
+    def http
+      @provider.instance_variable_get(:@http)
+    end
+    [:response_parser, :headers, :request].each do |m|
+      define_method(m) { |*args, &b| @provider.send(m, *args, &b) }
+    end
+  end
+end

data/lib/llm/providers/openai/response_parser.rb CHANGED Viewed

@@ -1,6 +1,8 @@
 # frozen_string_literal: true
 class LLM::OpenAI
+  ##
+  # @private
   module ResponseParser
     ##
     # @param [Hash] body
@@ -22,16 +24,67 @@ class LLM::OpenAI
     def parse_completion(body)
       {
         model: body["model"],
-        choices: body["choices"].map do
-          mesg = _1["message"]
-          logprobs = _1["logprobs"]
-          role, content = mesg.values_at("role", "content")
-          LLM::Message.new(role, content, {completion: self, logprobs:})
+        choices: body["choices"].map.with_index do
+          extra = {
+            index: _2, response: self,
+            logprobs: _1["logprobs"]
+          }
+          LLM::Message.new(*_1["message"].values_at("role", "content"),  extra)
         end,
         prompt_tokens: body.dig("usage", "prompt_tokens"),
         completion_tokens: body.dig("usage", "completion_tokens"),
         total_tokens: body.dig("usage", "total_tokens")
       }
     end
+    ##
+    # @param [Hash] body
+    #  The response body from the LLM provider
+    # @return [Hash]
+    def parse_output_response(body)
+      {
+        id: body["id"],
+        model: body["model"],
+        input_tokens: body.dig("usage", "input_tokens"),
+        output_tokens: body.dig("usage", "output_tokens"),
+        total_tokens: body.dig("usage", "total_tokens"),
+        outputs: body["output"].filter_map.with_index do |output, index|
+          next unless output["content"]
+          extra = {
+            index:, response: self,
+            contents: output["content"],
+            annotations: output["annotations"]
+          }
+          LLM::Message.new(output["role"], text(output), extra)
+        end
+      }
+    end
+    ##
+    # @param [Hash] body
+    #  The response body from the LLM provider
+    # @return [Hash]
+    def parse_image(body)
+      {
+        urls: body["data"].filter_map { _1["url"] },
+        images: body["data"].filter_map do
+          next unless _1["b64_json"]
+          OpenStruct.from_hash(
+            mime_type: nil,
+            encoded: _1["b64_json"],
+            binary: _1["b64_json"].unpack1("m0")
+          )
+        end
+      }
+    end
+    private
+    def text(output)
+      output["content"]
+        .select { _1["type"] == "output_text" }
+        .map { _1["text"] }
+        .join("\n")
+    end
   end
 end

data/lib/llm/providers/openai/responses.rb ADDED Viewed

@@ -0,0 +1,78 @@
+# frozen_string_literal: true
+class LLM::OpenAI
+  ##
+  # The {LLM::OpenAI::Responses LLM::OpenAI::Responses} class provides a responses
+  # object for interacting with [OpenAI's response API](https://platform.openai.com/docs/guides/conversation-state?api-mode=responses).
+  # @example
+  #   llm = LLM.openai(ENV["KEY"])
+  #   res1 = llm.responses.create "Your task is to help me with math", :developer
+  #   res2 = llm.responses.create "5 + 5  = ?", :user, previous_response_id: res1.id
+  #   [res1,res2].each { llm.responses.delete(_1) }
+  class Responses
+    include Format
+    ##
+    # Returns a new Responses object
+    # @param provider [LLM::Provider]
+    # @return [LLM::OpenAI::Responses]
+    def initialize(provider)
+      @provider = provider
+    end
+    ##
+    # Create a response
+    # @see https://platform.openai.com/docs/api-reference/responses/create OpenAI docs
+    # @param prompt (see LLM::Provider#complete)
+    # @param role (see LLM::Provider#complete)
+    # @param model (see LLM::Provider#complete)
+    # @param [Hash] params Response params
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::Output]
+    def create(prompt, role = :user, model: "gpt-4o-mini", **params)
+      params   = {model:}.merge!(params)
+      req      = Net::HTTP::Post.new("/v1/responses", headers)
+      messages = [*(params.delete(:input) || []), LLM::Message.new(role, prompt)]
+      req.body = JSON.dump({input: format(messages, :response)}.merge!(params))
+      res      = request(http, req)
+      LLM::Response::Output.new(res).extend(response_parser)
+    end
+    ##
+    # Get a response
+    # @see https://platform.openai.com/docs/api-reference/responses/get OpenAI docs
+    # @param [#id, #to_s] response Response ID
+    # @raise (see LLM::HTTPClient#request)
+    # @return [LLM::Response::Output]
+    def get(response, **params)
+      response_id = response.respond_to?(:id) ? response.id : response
+      query = URI.encode_www_form(params)
+      req = Net::HTTP::Get.new("/v1/responses/#{response_id}?#{query}", headers)
+      res = request(http, req)
+      LLM::Response::Output.new(res).extend(response_parser)
+    end
+    ##
+    # Deletes a response
+    # @see https://platform.openai.com/docs/api-reference/responses/delete OpenAI docs
+    # @param [#id, #to_s] response Response ID
+    # @raise (see LLM::HTTPClient#request)
+    # @return [OpenStruct] Response body
+    def delete(response)
+      response_id = response.respond_to?(:id) ? response.id : response
+      req = Net::HTTP::Delete.new("/v1/responses/#{response_id}", headers)
+      res = request(http, req)
+      OpenStruct.from_hash JSON.parse(res.body)
+    end
+    private
+    def http
+      @provider.instance_variable_get(:@http)
+    end
+    [:response_parser, :headers, :request].each do |m|
+      define_method(m) { |*args, &b| @provider.send(m, *args, &b) }
+    end
+  end
+end

data/lib/llm/providers/openai.rb CHANGED Viewed

@@ -5,9 +5,13 @@ module LLM
   # The OpenAI class implements a provider for
   # [OpenAI](https://platform.openai.com/)
   class OpenAI < Provider
+    require_relative "openai/format"
     require_relative "openai/error_handler"
     require_relative "openai/response_parser"
-    require_relative "openai/format"
+    require_relative "openai/responses"
+    require_relative "openai/images"
+    require_relative "openai/audio"
+    require_relative "openai/files"
     include Format
     HOST = "api.openai.com"
@@ -19,29 +23,71 @@ module LLM
     end
     ##
+    # Provides an embedding
+    # @see https://platform.openai.com/docs/api-reference/embeddings/create OpenAI docs
     # @param input (see LLM::Provider#embed)
+    # @param model (see LLM::Provider#embed)
+    # @param params (see LLM::Provider#embed)
+    # @raise (see LLM::HTTPClient#request)
     # @return (see LLM::Provider#embed)
-    def embed(input, **params)
+    def embed(input, model: "text-embedding-3-small", **params)
       req = Net::HTTP::Post.new("/v1/embeddings", headers)
-      req.body = JSON.dump({input:, model: "text-embedding-3-small"}.merge!(params))
+      req.body = JSON.dump({input:, model:}.merge!(params))
       res = request(@http, req)
       Response::Embedding.new(res).extend(response_parser)
     end
     ##
+    # Provides an interface to the chat completions API
     # @see https://platform.openai.com/docs/api-reference/chat/create OpenAI docs
     # @param prompt (see LLM::Provider#complete)
     # @param role (see LLM::Provider#complete)
+    # @param model (see LLM::Provider#complete)
+    # @param params (see LLM::Provider#complete)
+    # @example (see LLM::Provider#complete)
+    # @raise (see LLM::HTTPClient#request)
     # @return (see LLM::Provider#complete)
-    def complete(prompt, role = :user, **params)
-      params   = {model: "gpt-4o-mini"}.merge!(params)
+    def complete(prompt, role = :user, model: "gpt-4o-mini", **params)
+      params   = {model:}.merge!(params)
       req      = Net::HTTP::Post.new("/v1/chat/completions", headers)
       messages = [*(params.delete(:messages) || []), Message.new(role, prompt)]
-      req.body = JSON.dump({messages: format(messages)}.merge!(params))
+      req.body = JSON.dump({messages: format(messages, :complete)}.merge!(params))
       res      = request(@http, req)
       Response::Completion.new(res).extend(response_parser)
     end
+    ##
+    # Provides an interface to OpenAI's response API
+    # @see https://platform.openai.com/docs/api-reference/responses/create OpenAI docs
+    # @return [LLM::OpenAI::Responses]
+    def responses
+      LLM::OpenAI::Responses.new(self)
+    end
+    ##
+    # Provides an interface to OpenAI's image generation API
+    # @see https://platform.openai.com/docs/api-reference/images/create OpenAI docs
+    # @return [LLM::OpenAI::Images]
+    def images
+      LLM::OpenAI::Images.new(self)
+    end
+    ##
+    # Provides an interface to OpenAI's audio generation API
+    # @see https://platform.openai.com/docs/api-reference/audio/createSpeech OpenAI docs
+    # @return [LLM::OpenAI::Audio]
+    def audio
+      LLM::OpenAI::Audio.new(self)
+    end
+    ##
+    # Provides an interface to OpenAI's files API
+    # @see https://platform.openai.com/docs/api-reference/files/create OpenAI docs
+    # @return [LLM::OpenAI::Files]
+    def files
+      LLM::OpenAI::Files.new(self)
+    end
     ##
     # @return (see LLM::Provider#assistant_role)
     def assistant_role

data/lib/llm/providers/voyageai.rb CHANGED Viewed

@@ -17,9 +17,9 @@ module LLM
     # [Anthropic's recommendation](https://docs.anthropic.com/en/docs/build-with-claude/embeddings)
     # @param input (see LLM::Provider#embed)
     # @return (see LLM::Provider#embed)
-    def embed(input, **params)
+    def embed(input, model: "voyage-2", **params)
       req = Net::HTTP::Post.new("/v1/embeddings", headers)
-      req.body = JSON.dump({input:, model: "voyage-2"}.merge!(params))
+      req.body = JSON.dump({input:, model:}.merge!(params))
       res = request(@http, req)
       Response::Embedding.new(res).extend(response_parser)
     end

data/lib/llm/response/audio.rb ADDED Viewed

@@ -0,0 +1,13 @@
+# frozen_string_literal: true
+module LLM
+  ##
+  # The {LLM::Response::Audio LLM::Response::Audio} class represents an
+  # audio file that has been returned by a provider. It wraps an IO object
+  # that can be used to read the contents of an audio stream (as binary data).
+  class Response::Audio < Response
+    ##
+    # @return [StringIO]
+    attr_accessor :audio
+  end
+end

data/lib/llm/response/audio_transcription.rb ADDED Viewed

@@ -0,0 +1,14 @@
+# frozen_string_literal: true
+module LLM
+  ##
+  # The {LLM::Response::AudioTranscription LLM::Response::AudioTranscription}
+  # class represents an audio transcription that has been returned by
+  # a provider (eg OpenAI, Gemini, etc)
+  class Response::AudioTranscription < Response
+    ##
+    # Returns the text of the transcription
+    # @return [String]
+    attr_accessor :text
+  end
+end

data/lib/llm/response/audio_translation.rb ADDED Viewed

@@ -0,0 +1,14 @@
+# frozen_string_literal: true
+module LLM
+  ##
+  # The {LLM::Response::AudioTranslation LLM::Response::AudioTranslation}
+  # class represents an audio translation that has been returned by
+  # a provider (eg OpenAI, Gemini, etc)
+  class Response::AudioTranslation < Response
+    ##
+    # Returns the text of the translation
+    # @return [String]
+    attr_accessor :text
+  end
+end

data/lib/llm/response/download_file.rb ADDED Viewed

@@ -0,0 +1,15 @@
+# frozen_string_literal: true
+module LLM
+  ##
+  # The {LLM::Response::DownloadFile LLM::Response::DownloadFile} class
+  # represents the contents of a file that has been returned by a
+  # provider. It wraps an IO object that can be used to read the file
+  # contents.
+  class Response::DownloadFile < Response
+    ##
+    # Returns a StringIO object
+    # @return [StringIO]
+    attr_accessor :file
+  end
+end

data/lib/llm/response/file.rb ADDED Viewed

@@ -0,0 +1,42 @@
+# frozen_string_literal: true
+module LLM
+  ##
+  # The {LLM::Response::File LLM::Response::File} class represents a file
+  # that has been uploaded to a provider. Its properties are delegated
+  # to the underlying response body, and vary by provider.
+  class Response::File < Response
+    ##
+    # Returns a normalized response body
+    # @return [Hash]
+    def body
+      @_body ||= if super["file"]
+        super["file"].transform_keys { snakecase(_1) }
+      else
+        super.transform_keys { snakecase(_1) }
+      end
+    end
+    ##
+    # @return [String]
+    def inspect
+      "#<#{self.class}:0x#{object_id.to_s(16)} body=#{body}>"
+    end
+    private
+    include LLM::Utils
+    def respond_to_missing?(m, _)
+      body.key?(m.to_s) || super
+    end
+    def method_missing(m, *args, &block)
+      if body.key?(m.to_s)
+        body[m.to_s]
+      else
+        super
+      end
+    end
+  end
+end