RubyGems - llm.rb - Versions diffs - 0.10.1 → 0.12.0 - Mend

llm.rb 0.10.1 → 0.12.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (84) hide show

checksums.yaml +4 -4
data/README.md +120 -119
data/lib/llm/bot/builder.rb +2 -2
data/lib/llm/bot.rb +13 -22
data/lib/llm/buffer.rb +7 -0
data/lib/llm/file.rb +22 -12
data/lib/llm/function.rb +8 -7
data/lib/llm/message.rb +8 -0
data/lib/llm/multipart.rb +0 -1
data/lib/llm/object/kernel.rb +8 -0
data/lib/llm/object.rb +9 -3
data/lib/llm/provider.rb +10 -12
data/lib/llm/providers/anthropic/format/completion_format.rb +10 -5
data/lib/llm/providers/anthropic/models.rb +4 -9
data/lib/llm/providers/anthropic/response/completion.rb +39 -0
data/lib/llm/providers/anthropic.rb +13 -25
data/lib/llm/providers/deepseek/format/completion_format.rb +3 -3
data/lib/llm/providers/deepseek.rb +16 -1
data/lib/llm/providers/gemini/audio.rb +9 -13
data/lib/llm/providers/gemini/files.rb +19 -34
data/lib/llm/providers/gemini/format/completion_format.rb +20 -5
data/lib/llm/providers/gemini/images.rb +12 -11
data/lib/llm/providers/gemini/models.rb +4 -10
data/lib/llm/providers/gemini/{response_parser/completion_parser.rb → response/completion.rb} +10 -24
data/lib/llm/providers/gemini/response/embedding.rb +8 -0
data/lib/llm/providers/gemini/response/file.rb +11 -0
data/lib/llm/providers/gemini/response/image.rb +26 -0
data/lib/llm/providers/gemini.rb +18 -29
data/lib/llm/providers/llamacpp.rb +18 -1
data/lib/llm/providers/ollama/format/completion_format.rb +8 -5
data/lib/llm/providers/ollama/models.rb +2 -8
data/lib/llm/providers/ollama/response/completion.rb +28 -0
data/lib/llm/providers/ollama/response/embedding.rb +9 -0
data/lib/llm/providers/ollama.rb +13 -19
data/lib/llm/providers/openai/audio.rb +10 -10
data/lib/llm/providers/openai/files.rb +22 -34
data/lib/llm/providers/openai/format/completion_format.rb +11 -4
data/lib/llm/providers/openai/format/moderation_format.rb +2 -2
data/lib/llm/providers/openai/format/respond_format.rb +7 -4
data/lib/llm/providers/openai/images.rb +18 -17
data/lib/llm/providers/openai/models.rb +4 -9
data/lib/llm/providers/openai/moderations.rb +9 -11
data/lib/llm/providers/openai/response/audio.rb +7 -0
data/lib/llm/providers/openai/{response_parser/completion_parser.rb → response/completion.rb} +14 -30
data/lib/llm/providers/openai/response/embedding.rb +9 -0
data/lib/llm/providers/openai/response/file.rb +7 -0
data/lib/llm/providers/openai/response/image.rb +16 -0
data/lib/llm/providers/openai/response/moderations.rb +34 -0
data/lib/llm/providers/openai/{response_parser/respond_parser.rb → response/responds.rb} +7 -29
data/lib/llm/providers/openai/responses.rb +16 -34
data/lib/llm/providers/openai/stream_parser.rb +1 -0
data/lib/llm/providers/openai/vector_stores.rb +188 -0
data/lib/llm/providers/openai.rb +24 -9
data/lib/llm/providers/xai/images.rb +58 -0
data/lib/llm/providers/xai.rb +72 -0
data/lib/llm/response.rb +42 -13
data/lib/llm/version.rb +1 -1
data/lib/llm.rb +12 -13
data/llm.gemspec +5 -5
metadata +29 -38
data/lib/llm/model.rb +0 -32
data/lib/llm/providers/anthropic/response_parser/completion_parser.rb +0 -51
data/lib/llm/providers/anthropic/response_parser.rb +0 -24
data/lib/llm/providers/gemini/response_parser.rb +0 -46
data/lib/llm/providers/ollama/response_parser/completion_parser.rb +0 -42
data/lib/llm/providers/ollama/response_parser.rb +0 -30
data/lib/llm/providers/openai/response_parser.rb +0 -65
data/lib/llm/providers/voyageai/error_handler.rb +0 -32
data/lib/llm/providers/voyageai/response_parser.rb +0 -13
data/lib/llm/providers/voyageai.rb +0 -44
data/lib/llm/response/audio.rb +0 -13
data/lib/llm/response/audio_transcription.rb +0 -14
data/lib/llm/response/audio_translation.rb +0 -14
data/lib/llm/response/completion.rb +0 -51
data/lib/llm/response/download_file.rb +0 -15
data/lib/llm/response/embedding.rb +0 -23
data/lib/llm/response/file.rb +0 -42
data/lib/llm/response/filelist.rb +0 -18
data/lib/llm/response/image.rb +0 -29
data/lib/llm/response/modellist.rb +0 -18
data/lib/llm/response/moderationlist/moderation.rb +0 -47
data/lib/llm/response/moderationlist.rb +0 -51
data/lib/llm/response/respond.rb +0 -56
/data/lib/llm/{event_handler.rb → eventhandler.rb} +0 -0

data/lib/llm/provider.rb CHANGED Viewed

@@ -44,7 +44,7 @@ class LLM::Provider
   #  Other embedding parameters
   # @raise [NotImplementedError]
   #  When the method is not implemented by a subclass
-  # @return [LLM::Response::Embedding]
+  # @return [LLM::Response]
   def embed(input, model: nil, **params)
     raise NotImplementedError
   end
@@ -52,7 +52,7 @@ class LLM::Provider
   ##
   # Provides an interface to the chat completions API
   # @example
-  #   llm = LLM.openai(ENV["KEY"])
+  #   llm = LLM.openai(key: ENV["KEY"])
   #   messages = [{role: "system", content: "Your task is to answer all of my questions"}]
   #   res = llm.complete("5 + 2 ?", messages:)
   #   print "[#{res.choices[0].role}]", res.choices[0].content, "\n"
@@ -68,7 +68,7 @@ class LLM::Provider
   # @option params [Array<LLM::Function>, nil] :tools Defaults to nil
   # @raise [NotImplementedError]
   #  When the method is not implemented by a subclass
-  # @return [LLM::Response::Completion]
+  # @return [LLM::Response]
   def complete(prompt, params = {})
     raise NotImplementedError
   end
@@ -174,6 +174,13 @@ class LLM::Provider
     raise NotImplementedError
   end
+  ##
+  # @return [LLM::OpenAI::VectorStore]
+  #  Returns an interface to the vector stores API
+  def vector_stores
+    raise NotImplementedError
+  end
   ##
   # @return [String]
   #  Returns the role of the assistant in the conversation.
@@ -222,15 +229,6 @@ class LLM::Provider
     raise NotImplementedError
   end
-  ##
-  # @return [Module]
-  #  Returns the module responsible for parsing a successful LLM response
-  # @raise [NotImplementedError]
-  #  (see LLM::Provider#complete)
-  def response_parser
-    raise NotImplementedError
-  end
   ##
   # @return [Class]
   #  Returns the class responsible for handling an unsuccessful LLM response

data/lib/llm/providers/anthropic/format/completion_format.rb CHANGED Viewed

@@ -47,13 +47,18 @@ module LLM::Anthropic::Format
         content.empty? ? throw(:abort, nil) : content.flat_map { format_content(_1) }
       when URI
         [{type: :image, source: {type: "url", url: content.to_s}}]
+      when File
+        content.close unless content.closed?
+        format_content(LLM.File(content.path))
       when LLM::File
         if content.image?
           [{type: :image, source: {type: "base64", media_type: content.mime_type, data: content.to_b64}}]
+        elsif content.pdf?
+          [{type: :document, source: {type: "base64", media_type: content.mime_type, data: content.to_b64}}]
         else
-          raise LLM::Error::PromptError, "The given object (an instance of #{content.class}) " \
-                                          "is not an image, and therefore not supported by the " \
-                                          "Anthropic API"
+          raise LLM::PromptError, "The given object (an instance of #{content.class}) " \
+                                  "is not an image or PDF, and therefore not supported by the " \
+                                  "Anthropic API"
         end
       when String
         [{type: :text, text: content}]
@@ -62,8 +67,8 @@ module LLM::Anthropic::Format
       when LLM::Function::Return
         [{type: "tool_result", tool_use_id: content.id, content: [{type: :text, text: JSON.dump(content.value)}]}]
       else
-        raise LLM::Error::PromptError, "The given object (an instance of #{content.class}) " \
-                                       "is not supported by the Anthropic API"
+        raise LLM::PromptError, "The given object (an instance of #{content.class}) " \
+                                "is not supported by the Anthropic API"
       end
     end

data/lib/llm/providers/anthropic/models.rb CHANGED Viewed

@@ -11,7 +11,7 @@ class LLM::Anthropic
   #   #!/usr/bin/env ruby
   #   require "llm"
   #
-  #   llm = LLM.anthropic(ENV["KEY"])
+  #   llm = LLM.anthropic(key: ENV["KEY"])
   #   res = llm.models.all
   #   res.each do |model|
   #     print "id: ", model.id, "\n"
@@ -28,7 +28,7 @@ class LLM::Anthropic
     ##
     # List all models
     # @example
-    #   llm = LLM.anthropic(ENV["KEY"])
+    #   llm = LLM.anthropic(key: ENV["KEY"])
     #   res = llm.models.all
     #   res.each do |model|
     #     print "id: ", model.id, "\n"
@@ -36,17 +36,12 @@ class LLM::Anthropic
     # @see https://docs.anthropic.com/en/api/models-list Anthropic docs
     # @param [Hash] params Other parameters (see Anthropic docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::FileList]
+    # @return [LLM::Response]
     def all(**params)
       query = URI.encode_www_form(params)
       req = Net::HTTP::Get.new("/v1/models?#{query}", headers)
       res = execute(request: req)
-      LLM::Response::ModelList.new(res).tap { |modellist|
-        models = modellist.body["data"].map do |model|
-          LLM::Model.from_hash(model).tap { _1.provider = @provider }
-        end
-        modellist.models = models
-      }
+      LLM::Response.new(res)
     end
     private

data/lib/llm/providers/anthropic/response/completion.rb ADDED Viewed

@@ -0,0 +1,39 @@
+# frozen_string_literal: true
+module LLM::Anthropic::Response
+  module Completion
+    def choices = format_choices
+    def role = body.role
+    def model = body.model
+    def prompt_tokens = body.usage&.input_tokens || 0
+    def completion_tokens = body.usage&.output_tokens || 0
+    def total_tokens = prompt_tokens + completion_tokens
+    private
+    def format_choices
+      texts.map.with_index do |choice, index|
+        extra = {
+          index:, response: self,
+          tool_calls: format_tool_calls(tools), original_tool_calls: tools
+        }
+        LLM::Message.new(role, choice["text"], extra)
+      end
+    end
+    def format_tool_calls(tools)
+      (tools || []).filter_map do |tool|
+        tool = {
+          id: tool.id,
+          name: tool.name,
+          arguments: tool.input
+        }
+        LLM::Object.new(tool)
+      end
+    end
+    def parts = body.content
+    def texts = @texts ||= LLM::Object.from_hash(parts.select { _1["type"] == "text" })
+    def tools = @tools ||= LLM::Object.from_hash(parts.select { _1["type"] == "tool_use" })
+  end
+end

data/lib/llm/providers/anthropic.rb CHANGED Viewed

@@ -3,12 +3,21 @@
 module LLM
   ##
   # The Anthropic class implements a provider for
-  # [Anthropic](https://www.anthropic.com)
+  # [Anthropic](https://www.anthropic.com).
+  #
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #
+  #   llm = LLM.anthropic(key: ENV["KEY"])
+  #   bot = LLM::Bot.new(llm)
+  #   bot.chat ["Tell me about this photo", File.open("/images/dog.jpg", "rb")]
+  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class Anthropic < Provider
+    require_relative "anthropic/response/completion"
     require_relative "anthropic/format"
     require_relative "anthropic/error_handler"
     require_relative "anthropic/stream_parser"
-    require_relative "anthropic/response_parser"
     require_relative "anthropic/models"
     include Format
@@ -20,23 +29,6 @@ module LLM
       super(host: HOST, **)
     end
-    ##
-    # Provides an embedding via VoyageAI per
-    # [Anthropic's recommendation](https://docs.anthropic.com/en/docs/build-with-claude/embeddings)
-    # @param input (see LLM::Provider#embed)
-    # @param [String] key
-    #  Valid key for the VoyageAI API
-    # @param [String] model
-    #  The embedding model to use
-    # @param [Hash] params
-    #  Other embedding parameters
-    # @raise (see LLM::Provider#request)
-    # @return (see LLM::Provider#embed)
-    def embed(input, key:, model: "voyage-2", **params)
-      llm = LLM.voyageai(key:)
-      llm.embed(input, **params.merge(model:))
-    end
     ##
     # Provides an interface to the chat completions API
     # @see https://docs.anthropic.com/en/api/messages Anthropic docs
@@ -44,7 +36,7 @@ module LLM
     # @param params (see LLM::Provider#complete)
     # @example (see LLM::Provider#complete)
     # @raise (see LLM::Provider#request)
-    # @raise [LLM::Error::PromptError]
+    # @raise [LLM::PromptError]
     #  When given an object a provider does not understand
     # @return (see LLM::Provider#complete)
     def complete(prompt, params = {})
@@ -57,7 +49,7 @@ module LLM
       body = JSON.dump({messages: [format(messages)].flatten}.merge!(params))
       set_body_stream(req, StringIO.new(body))
       res = execute(request: req, stream:)
-      Response::Completion.new(res).extend(response_parser)
+      LLM::Response.new(res).extend(LLM::Anthropic::Response::Completion)
     end
     ##
@@ -92,10 +84,6 @@ module LLM
       )
     end
-    def response_parser
-      LLM::Anthropic::ResponseParser
-    end
     def stream_parser
       LLM::Anthropic::StreamParser
     end

data/lib/llm/providers/deepseek/format/completion_format.rb CHANGED Viewed

@@ -12,7 +12,7 @@ module LLM::DeepSeek::Format
     end
     ##
-    # Formats the message for the OpenAI chat completions API
+    # Formats the message for the DeepSeek chat completions API
     # @return [Hash]
     def format
       catch(:abort) do
@@ -37,8 +37,8 @@ module LLM::DeepSeek::Format
       when LLM::Function::Return
         throw(:abort, {role: "tool", tool_call_id: content.id, content: JSON.dump(content.value)})
       else
-        raise LLM::Error::PromptError, "The given object (an instance of #{content.class}) " \
-                                       "is not supported by the DeepSeek chat completions API"
+        raise LLM::PromptError, "The given object (an instance of #{content.class}) " \
+                                "is not supported by the DeepSeek chat completions API"
       end
     end

data/lib/llm/providers/deepseek.rb CHANGED Viewed

@@ -6,8 +6,17 @@ module LLM
   ##
   # The DeepSeek class implements a provider for
   # [DeepSeek](https://deepseek.com)
-  # through its OpenAI-compatible API provided via
+  # through its OpenAI-compatible API available via
   # their [web platform](https://platform.deepseek.com).
+  #
+  # @example
+  #   #!/usr/bin/env ruby
+  #   require "llm"
+  #
+  #   llm = LLM.deepseek(key: ENV["KEY"])
+  #   bot = LLM::Bot.new(llm)
+  #   bot.chat ["Tell me about this photo", File.open("/images/cat.jpg", "rb")]
+  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class DeepSeek < OpenAI
     require_relative "deepseek/format"
     include DeepSeek::Format
@@ -49,6 +58,12 @@ module LLM
       raise NotImplementedError
     end
+    ##
+    # @raise [NotImplementedError]
+    def vector_stores
+      raise NotImplementedError
+    end
     ##
     # Returns the default model for chat completions
     # @see https://api-docs.deepseek.com/quick_start/pricing deepseek-chat

data/lib/llm/providers/gemini/audio.rb CHANGED Viewed

@@ -8,7 +8,7 @@ class LLM::Gemini
   #   #!/usr/bin/env ruby
   #   require "llm"
   #
-  #   llm = LLM.gemini(ENV["KEY"])
+  #   llm = LLM.gemini(key: ENV["KEY"])
   #   res = llm.audio.create_transcription(input: "/audio/rocket.mp3")
   #   res.text # => "A dog on a rocket to the moon"
   class Audio
@@ -30,48 +30,44 @@ class LLM::Gemini
     ##
     # Create an audio transcription
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.audio.create_transcription(file: "/audio/rocket.mp3")
     #   res.text # => "A dog on a rocket to the moon"
     # @see https://ai.google.dev/gemini-api/docs/audio Gemini docs
-    # @param [String, LLM::File, LLM::Response::File] file The input audio
+    # @param [String, LLM::File, LLM::Response] file The input audio
     # @param [String] model The model to use
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::AudioTranscription]
+    # @return [LLM::Response]
     def create_transcription(file:, model: "gemini-1.5-flash", **params)
       res = @provider.complete [
         "Your task is to transcribe the contents of an audio file",
         "Your response should include the transcription, and nothing else",
         LLM.File(file)
       ], params.merge(role: :user, model:)
-      LLM::Response::AudioTranscription
-        .new(res)
-        .tap { _1.text = res.choices[0].content }
+      res.tap { _1.define_singleton_method(:text) { choices[0].content } }
     end
     ##
     # Create an audio translation (in English)
     # @example
     #   # Arabic => English
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.audio.create_translation(file: "/audio/bismillah.mp3")
     #   res.text # => "In the name of Allah, the Beneficent, the Merciful."
     # @see https://ai.google.dev/gemini-api/docs/audio Gemini docs
-    # @param [String, LLM::File, LLM::Response::File] file The input audio
+    # @param [String, LLM::File, LLM::Response] file The input audio
     # @param [String] model The model to use
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::AudioTranslation]
+    # @return [LLM::Response]
     def create_translation(file:, model: "gemini-1.5-flash", **params)
       res = @provider.complete [
         "Your task is to translate the contents of an audio file into English",
         "Your response should include the translation, and nothing else",
         LLM.File(file)
       ], params.merge(role: :user, model:)
-      LLM::Response::AudioTranslation
-        .new(res)
-        .tap { _1.text = res.choices[0].content }
+      res.tap { _1.define_singleton_method(:text) { choices[0].content } }
     end
   end
 end

data/lib/llm/providers/gemini/files.rb CHANGED Viewed

@@ -17,24 +17,14 @@ class LLM::Gemini
   #   #!/usr/bin/env ruby
   #   require "llm"
   #
-  #   llm = LLM.gemini(ENV["KEY"])
+  #   llm = LLM.gemini(key: ENV["KEY"])
   #   bot = LLM::Bot.new(llm)
-  #   file = llm.files.create file: "/audio/haiku.mp3"
-  #   bot.chat(file)
-  #   bot.chat("Describe the audio file I sent to you")
-  #   bot.chat("The audio file is the first message I sent to you.")
-  #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
-  #
-  # @example example #2
-  #   #!/usr/bin/env ruby
-  #   require "llm"
-  #
-  #   llm = LLM.gemini(ENV["KEY"])
-  #   bot = LLM::Bot.new(llm)
-  #   file = llm.files.create file: "/audio/haiku.mp3"
-  #   bot.chat(["Describe the audio file I sent to you", file])
+  #   file = llm.files.create(file: "/audio/haiku.mp3")
+  #   bot.chat ["Tell me about this file", file]
   #   bot.messages.select(&:assistant?).each { print "[#{_1.role}]", _1.content, "\n" }
   class Files
+    require_relative "response/file"
     ##
     # Returns a new Files object
     # @param provider [LLM::Provider]
@@ -46,7 +36,7 @@ class LLM::Gemini
     ##
     # List all files
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.files.all
     #   res.each do |file|
     #     print "name: ", file.name, "\n"
@@ -54,30 +44,24 @@ class LLM::Gemini
     # @see https://ai.google.dev/gemini-api/docs/files Gemini docs
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::FileList]
+    # @return [LLM::Response]
     def all(**params)
       query = URI.encode_www_form(params.merge!(key: key))
       req = Net::HTTP::Get.new("/v1beta/files?#{query}", headers)
       res = execute(request: req)
-      LLM::Response::FileList.new(res).tap { |filelist|
-        files = filelist.body["files"]&.map do |file|
-          file = file.transform_keys { snakecase(_1) }
-          LLM::Object.from_hash(file)
-        end || []
-        filelist.files = files
-      }
+      LLM::Response.new(res)
     end
     ##
     # Create a file
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
-    #   res = llm.files.create file: "/audio/haiku.mp3"
+    #   llm = LLM.gemini(key: ENV["KEY"])
+    #   res = llm.files.create(file: "/audio/haiku.mp3")
     # @see https://ai.google.dev/gemini-api/docs/files Gemini docs
     # @param [String, LLM::File] file The file
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::File]
+    # @return [LLM::Response]
     def create(file:, **params)
       file = LLM.File(file)
       req = Net::HTTP::Post.new(request_upload_url(file:), {})
@@ -87,44 +71,45 @@ class LLM::Gemini
       file.with_io do |io|
         set_body_stream(req, io)
         res = execute(request: req)
-        LLM::Response::File.new(res)
+        LLM::Response.new(res).extend(LLM::Gemini::Response::File)
       end
     end
     ##
     # Get a file
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.files.get(file: "files/1234567890")
     #   print "name: ", res.name, "\n"
     # @see https://ai.google.dev/gemini-api/docs/files Gemini docs
     # @param [#name, String] file The file to get
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::File]
+    # @return [LLM::Response]
     def get(file:, **params)
       file_id = file.respond_to?(:name) ? file.name : file.to_s
       query = URI.encode_www_form(params.merge!(key: key))
       req = Net::HTTP::Get.new("/v1beta/#{file_id}?#{query}", headers)
       res = execute(request: req)
-      LLM::Response::File.new(res)
+      LLM::Response.new(res).extend(LLM::Gemini::Response::File)
     end
     ##
     # Delete a file
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.files.delete(file: "files/1234567890")
     # @see https://ai.google.dev/gemini-api/docs/files Gemini docs
     # @param [#name, String] file The file to delete
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::File]
+    # @return [LLM::Response]
     def delete(file:, **params)
       file_id = file.respond_to?(:name) ? file.name : file.to_s
       query = URI.encode_www_form(params.merge!(key: key))
       req = Net::HTTP::Delete.new("/v1beta/#{file_id}?#{query}", headers)
-      execute(request: req)
+      res = execute(request: req)
+      LLM::Response.new(res)
     end
     ##

data/lib/llm/providers/gemini/format/completion_format.rb CHANGED Viewed

@@ -30,9 +30,11 @@ module LLM::Gemini::Format
       case content
       when Array
         content.empty? ? throw(:abort, nil) : content.flat_map { format_content(_1) }
-      when LLM::Response::File
-        file = content
-        [{file_data: {mime_type: file.mime_type, file_uri: file.uri}}]
+      when LLM::Response
+        format_response(content)
+      when File
+        content.close unless content.closed?
+        format_content(LLM.File(content.path))
       when LLM::File
         file = content
         [{inline_data: {mime_type: file.mime_type, data: file.to_b64}}]
@@ -43,11 +45,24 @@ module LLM::Gemini::Format
       when LLM::Function::Return
         [{text: JSON.dump(content.value)}]
       else
-        raise LLM::Error::PromptError, "The given object (an instance of #{content.class}) " \
-                                       "is not supported by the Gemini API"
+        prompt_error!(content)
       end
     end
+    def format_response(response)
+      if response.file?
+        file = response
+        [{file_data: {mime_type: file.mime_type, file_uri: file.uri}}]
+      else
+        prompt_error!(content)
+      end
+    end
+    def prompt_error!(object)
+      raise LLM::PromptError, "The given object (an instance of #{object.class}) " \
+                              "is not supported by the Gemini API"
+    end
     def message = @message
     def content = message.content
   end

data/lib/llm/providers/gemini/images.rb CHANGED Viewed

@@ -11,10 +11,11 @@ class LLM::Gemini
   #   #!/usr/bin/env ruby
   #   require "llm"
   #
-  #   llm = LLM.gemini(ENV["KEY"])
+  #   llm = LLM.gemini(key: ENV["KEY"])
   #   res = llm.images.create prompt: "A dog on a rocket to the moon"
   #   IO.copy_stream res.images[0], "rocket.png"
   class Images
+    require_relative "response/image"
     include Format
     ##
@@ -28,7 +29,7 @@ class LLM::Gemini
     ##
     # Create an image
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.images.create prompt: "A dog on a rocket to the moon"
     #   IO.copy_stream res.images[0], "rocket.png"
     # @see https://ai.google.dev/gemini-api/docs/image-generation Gemini docs
@@ -39,23 +40,23 @@ class LLM::Gemini
     #  The prompt should make it clear you want to generate an image, or you
     #  might unexpectedly receive a purely textual response. This is due to how
     #  Gemini implements image generation under the hood.
-    # @return [LLM::Response::Image]
+    # @return [LLM::Response]
     def create(prompt:, model: "gemini-2.0-flash-exp-image-generation", **params)
       req  = Net::HTTP::Post.new("/v1beta/models/#{model}:generateContent?key=#{key}", headers)
       body = JSON.dump({
-        contents: [{parts: [{text: create_prompt}, {text: prompt}]}],
+        contents: [{parts: [{text: system_prompt}, {text: prompt}]}],
         generationConfig: {responseModalities: ["TEXT", "IMAGE"]}
       }.merge!(params))
       req.body = body
       res = execute(request: req)
-      LLM::Response::Image.new(res).extend(response_parser)
+      LLM::Response.new(res).extend(LLM::Gemini::Response::Image)
     end
     ##
     # Edit an image
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
-    #   res = llm.images.edit image: LLM::File("cat.png"), prompt: "Add a hat to the cat"
+    #   llm = LLM.gemini(key: ENV["KEY"])
+    #   res = llm.images.edit image: "cat.png", prompt: "Add a hat to the cat"
     #   IO.copy_stream res.images[0], "hatoncat.png"
     # @see https://ai.google.dev/gemini-api/docs/image-generation Gemini docs
     # @param [String, LLM::File] image The image to edit
@@ -63,7 +64,7 @@ class LLM::Gemini
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
     # @note (see LLM::Gemini::Images#create)
-    # @return [LLM::Response::Image]
+    # @return [LLM::Response]
     def edit(image:, prompt:, model: "gemini-2.0-flash-exp-image-generation", **params)
       req   = Net::HTTP::Post.new("/v1beta/models/#{model}:generateContent?key=#{key}", headers)
       image = LLM.File(image)
@@ -73,7 +74,7 @@ class LLM::Gemini
       }.merge!(params)).b
       set_body_stream(req, StringIO.new(body))
       res = execute(request: req)
-      LLM::Response::Image.new(res).extend(response_parser)
+      LLM::Response.new(res).extend(LLM::Gemini::Response::Image)
     end
     ##
@@ -93,7 +94,7 @@ class LLM::Gemini
       @provider.instance_variable_get(:@key)
     end
-    def create_prompt
+    def system_prompt
       <<~PROMPT
         Your task is to generate one or more image(s) from
         text I will provide to you. Your response *MUST* include
@@ -102,7 +103,7 @@ class LLM::Gemini
       PROMPT
     end
-    [:response_parser, :headers, :execute, :set_body_stream].each do |m|
+    [:headers, :execute, :set_body_stream].each do |m|
       define_method(m) { |*args, **kwargs, &b| @provider.send(m, *args, **kwargs, &b) }
     end
   end

data/lib/llm/providers/gemini/models.rb CHANGED Viewed

@@ -11,7 +11,7 @@ class LLM::Gemini
   #   #!/usr/bin/env ruby
   #   require "llm"
   #
-  #   llm = LLM.gemini(ENV["KEY"])
+  #   llm = LLM.gemini(key: ENV["KEY"])
   #   res = llm.models.all
   #   res.each do |model|
   #     print "id: ", model.id, "\n"
@@ -30,7 +30,7 @@ class LLM::Gemini
     ##
     # List all models
     # @example
-    #   llm = LLM.gemini(ENV["KEY"])
+    #   llm = LLM.gemini(key: ENV["KEY"])
     #   res = llm.models.all
     #   res.each do |model|
     #     print "id: ", model.id, "\n"
@@ -38,18 +38,12 @@ class LLM::Gemini
     # @see https://ai.google.dev/api/models?hl=en#method:-models.list Gemini docs
     # @param [Hash] params Other parameters (see Gemini docs)
     # @raise (see LLM::Provider#request)
-    # @return [LLM::Response::ModelList]
+    # @return [LLM::Response]
     def all(**params)
       query = URI.encode_www_form(params.merge!(key: key))
       req = Net::HTTP::Get.new("/v1beta/models?#{query}", headers)
       res = execute(request: req)
-      LLM::Response::ModelList.new(res).tap { |modellist|
-        models = modellist.body["models"].map do |model|
-          model = model.transform_keys { snakecase(_1) }
-          LLM::Model.from_hash(model).tap { _1.provider = @provider }
-        end
-        modellist.models = models
-      }
+      LLM::Response.new(res)
     end
     private