RubyGems - llm_ruby - Versions diffs - 0.1.0 → 0.3.0 - Mend

llm_ruby 0.1.0 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

checksums.yaml +4 -4
data/README.md +70 -36
data/lib/llm/clients/anthropic/response.rb +48 -0
data/lib/llm/clients/anthropic.rb +113 -0
data/lib/llm/clients/gemini/request.rb +75 -0
data/lib/llm/clients/gemini/response.rb +61 -0
data/lib/llm/clients/gemini.rb +102 -0
data/lib/llm/clients/open_ai/response.rb +45 -32
data/lib/llm/clients/open_ai.rb +86 -82
data/lib/llm/info.rb +261 -89
data/lib/llm/response.rb +9 -1
data/lib/llm/schema.rb +75 -0
data/lib/llm/stop_reason.rb +8 -5
data/lib/llm.rb +9 -2
metadata +12 -13

data/lib/llm/clients/open_ai.rb CHANGED Viewed

@@ -3,107 +3,111 @@
 require "httparty"
 require "event_stream_parser"
-class LLM::Clients::OpenAI
-  include HTTParty
-  base_uri "https://api.openai.com/v1"
+class LLM
+  module Clients
+    class OpenAI
+      include HTTParty
+      base_uri "https://api.openai.com/v1"
+      def initialize(llm:)
+        @llm = llm
+      end
-  def initialize(llm:)
-    @llm = llm
-  end
+      def chat(messages, options = {})
+        parameters = {
+          model: @llm.canonical_name,
+          messages: messages,
+          temperature: options[:temperature],
+          response_format: options[:response_format]&.response_format,
+          max_tokens: options[:max_output_tokens],
+          top_p: options[:top_p],
+          stop: options[:stop_sequences],
+          presence_penalty: options[:presence_penalty],
+          frequency_penalty: options[:frequency_penalty],
+          tools: options[:tools],
+          tool_choice: options[:tool_choice]
+        }.compact
+        return chat_streaming(parameters, options[:on_message], options[:on_complete]) if options[:stream]
+        resp = post_url("/chat/completions", body: parameters.to_json)
+        Response.new(resp).to_normalized_response
+      end
-  def chat(messages, options = {})
-    parameters = {
-      model: @llm.canonical_name,
-      messages: messages,
-      temperature: options[:temperature],
-      response_format: options[:response_format],
-      max_tokens: options[:max_output_tokens],
-      top_p: options[:top_p],
-      stop: options[:stop_sequences],
-      presence_penalty: options[:presence_penalty],
-      frequency_penalty: options[:frequency_penalty],
-      tools: options[:tools],
-      tool_choice: options[:tool_choice]
-    }.compact
-    return chat_streaming(parameters, options[:on_message], options[:on_complete]) if options[:stream]
-    resp = post_url("/chat/completions", body: parameters.to_json)
-    Response.new(resp).to_normalized_response
-  end
+      private
-  private
+      def chat_streaming(parameters, on_message, on_complete)
+        buffer = +""
+        chunks = []
+        output_data = {}
-  def chat_streaming(parameters, on_message, on_complete)
-    buffer = +""
-    chunks = []
-    output_data = {}
+        wrapped_on_complete = lambda { |stop_reason|
+          output_data[:stop_reason] = stop_reason
+          on_complete&.call(stop_reason)
+        }
-    wrapped_on_complete = lambda { |stop_reason|
-      output_data[:stop_reason] = stop_reason
-      on_complete&.call(stop_reason)
-    }
+        parameters[:stream] = true
-    parameters[:stream] = true
+        proc = stream_proc(buffer, chunks, on_message, wrapped_on_complete)
-    proc = stream_proc(buffer, chunks, on_message, wrapped_on_complete)
+        parameters.delete(:on_message)
+        parameters.delete(:on_complete)
-    parameters.delete(:on_message)
-    parameters.delete(:on_complete)
+        _resp = post_url_streaming("/chat/completions", body: parameters.to_json, &proc)
-    _resp = post_url_streaming("/chat/completions", body: parameters.to_json, &proc)
+        LLM::Response.new(
+          content: buffer,
+          raw_response: chunks,
+          stop_reason: output_data[:stop_reason]
+        )
+      end
-    LLM::Response.new(
-      content: buffer,
-      raw_response: chunks,
-      stop_reason: output_data[:stop_reason]
-    )
-  end
+      def stream_proc(buffer, chunks, on_message, complete_proc)
+        each_json_chunk do |_type, event|
+          next if event == "[DONE]"
-  def stream_proc(buffer, chunks, on_message, complete_proc)
-    each_json_chunk do |_type, event|
-      next if event == "[DONE]"
+          chunks << event
+          new_content = event.dig("choices", 0, "delta", "content")
+          stop_reason = event.dig("choices", 0, "finish_reason")
-      chunks << event
-      new_content = event.dig("choices", 0, "delta", "content")
-      stop_reason = event.dig("choices", 0, "finish_reason")
+          buffer << new_content unless new_content.nil?
+          on_message&.call(new_content) unless new_content.nil?
+          complete_proc&.call(Response.normalize_stop_reason(stop_reason)) unless stop_reason.nil?
+        end
+      end
-      buffer << new_content unless new_content.nil?
-      on_message&.call(new_content) unless new_content.nil?
-      complete_proc&.call(Response.normalize_stop_reason(stop_reason)) unless stop_reason.nil?
-    end
-  end
+      def each_json_chunk
+        parser = EventStreamParser::Parser.new
-  def each_json_chunk
-    parser = EventStreamParser::Parser.new
+        proc do |chunk, _bytes, env|
+          if env && env.status != 200
+            raise_error = Faraday::Response::RaiseError.new
+            raise_error.on_complete(env.merge(body: try_parse_json(chunk)))
+          end
-    proc do |chunk, _bytes, env|
-      if env && env.status != 200
-        raise_error = Faraday::Response::RaiseError.new
-        raise_error.on_complete(env.merge(body: try_parse_json(chunk)))
-      end
+          parser.feed(chunk) do |type, data|
+            next if data == "[DONE]"
-      parser.feed(chunk) do |type, data|
-        next if data == "[DONE]"
-        yield(type, JSON.parse(data))
+            yield(type, JSON.parse(data))
+          end
+        end
       end
-    end
-  end
-  def post_url(url, **kwargs)
-    self.class.post(url, **kwargs.merge(headers: default_headers))
-  end
+      def post_url(url, **kwargs)
+        self.class.post(url, **kwargs.merge(headers: default_headers))
+      end
-  def post_url_streaming(url, **kwargs, &block)
-    self.class.post(url, **kwargs.merge(headers: default_headers, stream_body: true), &block)
-  end
+      def post_url_streaming(url, **kwargs, &block)
+        self.class.post(url, **kwargs.merge(headers: default_headers, stream_body: true), &block)
+      end
-  def default_headers
-    {
-      "Authorization" => "Bearer #{ENV["OPENAI_API_KEY"]}",
-      "Content-Type" => "application/json"
-    }
+      def default_headers
+        {
+          "Authorization" => "Bearer #{ENV["OPENAI_API_KEY"]}",
+          "Content-Type" => "application/json"
+        }
+      end
+    end
   end
 end

data/lib/llm/info.rb CHANGED Viewed

@@ -1,94 +1,266 @@
 # frozen_string_literal: true
-module LLM::Info
-  KNOWN_MODELS = [
-    # Semantics of fields:
-    # - canonical_name (required): A string that uniquely identifies the model.
-    #   We use this string as the public identifier when users choose this model via the API.
-    # - display_name (required): A string that is displayed to the user when choosing this model via the UI.
+class LLM
+  module Info
+    KNOWN_MODELS = [
+      # Semantics of fields:
+      # - canonical_name (required): A string that uniquely identifies the model.
+      #   We use this string as the public identifier when users choose this model via the API.
+      # - display_name (required): A string that is displayed to the user when choosing this model via the UI.
+      # - client_class (required): The client class to be used for this model.
-    # GPT-3.5 Turbo Models
-    {
-      canonical_name: "gpt-3.5-turbo",
-      display_name: "GPT-3.5 Turbo",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-3.5-turbo-0125",
-      display_name: "GPT-3.5 Turbo 0125",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-3.5-turbo-16k",
-      display_name: "GPT-3.5 Turbo 16K",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-3.5-turbo-1106",
-      display_name: "GPT-3.5 Turbo 1106",
-      provider: :openai
-    },
+      # GPT-3.5 Turbo Models
+      {
+        canonical_name: "gpt-3.5-turbo",
+        display_name: "GPT-3.5 Turbo",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-3.5-turbo-0125",
+        display_name: "GPT-3.5 Turbo 0125",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-3.5-turbo-16k",
+        display_name: "GPT-3.5 Turbo 16K",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-3.5-turbo-1106",
+        display_name: "GPT-3.5 Turbo 1106",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
-    # GPT-4 Models
-    {
-      canonical_name: "gpt-4",
-      display_name: "GPT-4",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-32k",
-      display_name: "GPT-4 32K",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-1106-preview",
-      display_name: "GPT-4 Turbo 1106",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-turbo-2024-04-09",
-      display_name: "GPT-4 Turbo 2024-04-09",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-0125-preview",
-      display_name: "GPT-4 Turbo 0125",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-turbo-preview",
-      display_name: "GPT-4 Turbo",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-0613",
-      display_name: "GPT-4 0613",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4-32k-0613",
-      display_name: "GPT-4 32K 0613",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4o",
-      display_name: "GPT-4o",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4o-mini",
-      display_name: "GPT-4o Mini",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4o-2024-05-13",
-      display_name: "GPT-4o 2024-05-13",
-      provider: :openai
-    },
-    {
-      canonical_name: "gpt-4o-2024-08-06",
-      display_name: "GPT-4o 2024-08-06",
-      provider: :openai
-    }
-  ].freeze
+      # GPT-4 Models
+      {
+        canonical_name: "gpt-4",
+        display_name: "GPT-4",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4-1106-preview",
+        display_name: "GPT-4 Turbo 1106",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4-turbo-2024-04-09",
+        display_name: "GPT-4 Turbo 2024-04-09",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4-0125-preview",
+        display_name: "GPT-4 Turbo 0125",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4-turbo-preview",
+        display_name: "GPT-4 Turbo",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4-0613",
+        display_name: "GPT-4 0613",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4o",
+        display_name: "GPT-4o",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gpt-4o-mini",
+        display_name: "GPT-4o Mini",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gpt-4o-mini-2024-07-18",
+        display_name: "GPT-4o Mini 2024-07-18",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gpt-4o-2024-05-13",
+        display_name: "GPT-4o 2024-05-13",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "gpt-4o-2024-08-06",
+        display_name: "GPT-4o 2024-08-06",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gpt-4o-2024-11-20",
+        display_name: "GPT-4o 2024-11-20",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "chatgpt-4o-latest",
+        display_name: "ChatGPT 4o Latest",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "o1",
+        display_name: "o1",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "o1-2024-12-17",
+        display_name: "o1 2024-12-17",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "o1-preview",
+        display_name: "o1 Preview",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "o1-preview-2024-09-12",
+        display_name: "o1 Preview 2024-09-12",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "o1-mini",
+        display_name: "o1 Mini",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "o1-mini-2024-09-12",
+        display_name: "o1 Mini 2024-09-12",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI
+      },
+      {
+        canonical_name: "o3-mini",
+        display_name: "o3 Mini",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "o3-mini-2025-01-31",
+        display_name: "o3 Mini 2025-01-31",
+        provider: :openai,
+        client_class: LLM::Clients::OpenAI,
+        supports_structured_outputs: true
+      },
+      # Anthropic Models
+      {
+        canonical_name: "claude-3-5-sonnet-20241022",
+        display_name: "Claude 3.5 Sonnet 2024-10-22",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 8192
+        }
+      },
+      {
+        canonical_name: "claude-3-5-haiku-20241022",
+        display_name: "Claude 3.5 Haiku 2024-10-22",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 8192
+        }
+      },
+      {
+        canonical_name: "claude-3-5-sonnet-20240620",
+        display_name: "Claude 3.5 Sonnet 2024-06-20",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 8192
+        }
+      },
+      {
+        canonical_name: "claude-3-opus-20240229",
+        display_name: "Claude 3.5 Opus 2024-02-29",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 4096
+        }
+      },
+      {
+        canonical_name: "claude-3-sonnet-20240229",
+        display_name: "Claude 3.5 Sonnet 2024-02-29",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 4096
+        }
+      },
+      {
+        canonical_name: "claude-3-haiku-20240307",
+        display_name: "Claude 3.5 Opus 2024-03-07",
+        provider: :anthropic,
+        client_class: LLM::Clients::Anthropic,
+        additional_default_required_parameters: {
+          max_output_tokens: 4096
+        }
+      },
+      # Google Models
+      {
+        canonical_name: "gemini-2.0-flash",
+        display_name: "Gemini 2.0 Flash",
+        provider: :google,
+        client_class: LLM::Clients::Gemini,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gemini-2.0-flash-lite-preview-02-05",
+        display_name: "Gemini 2.0 Flash Lite Preview 02-05",
+        provider: :google,
+        client_class: LLM::Clients::Gemini,
+        supports_structured_outputs: true
+      },
+      {
+        canonical_name: "gemini-1.5-flash-8b",
+        display_name: "Gemini 1.5 Flash 8B",
+        provider: :google,
+        client_class: LLM::Clients::Gemini
+      },
+      {
+        canonical_name: "gemini-1.5-flash",
+        display_name: "Gemini 1.5 Flash",
+        provider: :google,
+        client_class: LLM::Clients::Gemini
+      },
+      {
+        canonical_name: "gemini-1.5-pro",
+        display_name: "Gemini 1.5 Pro",
+        provider: :google,
+        client_class: LLM::Clients::Gemini
+      }
+    ].freeze
+  end
 end

data/lib/llm/response.rb CHANGED Viewed

@@ -1,3 +1,11 @@
 # frozen_string_literal: true
-LLM::Response = Struct.new(:content, :raw_response, :stop_reason, keyword_init: true)
+require "ostruct"
+LLM::Response = Struct.new(:content, :raw_response, :stop_reason, :structured_output, keyword_init: true) do
+  def structured_output_object
+    return nil unless structured_output
+    OpenStruct.new(structured_output)
+  end
+end

data/lib/llm/schema.rb ADDED Viewed

@@ -0,0 +1,75 @@
+class LLM
+  class Schema
+    def initialize(name, schema)
+      @name = name
+      @schema = schema
+    end
+    def self.from_file(file_path)
+      new(File.basename(file_path, ".json"), JSON.parse(File.read(file_path)))
+    end
+    def response_format
+      {
+        type: "json_schema",
+        json_schema: {
+          name: @name,
+          strict: true,
+          schema: @schema
+        }
+      }
+    end
+    def gemini_response_format
+      transform_schema(@schema)
+    end
+    def transform_schema(schema)
+      # Initialize the result as an empty hash.
+      openapi_schema = {}
+      # Process the "type" field and handle nullability.
+      if schema.key?("type")
+        if schema["type"].is_a?(Array)
+          # Check for "null" in the type array to mark the schema as nullable.
+          if schema["type"].include?("null")
+            openapi_schema["nullable"] = true
+            # Remove "null" from the type array; if a single type remains, use that.
+            remaining_types = schema["type"] - ["null"]
+            openapi_schema["type"] = (remaining_types.size == 1) ? remaining_types.first : remaining_types
+          else
+            openapi_schema["type"] = schema["type"]
+          end
+        else
+          openapi_schema["type"] = schema["type"]
+        end
+      end
+      # Map simple fields directly: "format", "description", "enum", "maxItems", "minItems".
+      ["format", "description", "enum", "maxItems", "minItems"].each do |field|
+        openapi_schema[field] = schema[field] if schema.key?(field)
+      end
+      # Recursively process "properties" if present.
+      if schema.key?("properties") && schema["properties"].is_a?(Hash)
+        openapi_schema["properties"] = {}
+        schema["properties"].each do |prop, prop_schema|
+          openapi_schema["properties"][prop] = transform_schema(prop_schema)
+        end
+      end
+      # Copy "required" if present.
+      openapi_schema["required"] = schema["required"] if schema.key?("required")
+      # Copy "propertyOrdering" if present (non-standard field).
+      openapi_schema["propertyOrdering"] = schema["propertyOrdering"] if schema.key?("propertyOrdering")
+      # Recursively process "items" for array types.
+      if schema.key?("items")
+        openapi_schema["items"] = transform_schema(schema["items"])
+      end
+      openapi_schema
+    end
+  end
+end

data/lib/llm/stop_reason.rb CHANGED Viewed

@@ -1,9 +1,12 @@
 # frozen_string_literal: true
-module LLM::StopReason
-  STOP = :stop
-  SAFETY = :safety
-  MAX_TOKENS_REACHED = :max_tokens
+class LLM
+  module StopReason
+    STOP = :stop
+    SAFETY = :safety
+    MAX_TOKENS_REACHED = :max_tokens
+    STOP_SEQUENCE = :stop_sequence
-  OTHER = :other
+    OTHER = :other
+  end
 end

data/lib/llm.rb CHANGED Viewed

@@ -13,7 +13,9 @@ class LLM
     @canonical_name = model[:canonical_name]
     @display_name = model[:display_name]
     @provider = model[:provider]
-    @client_class = LLM::Clients::OpenAI # TODO: Allow alternative client classes.
+    @client_class = model[:client_class]
+    @default_params = model[:additional_default_required_parameters] || {}
+    @supports_structured_outputs = model[:supports_structured_outputs] || false
   end
   def client
@@ -22,7 +24,12 @@ class LLM
   attr_reader :canonical_name,
     :display_name,
-    :provider
+    :provider,
+    :default_params
+  def supports_structured_outputs?
+    @supports_structured_outputs
+  end
   private