RubyGems - llama-rb - Versions diffs - 0.2.0 → 0.3.0 - Mend

llama-rb 0.2.0 → 0.3.0

Files changed (6) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 1371348a7ba9c4fa75ada41ec8afc6461e1d56dae2c3e3dede175d189ecdd7ea
-  data.tar.gz: b45a9ed3c28a228a2405ec8874f4cf8239dfcb4cb3132e7a44be806b5c6a2a78
+  metadata.gz: 4f2bc2e51fa10f5dcdc890664eb5603d1f3a3742d3259d3aa8784c790ded070f
+  data.tar.gz: 2b08904fca31b95d35bb1b6ea2a2c78288898ad072aaae26b7cf3f3a8c64184a
 SHA512:
-  metadata.gz: 88dd6f7a6f971f60753625dce11b469bbf46f606b4be4c8d308636d1f696666cacd9b174bda65bc5e42d503db413c9f1281c9a7129d838f1dfab3088717f603f
-  data.tar.gz: 449673e8950cc869ad899500b85a6108d2a02b7915ca340733bda0f18fa49691df7e839a6efece440d76a0583d037c90a6226f505eacc08ba24a9ae510b840bc
+  metadata.gz: 3504f141131b27bca91c7348ef9617ec57d85b2ed1de67020afa46b89618fe008ce99c2df29cfe3ff1be1b01f9fe2b5b600389b298b66b7ff575767923eae6af
+  data.tar.gz: 404109c7650567a2bc2953324c0b9abda35381ecaa74bb7197e46f18e0f72e8c00f74d674009a4d25e2e458f3b77ceda605fcb91d4e954a8e9805fe2f26cc9bf

data/Gemfile.lock CHANGED Viewed

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    llama-rb (0.2.0)
+    llama-rb (0.3.0)
 GEM
   remote: https://rubygems.org/

data/README.md CHANGED Viewed

@@ -42,21 +42,15 @@ m.predict('hello world')
 ```ruby
 def self.new(
   model,               # path to model file, e.g. "models/7B/ggml-model-q4_0.bin"
-  n_ctx: 512,          # context size
-  n_parts: -1,         # amount of model parts (-1 = determine from model dimensions)
+  n_predict: 128       # number of tokens to predict
   seed: Time.now.to_i, # RNG seed
-  memory_f16: true,    # use f16 instead of f32 for memory kv
-  use_mlock: false     # use mlock to keep model in memory
 )
 ```
 #### Llama::Model#predict
 ```ruby
-def predict(
-  prompt,        # string used as prompt
-  n_predict: 128 # number of tokens to predict
-)
+def predict(prompt)
 ```
 ## Development

data/lib/llama/model.rb CHANGED Viewed

@@ -6,29 +6,61 @@ module Llama
     class ModelError < StandardError
     end
-    def initialize(
+    def initialize( # rubocop:disable all
       model,
+      binary: default_binary,
       seed: Time.now.to_i,
-      n_predict: 128,
-      binary: default_binary
+      n_predict: nil,
+      threads: nil,
+      top_k: nil,
+      top_p: nil,
+      repeat_last_n: nil,
+      repeat_penalty: nil,
+      ctx_size: nil,
+      ignore_eos: nil,
+      memory_f32: nil,
+      temp: nil,
+      n_parts: nil,
+      batch_size: nil,
+      keep: nil,
+      mlock: nil
     )
       @model = model
       @seed = seed
       @n_predict = n_predict
       @binary = binary
+      @threads = threads
+      @top_k = top_k
+      @top_p = top_p
+      @repeat_last_n = repeat_last_n
+      @repeat_penalty = repeat_penalty
+      @ctx_size = ctx_size
+      @ignore_eos = ignore_eos
+      @memory_f32 = memory_f32
+      @temp = temp
+      @n_parts = n_parts
+      @batch_size = batch_size
+      @keep = keep
+      @mlock = mlock
     end
     def predict(prompt)
       stdout, @stderr, @status = Open3.capture3(command(prompt))
-      raise ModelError, "Error #{status.to_i}" unless status.success?
+      unless status.success?
+        error_string = stderr.split("\n").first
+        raise ModelError, "Error #{error_string}"
+      end
       # remove the space that is added as a tokenizer hack in examples/main/main.cpp
       stdout[0] = ''
       stdout
     end
-    attr_reader :model, :seed, :n_predict, :binary
+    attr_reader :model, :seed, :n_predict, :binary, :threads, :top_k, :top_p, :repeat_last_n,
+      :repeat_penalty, :ctx_size, :ignore_eos, :memory_f32, :temp, :n_parts, :batch_size, :keep,
+      :mlock
     private
@@ -38,19 +70,42 @@ module Llama
       File.join(File.dirname(__FILE__), '..', '..', 'bin', 'llama')
     end
-    def command(prompt)
-      escape_command(binary,
+    def command(prompt) # rubocop:disable all
+      escape_command(
+        binary,
         model: model,
         prompt: prompt,
         seed: seed,
-        n_predict: n_predict)
+        n_predict: n_predict,
+        threads: threads,
+        top_k: top_k,
+        top_p: top_p,
+        repeat_last_n: repeat_last_n,
+        repeat_penalty: repeat_penalty,
+        ctx_size: ctx_size,
+        'ignore-eos': !!ignore_eos,
+        memory_f32: !!memory_f32,
+        temp: temp,
+        n_parts: n_parts,
+        batch_size: batch_size,
+        keep: keep,
+        mlock: mlock,
+      )
     end
     def escape_command(command, **flags)
-      flags_string = flags.map do |key, value|
-        "--#{Shellwords.escape(key)} #{Shellwords.escape(value)}"
-      end.join(' ')
+      flags_components = []
+      flags.each do |key, value|
+        if value == true
+          flags_components.push("--#{Shellwords.escape(key)}")
+        elsif value
+          flags_components.push("--#{Shellwords.escape(key)} #{Shellwords.escape(value)}")
+        end
+      end
       command_string = Shellwords.escape(command)
+      flags_string = flags_components.join(' ')
       "#{command_string} #{flags_string}"
     end

data/lib/llama/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module Llama
-  VERSION = '0.2.0'.freeze
+  VERSION = '0.3.0'.freeze
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: llama-rb
 version: !ruby/object:Gem::Version
-  version: 0.2.0
+  version: 0.3.0
 platform: ruby
 authors:
 - zfletch
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2023-04-06 00:00:00.000000000 Z
+date: 2023-04-07 00:00:00.000000000 Z
 dependencies: []
 description: ggerganov/llama.cpp with Ruby hooks
 email: