npm - cui-llama.rn - Versions diffs - 1.2.4 → 1.3.0 - Mend

cui-llama.rn 1.2.4 → 1.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (70) hide show

package/README.md +3 -4
package/android/src/main/CMakeLists.txt +21 -5
package/android/src/main/java/com/rnllama/LlamaContext.java +115 -30
package/android/src/main/java/com/rnllama/RNLlama.java +40 -7
package/android/src/main/jni.cpp +222 -36
package/android/src/newarch/java/com/rnllama/RNLlamaModule.java +9 -4
package/android/src/oldarch/java/com/rnllama/RNLlamaModule.java +9 -4
package/cpp/common.cpp +1682 -2122
package/cpp/common.h +600 -594
package/cpp/ggml-aarch64.c +129 -3209
package/cpp/ggml-aarch64.h +19 -39
package/cpp/ggml-alloc.c +1040 -1040
package/cpp/ggml-alloc.h +76 -76
package/cpp/ggml-backend-impl.h +216 -227
package/cpp/ggml-backend-reg.cpp +195 -0
package/cpp/ggml-backend.cpp +1997 -2625
package/cpp/ggml-backend.h +328 -326
package/cpp/ggml-common.h +1853 -1853
package/cpp/ggml-cpp.h +38 -0
package/cpp/ggml-cpu-aarch64.c +3560 -0
package/cpp/ggml-cpu-aarch64.h +30 -0
package/cpp/ggml-cpu-impl.h +371 -614
package/cpp/ggml-cpu-quants.c +10822 -0
package/cpp/ggml-cpu-quants.h +63 -0
package/cpp/ggml-cpu.c +13975 -0
package/cpp/ggml-cpu.cpp +663 -0
package/cpp/ggml-cpu.h +177 -0
package/cpp/ggml-impl.h +550 -209
package/cpp/ggml-metal.h +66 -66
package/cpp/ggml-metal.m +4294 -3819
package/cpp/ggml-quants.c +5247 -15752
package/cpp/ggml-quants.h +100 -147
package/cpp/ggml-threading.cpp +12 -0
package/cpp/ggml-threading.h +12 -0
package/cpp/ggml.c +8180 -23464
package/cpp/ggml.h +2411 -2562
package/cpp/llama-grammar.cpp +1138 -1138
package/cpp/llama-grammar.h +144 -144
package/cpp/llama-impl.h +181 -181
package/cpp/llama-sampling.cpp +2348 -2194
package/cpp/llama-sampling.h +48 -30
package/cpp/llama-vocab.cpp +1984 -1968
package/cpp/llama-vocab.h +170 -165
package/cpp/llama.cpp +22132 -21969
package/cpp/llama.h +1253 -1253
package/cpp/log.cpp +401 -401
package/cpp/log.h +121 -121
package/cpp/rn-llama.hpp +83 -19
package/cpp/sampling.cpp +466 -458
package/cpp/sgemm.cpp +1884 -1219
package/ios/RNLlama.mm +43 -20
package/ios/RNLlamaContext.h +9 -3
package/ios/RNLlamaContext.mm +133 -33
package/jest/mock.js +0 -1
package/lib/commonjs/NativeRNLlama.js.map +1 -1
package/lib/commonjs/index.js +52 -15
package/lib/commonjs/index.js.map +1 -1
package/lib/module/NativeRNLlama.js.map +1 -1
package/lib/module/index.js +51 -15
package/lib/module/index.js.map +1 -1
package/lib/typescript/NativeRNLlama.d.ts +29 -6
package/lib/typescript/NativeRNLlama.d.ts.map +1 -1
package/lib/typescript/index.d.ts +12 -5
package/lib/typescript/index.d.ts.map +1 -1
package/package.json +1 -1
package/src/NativeRNLlama.ts +41 -7
package/src/index.ts +82 -27
package/cpp/json-schema-to-grammar.cpp +0 -1045
package/cpp/json-schema-to-grammar.h +0 -8
package/cpp/json.hpp +0 -24766

package/cpp/llama-sampling.h CHANGED Viewed

@@ -1,30 +1,48 @@
-#pragma once
-// TODO: rename llama-sampling.h/.cpp to llama-sampler.h/.cpp ?
-#include "llama-grammar.h"
-struct llama_vocab;
-struct llama_grammar;
-// sampler chain
-struct llama_sampler_chain {
-    llama_sampler_chain_params params;
-    std::vector<struct llama_sampler *> samplers;
-    // timing
-    mutable int64_t t_sample_us;
-    mutable int32_t n_sample;
-};
-struct llama_sampler * llama_sampler_init_grammar_impl(
-        const struct llama_vocab & vocab,
-                      const char * grammar_str,
-                      const char * grammar_root);
-struct llama_sampler * llama_sampler_init_infill_impl(
-        const struct llama_vocab & vocab);
+#pragma once
+// TODO: rename llama-sampling.h/.cpp to llama-sampler.h/.cpp ?
+#include "llama-grammar.h"
+struct llama_vocab;
+struct llama_grammar;
+// sampler chain
+struct llama_sampler_chain {
+    llama_sampler_chain_params params;
+    std::vector<struct llama_sampler *> samplers;
+    // timing
+    mutable int64_t t_sample_us;
+    mutable int32_t n_sample;
+};
+struct llama_sampler * llama_sampler_init_grammar_impl(
+        const struct llama_vocab & vocab,
+                      const char * grammar_str,
+                      const char * grammar_root);
+struct llama_sampler * llama_sampler_init_infill_impl(
+        const struct llama_vocab & vocab);
+struct llama_sampler * llama_sampler_init_dry_impl(
+        const struct llama_vocab &  vocab,
+                         int32_t    context_size,
+                           float    dry_multiplier,
+                           float    dry_base,
+                         int32_t    dry_allowed_length,
+                         int32_t    dry_penalty_last_n,
+                      const char ** seq_breakers,
+                          size_t    num_breakers);
+struct llama_sampler * llama_sampler_init_dry_testing(
+                         int32_t   context_size,
+                           float   dry_multiplier,
+                           float   dry_base,
+                         int32_t   dry_allowed_length,
+                         int32_t   dry_penalty_last_n,
+  const std::vector<std::vector<llama_token>>& seq_breakers);