npm - cui-llama.rn - Versions diffs - 1.3.0 → 1.3.3 - Mend

cui-llama.rn 1.3.0 → 1.3.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (76) hide show

package/android/src/main/CMakeLists.txt +6 -1
package/android/src/main/jni.cpp +6 -6
package/cpp/amx/amx.cpp +196 -0
package/cpp/amx/amx.h +20 -0
package/cpp/amx/common.h +101 -0
package/cpp/amx/mmq.cpp +2524 -0
package/cpp/amx/mmq.h +16 -0
package/cpp/common.cpp +1981 -1682
package/cpp/common.h +636 -600
package/cpp/ggml-aarch64.c +129 -129
package/cpp/ggml-aarch64.h +19 -19
package/cpp/ggml-alloc.c +1038 -1040
package/cpp/ggml-alloc.h +76 -76
package/cpp/ggml-backend-impl.h +238 -216
package/cpp/ggml-backend-reg.cpp +423 -195
package/cpp/ggml-backend.cpp +1999 -1997
package/cpp/ggml-backend.h +351 -328
package/cpp/ggml-common.h +1859 -1853
package/cpp/ggml-cpp.h +38 -38
package/cpp/ggml-cpu-aarch64.c +3823 -3560
package/cpp/ggml-cpu-aarch64.h +32 -30
package/cpp/ggml-cpu-impl.h +386 -371
package/cpp/ggml-cpu-quants.c +10835 -10822
package/cpp/ggml-cpu-quants.h +63 -63
package/cpp/ggml-cpu.c +99 -103
package/cpp/ggml-cpu.cpp +69 -17
package/cpp/ggml-cpu.h +152 -177
package/cpp/ggml-impl.h +556 -550
package/cpp/ggml-metal.h +66 -66
package/cpp/ggml-metal.m +4426 -4294
package/cpp/ggml-quants.c +5247 -5247
package/cpp/ggml-quants.h +100 -100
package/cpp/ggml-threading.cpp +12 -12
package/cpp/ggml-threading.h +12 -12
package/cpp/ggml.c +7618 -8180
package/cpp/ggml.h +2255 -2411
package/cpp/json-schema-to-grammar.cpp +1045 -0
package/cpp/json-schema-to-grammar.h +8 -0
package/cpp/json.hpp +24766 -0
package/cpp/llama-grammar.cpp +1138 -1138
package/cpp/llama-grammar.h +144 -144
package/cpp/llama-impl.h +181 -181
package/cpp/llama-sampling.cpp +2348 -2348
package/cpp/llama-sampling.h +48 -48
package/cpp/llama-vocab.cpp +1984 -1984
package/cpp/llama-vocab.h +170 -170
package/cpp/llama.cpp +22332 -22132
package/cpp/llama.h +1259 -1253
package/cpp/log.cpp +401 -401
package/cpp/log.h +121 -121
package/cpp/rn-llama.hpp +6 -6
package/cpp/sampling.cpp +505 -466
package/cpp/sampling.h +22 -1
package/cpp/sgemm.cpp +1884 -1884
package/cpp/speculative.cpp +270 -0
package/cpp/speculative.h +28 -0
package/cpp/unicode.cpp +11 -0
package/ios/RNLlamaContext.mm +13 -0
package/lib/commonjs/NativeRNLlama.js.map +1 -1
package/lib/commonjs/grammar.js +4 -2
package/lib/commonjs/grammar.js.map +1 -1
package/lib/commonjs/index.js.map +1 -1
package/lib/module/NativeRNLlama.js.map +1 -1
package/lib/module/grammar.js +2 -1
package/lib/module/grammar.js.map +1 -1
package/lib/module/index.js.map +1 -1
package/lib/typescript/NativeRNLlama.d.ts +94 -4
package/lib/typescript/NativeRNLlama.d.ts.map +1 -1
package/lib/typescript/grammar.d.ts +5 -6
package/lib/typescript/grammar.d.ts.map +1 -1
package/lib/typescript/index.d.ts +4 -2
package/lib/typescript/index.d.ts.map +1 -1
package/package.json +2 -1
package/src/NativeRNLlama.ts +97 -10
package/src/grammar.ts +10 -8
package/src/index.ts +22 -1

package/cpp/ggml-cpu-aarch64.h CHANGED Viewed

@@ -1,30 +1,32 @@
-#pragma once
-#include "ggml.h"
-// GGML internal header
-#ifdef __cplusplus
-extern "C" {
-#endif
-// Quantization
-void quantize_mat_q8_0(const float * LM_GGML_RESTRICT x, void * LM_GGML_RESTRICT y, int64_t nrows, int64_t n_per_row, int64_t blck_size_interleave);
-// GEMV
-void lm_ggml_gemv_q4_0_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-void lm_ggml_gemv_q4_0_4x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-void lm_ggml_gemv_q4_0_8x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-// GEMM
-void lm_ggml_gemm_q4_0_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-void lm_ggml_gemm_q4_0_4x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-void lm_ggml_gemm_q4_0_8x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
-void           lm_ggml_aarch64_repack_tensor(struct lm_ggml_tensor * cur, enum lm_ggml_type repack_type, const void * data, size_t data_size);
-enum lm_ggml_type lm_ggml_aarch64_get_optimal_repack_type(const struct lm_ggml_tensor * cur);
-#ifdef __cplusplus
-}
-#endif
+#pragma once
+#include "ggml.h"
+// GGML internal header
+#ifdef __cplusplus
+extern "C" {
+#endif
+// Quantization
+void quantize_mat_q8_0(const float * LM_GGML_RESTRICT x, void * LM_GGML_RESTRICT y, int64_t nrows, int64_t n_per_row, int64_t blck_size_interleave);
+// GEMV
+void lm_ggml_gemv_q4_0_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemv_q4_0_4x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemv_q4_0_8x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemv_iq4_nl_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+// GEMM
+void lm_ggml_gemm_q4_0_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemm_q4_0_4x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemm_q4_0_8x8_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void lm_ggml_gemm_iq4_nl_4x4_q8_0(int n, float * LM_GGML_RESTRICT s, size_t bs, const void * LM_GGML_RESTRICT vx, const void * LM_GGML_RESTRICT vy, int nr, int nc);
+void           lm_ggml_aarch64_repack_tensor(struct lm_ggml_tensor * cur, enum lm_ggml_type repack_type, const void * data, size_t data_size);
+enum lm_ggml_type lm_ggml_aarch64_get_optimal_repack_type(const struct lm_ggml_tensor * cur);
+#ifdef __cplusplus
+}
+#endif