npm - @fugood/llama.node - Versions diffs - 0.0.1-alpha.1 - Mend

@fugood/llama.node 0.0.1-alpha.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (204) hide show

package/CMakeLists.txt +85 -0
package/README.md +56 -0
package/bin/darwin/arm64/llama-node.node +0 -0
package/bin/darwin/x64/llama-node.node +0 -0
package/bin/linux/arm64/llama-node.node +0 -0
package/bin/linux/x64/llama-node.node +0 -0
package/bin/win32/arm64/llama-node.node +0 -0
package/bin/win32/arm64/node.lib +0 -0
package/bin/win32/x64/llama-node.node +0 -0
package/bin/win32/x64/node.lib +0 -0
package/lib/binding.js +13 -0
package/lib/binding.ts +57 -0
package/lib/index.js +24 -0
package/lib/index.ts +13 -0
package/package.json +65 -0
package/src/addons.cpp +506 -0
package/src/llama.cpp/CMakeLists.txt +1320 -0
package/src/llama.cpp/build.zig +172 -0
package/src/llama.cpp/cmake/FindSIMD.cmake +100 -0
package/src/llama.cpp/common/CMakeLists.txt +87 -0
package/src/llama.cpp/common/base64.hpp +392 -0
package/src/llama.cpp/common/common.cpp +2949 -0
package/src/llama.cpp/common/common.h +324 -0
package/src/llama.cpp/common/console.cpp +501 -0
package/src/llama.cpp/common/console.h +19 -0
package/src/llama.cpp/common/grammar-parser.cpp +440 -0
package/src/llama.cpp/common/grammar-parser.h +29 -0
package/src/llama.cpp/common/json-schema-to-grammar.cpp +764 -0
package/src/llama.cpp/common/json-schema-to-grammar.h +4 -0
package/src/llama.cpp/common/json.hpp +24766 -0
package/src/llama.cpp/common/log.h +724 -0
package/src/llama.cpp/common/ngram-cache.cpp +282 -0
package/src/llama.cpp/common/ngram-cache.h +94 -0
package/src/llama.cpp/common/sampling.cpp +353 -0
package/src/llama.cpp/common/sampling.h +147 -0
package/src/llama.cpp/common/stb_image.h +8396 -0
package/src/llama.cpp/common/train.cpp +1513 -0
package/src/llama.cpp/common/train.h +233 -0
package/src/llama.cpp/examples/CMakeLists.txt +52 -0
package/src/llama.cpp/examples/baby-llama/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/baby-llama/baby-llama.cpp +1640 -0
package/src/llama.cpp/examples/batched/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/batched/batched.cpp +262 -0
package/src/llama.cpp/examples/batched-bench/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/batched-bench/batched-bench.cpp +261 -0
package/src/llama.cpp/examples/beam-search/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/beam-search/beam-search.cpp +188 -0
package/src/llama.cpp/examples/benchmark/CMakeLists.txt +6 -0
package/src/llama.cpp/examples/benchmark/benchmark-matmult.cpp +275 -0
package/src/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +936 -0
package/src/llama.cpp/examples/embedding/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/embedding/embedding.cpp +211 -0
package/src/llama.cpp/examples/eval-callback/CMakeLists.txt +9 -0
package/src/llama.cpp/examples/eval-callback/eval-callback.cpp +195 -0
package/src/llama.cpp/examples/export-lora/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/export-lora/export-lora.cpp +462 -0
package/src/llama.cpp/examples/finetune/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/finetune/finetune.cpp +1861 -0
package/src/llama.cpp/examples/gbnf-validator/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/gbnf-validator/gbnf-validator.cpp +132 -0
package/src/llama.cpp/examples/gguf/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/gguf/gguf.cpp +256 -0
package/src/llama.cpp/examples/gguf-split/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/gguf-split/gguf-split.cpp +553 -0
package/src/llama.cpp/examples/gritlm/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/gritlm/gritlm.cpp +215 -0
package/src/llama.cpp/examples/imatrix/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/imatrix/imatrix.cpp +655 -0
package/src/llama.cpp/examples/infill/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/infill/infill.cpp +767 -0
package/src/llama.cpp/examples/jeopardy/questions.txt +100 -0
package/src/llama.cpp/examples/llama-bench/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/llama-bench/llama-bench.cpp +1286 -0
package/src/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +50 -0
package/src/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +443 -0
package/src/llama.cpp/examples/llava/CMakeLists.txt +37 -0
package/src/llama.cpp/examples/llava/clip.cpp +2027 -0
package/src/llama.cpp/examples/llava/clip.h +85 -0
package/src/llama.cpp/examples/llava/llava-cli.cpp +309 -0
package/src/llama.cpp/examples/llava/llava.cpp +426 -0
package/src/llama.cpp/examples/llava/llava.h +50 -0
package/src/llama.cpp/examples/llava/requirements.txt +3 -0
package/src/llama.cpp/examples/lookahead/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/lookahead/lookahead.cpp +485 -0
package/src/llama.cpp/examples/lookup/CMakeLists.txt +23 -0
package/src/llama.cpp/examples/lookup/lookup-create.cpp +41 -0
package/src/llama.cpp/examples/lookup/lookup-merge.cpp +47 -0
package/src/llama.cpp/examples/lookup/lookup-stats.cpp +160 -0
package/src/llama.cpp/examples/lookup/lookup.cpp +258 -0
package/src/llama.cpp/examples/main/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/main/main.cpp +957 -0
package/src/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +33 -0
package/src/llama.cpp/examples/parallel/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/parallel/parallel.cpp +427 -0
package/src/llama.cpp/examples/passkey/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/passkey/passkey.cpp +302 -0
package/src/llama.cpp/examples/perplexity/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/perplexity/perplexity.cpp +1943 -0
package/src/llama.cpp/examples/quantize/CMakeLists.txt +6 -0
package/src/llama.cpp/examples/quantize/quantize.cpp +423 -0
package/src/llama.cpp/examples/quantize-stats/CMakeLists.txt +6 -0
package/src/llama.cpp/examples/quantize-stats/quantize-stats.cpp +424 -0
package/src/llama.cpp/examples/retrieval/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/retrieval/retrieval.cpp +350 -0
package/src/llama.cpp/examples/save-load-state/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/save-load-state/save-load-state.cpp +246 -0
package/src/llama.cpp/examples/server/CMakeLists.txt +40 -0
package/src/llama.cpp/examples/server/bench/requirements.txt +2 -0
package/src/llama.cpp/examples/server/httplib.h +9465 -0
package/src/llama.cpp/examples/server/server.cpp +3826 -0
package/src/llama.cpp/examples/server/tests/requirements.txt +6 -0
package/src/llama.cpp/examples/server/utils.hpp +653 -0
package/src/llama.cpp/examples/simple/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/simple/simple.cpp +183 -0
package/src/llama.cpp/examples/speculative/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/speculative/speculative.cpp +614 -0
package/src/llama.cpp/examples/sycl/CMakeLists.txt +9 -0
package/src/llama.cpp/examples/sycl/ls-sycl-device.cpp +13 -0
package/src/llama.cpp/examples/tokenize/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/tokenize/tokenize.cpp +42 -0
package/src/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +5 -0
package/src/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +1252 -0
package/src/llama.cpp/ggml-alloc.c +985 -0
package/src/llama.cpp/ggml-alloc.h +76 -0
package/src/llama.cpp/ggml-backend-impl.h +141 -0
package/src/llama.cpp/ggml-backend.c +2099 -0
package/src/llama.cpp/ggml-backend.h +233 -0
package/src/llama.cpp/ggml-common.h +1853 -0
package/src/llama.cpp/ggml-cuda.h +43 -0
package/src/llama.cpp/ggml-impl.h +265 -0
package/src/llama.cpp/ggml-kompute.cpp +2006 -0
package/src/llama.cpp/ggml-kompute.h +46 -0
package/src/llama.cpp/ggml-metal.h +66 -0
package/src/llama.cpp/ggml-mpi.c +216 -0
package/src/llama.cpp/ggml-mpi.h +39 -0
package/src/llama.cpp/ggml-opencl.cpp +2301 -0
package/src/llama.cpp/ggml-opencl.h +36 -0
package/src/llama.cpp/ggml-quants.c +12678 -0
package/src/llama.cpp/ggml-quants.h +133 -0
package/src/llama.cpp/ggml-sycl.cpp +17882 -0
package/src/llama.cpp/ggml-sycl.h +49 -0
package/src/llama.cpp/ggml-vulkan-shaders.hpp +69849 -0
package/src/llama.cpp/ggml-vulkan.cpp +6442 -0
package/src/llama.cpp/ggml-vulkan.h +29 -0
package/src/llama.cpp/ggml.c +21819 -0
package/src/llama.cpp/ggml.h +2403 -0
package/src/llama.cpp/llama.cpp +17468 -0
package/src/llama.cpp/llama.h +1117 -0
package/src/llama.cpp/pocs/CMakeLists.txt +12 -0
package/src/llama.cpp/pocs/vdot/CMakeLists.txt +9 -0
package/src/llama.cpp/pocs/vdot/q8dot.cpp +172 -0
package/src/llama.cpp/pocs/vdot/vdot.cpp +310 -0
package/src/llama.cpp/prompts/LLM-questions.txt +49 -0
package/src/llama.cpp/prompts/alpaca.txt +1 -0
package/src/llama.cpp/prompts/assistant.txt +31 -0
package/src/llama.cpp/prompts/chat-with-baichuan.txt +4 -0
package/src/llama.cpp/prompts/chat-with-bob.txt +7 -0
package/src/llama.cpp/prompts/chat-with-qwen.txt +1 -0
package/src/llama.cpp/prompts/chat-with-vicuna-v0.txt +7 -0
package/src/llama.cpp/prompts/chat-with-vicuna-v1.txt +7 -0
package/src/llama.cpp/prompts/chat.txt +28 -0
package/src/llama.cpp/prompts/dan-modified.txt +1 -0
package/src/llama.cpp/prompts/dan.txt +1 -0
package/src/llama.cpp/prompts/mnemonics.txt +93 -0
package/src/llama.cpp/prompts/parallel-questions.txt +43 -0
package/src/llama.cpp/prompts/reason-act.txt +18 -0
package/src/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +3 -0
package/src/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +1 -0
package/src/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +2 -0
package/src/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +2 -0
package/src/llama.cpp/requirements/requirements-convert.txt +5 -0
package/src/llama.cpp/requirements.txt +12 -0
package/src/llama.cpp/scripts/gen-build-info-cpp.cmake +24 -0
package/src/llama.cpp/scripts/xxd.cmake +16 -0
package/src/llama.cpp/sgemm.cpp +999 -0
package/src/llama.cpp/sgemm.h +12 -0
package/src/llama.cpp/tests/CMakeLists.txt +78 -0
package/src/llama.cpp/tests/get-model.cpp +21 -0
package/src/llama.cpp/tests/get-model.h +2 -0
package/src/llama.cpp/tests/test-autorelease.cpp +24 -0
package/src/llama.cpp/tests/test-backend-ops.cpp +2266 -0
package/src/llama.cpp/tests/test-c.c +7 -0
package/src/llama.cpp/tests/test-chat-template.cpp +107 -0
package/src/llama.cpp/tests/test-double-float.cpp +57 -0
package/src/llama.cpp/tests/test-grad0.cpp +1606 -0
package/src/llama.cpp/tests/test-grammar-integration.cpp +243 -0
package/src/llama.cpp/tests/test-grammar-parser.cpp +250 -0
package/src/llama.cpp/tests/test-json-schema-to-grammar.cpp +899 -0
package/src/llama.cpp/tests/test-llama-grammar.cpp +402 -0
package/src/llama.cpp/tests/test-model-load-cancel.cpp +27 -0
package/src/llama.cpp/tests/test-opt.cpp +181 -0
package/src/llama.cpp/tests/test-quantize-fns.cpp +185 -0
package/src/llama.cpp/tests/test-quantize-perf.cpp +363 -0
package/src/llama.cpp/tests/test-rope.cpp +221 -0
package/src/llama.cpp/tests/test-sampling.cpp +301 -0
package/src/llama.cpp/tests/test-tokenizer-0-falcon.cpp +187 -0
package/src/llama.cpp/tests/test-tokenizer-0-llama.cpp +190 -0
package/src/llama.cpp/tests/test-tokenizer-1-bpe.cpp +123 -0
package/src/llama.cpp/tests/test-tokenizer-1-llama.cpp +111 -0
package/src/llama.cpp/unicode-data.cpp +1651 -0
package/src/llama.cpp/unicode-data.h +16 -0
package/src/llama.cpp/unicode.cpp +277 -0
package/src/llama.cpp/unicode.h +28 -0

package/src/llama.cpp/sgemm.h ADDED Viewed

@@ -0,0 +1,12 @@
+#pragma once
+#include <stdbool.h>
+#ifdef __cplusplus
+extern "C" {
+#endif
+bool llamafile_sgemm(int, int, int, const void *, int, const void *, int,
+                     void *, int, int, int, int, int, int, int);
+#ifdef __cplusplus
+}
+#endif

package/src/llama.cpp/tests/CMakeLists.txt ADDED Viewed

@@ -0,0 +1,78 @@
+# Builds and runs a test source file.
+# Optional args:
+# - NAME: name of the executable & test target (defaults to the source file name without extension)
+# - LABEL: label for the test (defaults to main)
+# - ARGS: arguments to pass to the test executable
+# - WORKING_DIRECTORY
+function(llama_test source)
+    include(CMakeParseArguments)
+    set(options)
+    set(oneValueArgs NAME LABEL WORKING_DIRECTORY)
+    set(multiValueArgs ARGS)
+    cmake_parse_arguments(LLAMA_TEST "${options}" "${oneValueArgs}" "${multiValueArgs}" ${ARGN})
+    if (NOT DEFINED LLAMA_TEST_LABEL)
+        set(LLAMA_TEST_LABEL "main")
+    endif()
+    if (NOT DEFINED LLAMA_TEST_WORKING_DIRECTORY)
+        set(LLAMA_TEST_WORKING_DIRECTORY .)
+    endif()
+    if (DEFINED LLAMA_TEST_NAME)
+        set(TEST_TARGET ${LLAMA_TEST_NAME})
+    else()
+        get_filename_component(TEST_TARGET ${source} NAME_WE)
+    endif()
+    add_executable(${TEST_TARGET} ${source} get-model.cpp)
+    install(TARGETS ${TEST_TARGET} RUNTIME)
+    target_link_libraries(${TEST_TARGET} PRIVATE common)
+    add_test(
+        NAME ${TEST_TARGET}
+        WORKING_DIRECTORY ${LLAMA_TEST_WORKING_DIRECTORY}
+        COMMAND $<TARGET_FILE:${TEST_TARGET}>
+        ${LLAMA_TEST_ARGS})
+    set_property(TEST ${TEST_TARGET} PROPERTY LABELS ${LLAMA_TEST_LABEL})
+endfunction()
+# llama_test(test-double-float.cpp) # SLOW
+llama_test(test-quantize-fns.cpp)
+llama_test(test-quantize-perf.cpp)
+llama_test(test-sampling.cpp)
+llama_test(test-chat-template.cpp)
+llama_test(test-tokenizer-0-llama.cpp  NAME test-tokenizer-0-llama            ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-llama.gguf)
+llama_test(test-tokenizer-0-falcon.cpp NAME test-tokenizer-0-falcon           ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-falcon.gguf)
+llama_test(test-tokenizer-1-llama.cpp  NAME test-tokenizer-1-llama            ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-llama.gguf)
+llama_test(test-tokenizer-1-llama.cpp  NAME test-tokenizer-1-baichuan         ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-baichuan.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-falcon           ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-falcon.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-aquila           ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-aquila.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-mpt              ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-mpt.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-stablelm-3b-4e1t ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-stablelm-3b-4e1t.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-gpt-neox         ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-gpt-neox.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-refact           ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-refact.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-starcoder        ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-starcoder.gguf)
+llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-gpt2             ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-gpt2.gguf)
+#llama_test(test-tokenizer-1-bpe.cpp    NAME test-tokenizer-1-bloom            ARGS ${CMAKE_CURRENT_SOURCE_DIR}/../models/ggml-vocab-bloom.gguf) # BIG
+llama_test(test-grammar-parser.cpp)
+llama_test(test-llama-grammar.cpp)
+llama_test(test-grammar-integration.cpp)
+llama_test(test-grad0.cpp)
+# llama_test(test-opt.cpp) # SLOW
+llama_test(test-backend-ops.cpp)
+llama_test(test-rope.cpp)
+llama_test(test-model-load-cancel.cpp  LABEL "model")
+llama_test(test-autorelease.cpp        LABEL "model")
+llama_test(test-json-schema-to-grammar.cpp   WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/..)
+target_include_directories(test-json-schema-to-grammar PRIVATE ${CMAKE_CURRENT_SOURCE_DIR}/../examples/server)
+# dummy executable - not installed
+get_filename_component(TEST_TARGET test-c.c NAME_WE)
+add_executable(${TEST_TARGET} test-c.c)
+target_link_libraries(${TEST_TARGET} PRIVATE llama)

package/src/llama.cpp/tests/get-model.cpp ADDED Viewed

@@ -0,0 +1,21 @@
+#include <cstdio>
+#include <cstdlib>
+#include <cstring>
+#include "get-model.h"
+char * get_model_or_exit(int argc, char *argv[]) {
+    char * model_path;
+    if (argc > 1) {
+        model_path = argv[1];
+    } else {
+        model_path = getenv("LLAMACPP_TEST_MODELFILE");
+        if (!model_path || strlen(model_path) == 0) {
+            fprintf(stderr, "\033[33mWARNING: No model file provided. Skipping this test. Set LLAMACPP_TEST_MODELFILE=<gguf_model_path> to silence this warning and run this test.\n\033[0m");
+            exit(EXIT_SUCCESS);
+        }
+    }
+    return model_path;
+}

package/src/llama.cpp/tests/get-model.h ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ #pragma once
2	+ char * get_model_or_exit(int, char*[]);

package/src/llama.cpp/tests/test-autorelease.cpp ADDED Viewed

@@ -0,0 +1,24 @@
+// ref: https://github.com/ggerganov/llama.cpp/issues/4952#issuecomment-1892864763
+#include <cstdio>
+#include <string>
+#include <thread>
+#include "llama.h"
+#include "get-model.h"
+// This creates a new context inside a pthread and then tries to exit cleanly.
+int main(int argc, char ** argv) {
+    auto * model_path = get_model_or_exit(argc, argv);
+    std::thread([&model_path]() {
+        llama_backend_init();
+        auto * model = llama_load_model_from_file(model_path, llama_model_default_params());
+        auto * ctx = llama_new_context_with_model(model, llama_context_default_params());
+        llama_free(ctx);
+        llama_free_model(model);
+        llama_backend_free();
+    }).join();
+    return 0;
+}