npm - @fugood/llama.node - Versions diffs - 0.6.2 → 1.0.0-beta.1 - Mend

@fugood/llama.node 0.6.2 → 1.0.0-beta.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (378) hide show

package/CMakeLists.txt +40 -30
package/README.md +4 -1
package/lib/binding.js +41 -29
package/lib/binding.ts +26 -25
package/package.json +45 -10
package/scripts/build.js +47 -0
package/scripts/llama.cpp.patch +109 -0
package/src/anyascii.c +22223 -0
package/src/anyascii.h +42 -0
package/src/tts_utils.cpp +20 -7
package/src/tts_utils.h +2 -0
package/bin/darwin/arm64/llama-node.node +0 -0
package/bin/darwin/x64/llama-node.node +0 -0
package/bin/linux/arm64/llama-node.node +0 -0
package/bin/linux/x64/llama-node.node +0 -0
package/bin/linux-cuda/arm64/llama-node.node +0 -0
package/bin/linux-cuda/x64/llama-node.node +0 -0
package/bin/linux-vulkan/arm64/llama-node.node +0 -0
package/bin/linux-vulkan/x64/llama-node.node +0 -0
package/bin/win32/x64/llama-node.node +0 -0
package/bin/win32/x64/node.lib +0 -0
package/bin/win32-vulkan/arm64/llama-node.node +0 -0
package/bin/win32-vulkan/arm64/node.lib +0 -0
package/bin/win32-vulkan/x64/llama-node.node +0 -0
package/bin/win32-vulkan/x64/node.lib +0 -0
package/patches/node-api-headers+1.1.0.patch +0 -26
package/src/llama.cpp/.github/workflows/build-linux-cross.yml +0 -233
package/src/llama.cpp/.github/workflows/build.yml +0 -1078
package/src/llama.cpp/.github/workflows/close-issue.yml +0 -28
package/src/llama.cpp/.github/workflows/docker.yml +0 -178
package/src/llama.cpp/.github/workflows/editorconfig.yml +0 -29
package/src/llama.cpp/.github/workflows/gguf-publish.yml +0 -44
package/src/llama.cpp/.github/workflows/labeler.yml +0 -17
package/src/llama.cpp/.github/workflows/python-check-requirements.yml +0 -33
package/src/llama.cpp/.github/workflows/python-lint.yml +0 -30
package/src/llama.cpp/.github/workflows/python-type-check.yml +0 -40
package/src/llama.cpp/.github/workflows/release.yml +0 -739
package/src/llama.cpp/.github/workflows/server.yml +0 -237
package/src/llama.cpp/.github/workflows/winget.yml +0 -42
package/src/llama.cpp/cmake/arm64-apple-clang.cmake +0 -16
package/src/llama.cpp/cmake/arm64-windows-llvm.cmake +0 -16
package/src/llama.cpp/cmake/build-info.cmake +0 -64
package/src/llama.cpp/cmake/common.cmake +0 -35
package/src/llama.cpp/cmake/git-vars.cmake +0 -22
package/src/llama.cpp/cmake/x64-windows-llvm.cmake +0 -5
package/src/llama.cpp/common/build-info.cpp.in +0 -4
package/src/llama.cpp/docs/build.md +0 -561
package/src/llama.cpp/examples/CMakeLists.txt +0 -43
package/src/llama.cpp/examples/batched/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/batched/batched.cpp +0 -246
package/src/llama.cpp/examples/chat-13B.bat +0 -57
package/src/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -941
package/src/llama.cpp/examples/deprecation-warning/deprecation-warning.cpp +0 -35
package/src/llama.cpp/examples/embedding/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/embedding/embedding.cpp +0 -323
package/src/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -10
package/src/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -194
package/src/llama.cpp/examples/gen-docs/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/gen-docs/gen-docs.cpp +0 -83
package/src/llama.cpp/examples/gguf/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/gguf/gguf.cpp +0 -265
package/src/llama.cpp/examples/gguf-hash/CMakeLists.txt +0 -22
package/src/llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h +0 -46
package/src/llama.cpp/examples/gguf-hash/deps/sha1/sha1.c +0 -295
package/src/llama.cpp/examples/gguf-hash/deps/sha1/sha1.h +0 -52
package/src/llama.cpp/examples/gguf-hash/deps/sha256/sha256.c +0 -221
package/src/llama.cpp/examples/gguf-hash/deps/sha256/sha256.h +0 -24
package/src/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c +0 -42
package/src/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h +0 -7093
package/src/llama.cpp/examples/gguf-hash/gguf-hash.cpp +0 -694
package/src/llama.cpp/examples/gritlm/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/gritlm/gritlm.cpp +0 -229
package/src/llama.cpp/examples/jeopardy/questions.txt +0 -100
package/src/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -65
package/src/llama.cpp/examples/llama.android/build.gradle.kts +0 -6
package/src/llama.cpp/examples/llama.android/llama/build.gradle.kts +0 -71
package/src/llama.cpp/examples/llama.android/llama/src/main/cpp/CMakeLists.txt +0 -53
package/src/llama.cpp/examples/llama.android/llama/src/main/cpp/llama-android.cpp +0 -452
package/src/llama.cpp/examples/llama.android/settings.gradle.kts +0 -18
package/src/llama.cpp/examples/lookahead/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/lookahead/lookahead.cpp +0 -472
package/src/llama.cpp/examples/lookup/CMakeLists.txt +0 -23
package/src/llama.cpp/examples/lookup/lookup-create.cpp +0 -40
package/src/llama.cpp/examples/lookup/lookup-merge.cpp +0 -47
package/src/llama.cpp/examples/lookup/lookup-stats.cpp +0 -157
package/src/llama.cpp/examples/lookup/lookup.cpp +0 -242
package/src/llama.cpp/examples/parallel/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/parallel/parallel.cpp +0 -492
package/src/llama.cpp/examples/passkey/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/passkey/passkey.cpp +0 -277
package/src/llama.cpp/examples/retrieval/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/retrieval/retrieval.cpp +0 -304
package/src/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -246
package/src/llama.cpp/examples/simple/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/simple/simple.cpp +0 -206
package/src/llama.cpp/examples/simple-chat/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/simple-chat/simple-chat.cpp +0 -206
package/src/llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt +0 -11
package/src/llama.cpp/examples/speculative/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/speculative/speculative.cpp +0 -644
package/src/llama.cpp/examples/speculative-simple/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/speculative-simple/speculative-simple.cpp +0 -261
package/src/llama.cpp/examples/sycl/CMakeLists.txt +0 -9
package/src/llama.cpp/examples/sycl/build.sh +0 -23
package/src/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -13
package/src/llama.cpp/examples/sycl/run-llama2.sh +0 -27
package/src/llama.cpp/examples/sycl/run-llama3.sh +0 -28
package/src/llama.cpp/examples/sycl/win-build-sycl.bat +0 -33
package/src/llama.cpp/examples/sycl/win-run-llama2.bat +0 -9
package/src/llama.cpp/examples/sycl/win-run-llama3.bat +0 -9
package/src/llama.cpp/examples/training/CMakeLists.txt +0 -5
package/src/llama.cpp/examples/training/finetune.cpp +0 -96
package/src/llama.cpp/ggml/cmake/GitVars.cmake +0 -22
package/src/llama.cpp/ggml/cmake/common.cmake +0 -26
package/src/llama.cpp/ggml/src/ggml-alloc.c +0 -1042
package/src/llama.cpp/ggml/src/ggml-backend-impl.h +0 -255
package/src/llama.cpp/ggml/src/ggml-backend-reg.cpp +0 -586
package/src/llama.cpp/ggml/src/ggml-backend.cpp +0 -2008
package/src/llama.cpp/ggml/src/ggml-blas/CMakeLists.txt +0 -87
package/src/llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp +0 -517
package/src/llama.cpp/ggml/src/ggml-cann/CMakeLists.txt +0 -74
package/src/llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp +0 -179
package/src/llama.cpp/ggml/src/ggml-cann/acl_tensor.h +0 -258
package/src/llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp +0 -2863
package/src/llama.cpp/ggml/src/ggml-cann/aclnn_ops.h +0 -1110
package/src/llama.cpp/ggml/src/ggml-cann/common.h +0 -420
package/src/llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp +0 -2570
package/src/llama.cpp/ggml/src/ggml-common.h +0 -1857
package/src/llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake +0 -100
package/src/llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt +0 -184
package/src/llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h +0 -15
package/src/llama.cpp/ggml/src/ggml-cuda/vendors/hip.h +0 -243
package/src/llama.cpp/ggml/src/ggml-cuda/vendors/musa.h +0 -140
package/src/llama.cpp/ggml/src/ggml-hip/CMakeLists.txt +0 -131
package/src/llama.cpp/ggml/src/ggml-impl.h +0 -601
package/src/llama.cpp/ggml/src/ggml-kompute/CMakeLists.txt +0 -166
package/src/llama.cpp/ggml/src/ggml-kompute/ggml-kompute.cpp +0 -2251
package/src/llama.cpp/ggml/src/ggml-metal/CMakeLists.txt +0 -120
package/src/llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h +0 -622
package/src/llama.cpp/ggml/src/ggml-musa/CMakeLists.txt +0 -113
package/src/llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt +0 -96
package/src/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp +0 -5124
package/src/llama.cpp/ggml/src/ggml-opt.cpp +0 -1037
package/src/llama.cpp/ggml/src/ggml-quants.c +0 -5232
package/src/llama.cpp/ggml/src/ggml-quants.h +0 -100
package/src/llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt +0 -9
package/src/llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp +0 -1813
package/src/llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt +0 -189
package/src/llama.cpp/ggml/src/ggml-sycl/backend.hpp +0 -37
package/src/llama.cpp/ggml/src/ggml-sycl/binbcast.cpp +0 -239
package/src/llama.cpp/ggml/src/ggml-sycl/binbcast.hpp +0 -39
package/src/llama.cpp/ggml/src/ggml-sycl/common.cpp +0 -83
package/src/llama.cpp/ggml/src/ggml-sycl/common.hpp +0 -493
package/src/llama.cpp/ggml/src/ggml-sycl/concat.cpp +0 -197
package/src/llama.cpp/ggml/src/ggml-sycl/concat.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/conv.cpp +0 -100
package/src/llama.cpp/ggml/src/ggml-sycl/conv.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/convert.cpp +0 -623
package/src/llama.cpp/ggml/src/ggml-sycl/convert.hpp +0 -34
package/src/llama.cpp/ggml/src/ggml-sycl/cpy.cpp +0 -701
package/src/llama.cpp/ggml/src/ggml-sycl/cpy.hpp +0 -11
package/src/llama.cpp/ggml/src/ggml-sycl/dequantize.hpp +0 -791
package/src/llama.cpp/ggml/src/ggml-sycl/dmmv.cpp +0 -1160
package/src/llama.cpp/ggml/src/ggml-sycl/dmmv.hpp +0 -27
package/src/llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp +0 -2957
package/src/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp +0 -1536
package/src/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp +0 -75
package/src/llama.cpp/ggml/src/ggml-sycl/gemm.hpp +0 -99
package/src/llama.cpp/ggml/src/ggml-sycl/getrows.cpp +0 -311
package/src/llama.cpp/ggml/src/ggml-sycl/getrows.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp +0 -4443
package/src/llama.cpp/ggml/src/ggml-sycl/gla.cpp +0 -105
package/src/llama.cpp/ggml/src/ggml-sycl/gla.hpp +0 -8
package/src/llama.cpp/ggml/src/ggml-sycl/im2col.cpp +0 -136
package/src/llama.cpp/ggml/src/ggml-sycl/im2col.hpp +0 -21
package/src/llama.cpp/ggml/src/ggml-sycl/mmq.cpp +0 -3030
package/src/llama.cpp/ggml/src/ggml-sycl/mmq.hpp +0 -33
package/src/llama.cpp/ggml/src/ggml-sycl/mmvq.cpp +0 -1108
package/src/llama.cpp/ggml/src/ggml-sycl/mmvq.hpp +0 -27
package/src/llama.cpp/ggml/src/ggml-sycl/norm.cpp +0 -474
package/src/llama.cpp/ggml/src/ggml-sycl/norm.hpp +0 -26
package/src/llama.cpp/ggml/src/ggml-sycl/outprod.cpp +0 -46
package/src/llama.cpp/ggml/src/ggml-sycl/outprod.hpp +0 -10
package/src/llama.cpp/ggml/src/ggml-sycl/presets.hpp +0 -74
package/src/llama.cpp/ggml/src/ggml-sycl/quants.hpp +0 -83
package/src/llama.cpp/ggml/src/ggml-sycl/rope.cpp +0 -362
package/src/llama.cpp/ggml/src/ggml-sycl/rope.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/softmax.cpp +0 -264
package/src/llama.cpp/ggml/src/ggml-sycl/softmax.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp +0 -13
package/src/llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp +0 -23
package/src/llama.cpp/ggml/src/ggml-sycl/tsembd.cpp +0 -73
package/src/llama.cpp/ggml/src/ggml-sycl/tsembd.hpp +0 -20
package/src/llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp +0 -1215
package/src/llama.cpp/ggml/src/ggml-sycl/wkv.cpp +0 -305
package/src/llama.cpp/ggml/src/ggml-sycl/wkv.hpp +0 -10
package/src/llama.cpp/ggml/src/ggml-threading.cpp +0 -12
package/src/llama.cpp/ggml/src/ggml-threading.h +0 -14
package/src/llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt +0 -196
package/src/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp +0 -10699
package/src/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt +0 -39
package/src/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp +0 -751
package/src/llama.cpp/ggml/src/ggml.c +0 -6550
package/src/llama.cpp/ggml/src/gguf.cpp +0 -1330
package/src/llama.cpp/models/.editorconfig +0 -1
package/src/llama.cpp/models/ggml-vocab-aquila.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-baichuan.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-bert-bge.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-bert-bge.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-bert-bge.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-chameleon.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-chameleon.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-command-r.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-command-r.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-command-r.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-deepseek-coder.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-deepseek-coder.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-deepseek-coder.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-deepseek-llm.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-deepseek-llm.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-deepseek-llm.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-deepseek-r1-qwen.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-deepseek-r1-qwen.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-falcon.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-falcon.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-falcon.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-gpt-2.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-gpt-2.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-gpt-2.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-gpt-4o.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-gpt-4o.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-gpt-neox.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-llama-bpe.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-llama-bpe.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-llama-bpe.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-llama-spm.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-llama-spm.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-llama-spm.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-llama4.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-llama4.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-mpt.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-mpt.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-mpt.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-phi-3.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-phi-3.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-phi-3.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-pixtral.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-pixtral.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-qwen2.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-qwen2.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-qwen2.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-refact.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-refact.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-refact.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-roberta-bpe.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-roberta-bpe.gguf.out +0 -46
package/src/llama.cpp/models/ggml-vocab-starcoder.gguf +0 -0
package/src/llama.cpp/models/ggml-vocab-starcoder.gguf.inp +0 -112
package/src/llama.cpp/models/ggml-vocab-starcoder.gguf.out +0 -46
package/src/llama.cpp/pocs/CMakeLists.txt +0 -14
package/src/llama.cpp/pocs/vdot/CMakeLists.txt +0 -9
package/src/llama.cpp/pocs/vdot/q8dot.cpp +0 -173
package/src/llama.cpp/pocs/vdot/vdot.cpp +0 -311
package/src/llama.cpp/prompts/LLM-questions.txt +0 -49
package/src/llama.cpp/prompts/alpaca.txt +0 -1
package/src/llama.cpp/prompts/assistant.txt +0 -31
package/src/llama.cpp/prompts/chat-with-baichuan.txt +0 -4
package/src/llama.cpp/prompts/chat-with-bob.txt +0 -7
package/src/llama.cpp/prompts/chat-with-qwen.txt +0 -1
package/src/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -7
package/src/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -7
package/src/llama.cpp/prompts/chat.txt +0 -28
package/src/llama.cpp/prompts/dan-modified.txt +0 -1
package/src/llama.cpp/prompts/dan.txt +0 -1
package/src/llama.cpp/prompts/mnemonics.txt +0 -93
package/src/llama.cpp/prompts/parallel-questions.txt +0 -43
package/src/llama.cpp/prompts/reason-act.txt +0 -18
package/src/llama.cpp/requirements/requirements-all.txt +0 -15
package/src/llama.cpp/requirements/requirements-compare-llama-bench.txt +0 -2
package/src/llama.cpp/requirements/requirements-convert_hf_to_gguf.txt +0 -7
package/src/llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt +0 -7
package/src/llama.cpp/requirements/requirements-convert_legacy_llama.txt +0 -5
package/src/llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt +0 -1
package/src/llama.cpp/requirements/requirements-convert_lora_to_gguf.txt +0 -4
package/src/llama.cpp/requirements/requirements-gguf_editor_gui.txt +0 -3
package/src/llama.cpp/requirements/requirements-pydantic.txt +0 -3
package/src/llama.cpp/requirements/requirements-test-tokenizer-random.txt +0 -1
package/src/llama.cpp/requirements/requirements-tool_bench.txt +0 -12
package/src/llama.cpp/requirements.txt +0 -13
package/src/llama.cpp/scripts/build-info.sh +0 -30
package/src/llama.cpp/scripts/install-oneapi.bat +0 -19
package/src/llama.cpp/scripts/xxd.cmake +0 -16
package/src/llama.cpp/tests/CMakeLists.txt +0 -177
package/src/llama.cpp/tests/get-model.cpp +0 -21
package/src/llama.cpp/tests/get-model.h +0 -2
package/src/llama.cpp/tests/test-arg-parser.cpp +0 -178
package/src/llama.cpp/tests/test-autorelease.cpp +0 -24
package/src/llama.cpp/tests/test-backend-ops.cpp +0 -4793
package/src/llama.cpp/tests/test-barrier.cpp +0 -94
package/src/llama.cpp/tests/test-c.c +0 -7
package/src/llama.cpp/tests/test-chat-template.cpp +0 -417
package/src/llama.cpp/tests/test-chat.cpp +0 -985
package/src/llama.cpp/tests/test-double-float.cpp +0 -57
package/src/llama.cpp/tests/test-gbnf-validator.cpp +0 -109
package/src/llama.cpp/tests/test-gguf.cpp +0 -1338
package/src/llama.cpp/tests/test-grammar-integration.cpp +0 -1308
package/src/llama.cpp/tests/test-grammar-llguidance.cpp +0 -1201
package/src/llama.cpp/tests/test-grammar-parser.cpp +0 -519
package/src/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -1304
package/src/llama.cpp/tests/test-llama-grammar.cpp +0 -408
package/src/llama.cpp/tests/test-log.cpp +0 -39
package/src/llama.cpp/tests/test-model-load-cancel.cpp +0 -27
package/src/llama.cpp/tests/test-mtmd-c-api.c +0 -63
package/src/llama.cpp/tests/test-opt.cpp +0 -904
package/src/llama.cpp/tests/test-quantize-fns.cpp +0 -186
package/src/llama.cpp/tests/test-quantize-perf.cpp +0 -365
package/src/llama.cpp/tests/test-quantize-stats.cpp +0 -424
package/src/llama.cpp/tests/test-regex-partial.cpp +0 -288
package/src/llama.cpp/tests/test-rope.cpp +0 -262
package/src/llama.cpp/tests/test-sampling.cpp +0 -399
package/src/llama.cpp/tests/test-tokenizer-0.cpp +0 -312
package/src/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -155
package/src/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -125
package/src/llama.cpp/tools/CMakeLists.txt +0 -39
package/src/llama.cpp/tools/batched-bench/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/batched-bench/batched-bench.cpp +0 -204
package/src/llama.cpp/tools/cvector-generator/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/cvector-generator/completions.txt +0 -582
package/src/llama.cpp/tools/cvector-generator/cvector-generator.cpp +0 -508
package/src/llama.cpp/tools/cvector-generator/mean.hpp +0 -48
package/src/llama.cpp/tools/cvector-generator/negative.txt +0 -4
package/src/llama.cpp/tools/cvector-generator/pca.hpp +0 -315
package/src/llama.cpp/tools/cvector-generator/positive.txt +0 -4
package/src/llama.cpp/tools/export-lora/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/export-lora/export-lora.cpp +0 -434
package/src/llama.cpp/tools/gguf-split/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/gguf-split/gguf-split.cpp +0 -583
package/src/llama.cpp/tools/imatrix/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/imatrix/imatrix.cpp +0 -667
package/src/llama.cpp/tools/llama-bench/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/llama-bench/llama-bench.cpp +0 -2024
package/src/llama.cpp/tools/main/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/main/main.cpp +0 -977
package/src/llama.cpp/tools/mtmd/CMakeLists.txt +0 -58
package/src/llama.cpp/tools/mtmd/clip-impl.h +0 -462
package/src/llama.cpp/tools/mtmd/clip.cpp +0 -4024
package/src/llama.cpp/tools/mtmd/clip.h +0 -101
package/src/llama.cpp/tools/mtmd/deprecation-warning.cpp +0 -22
package/src/llama.cpp/tools/mtmd/miniaudio.h +0 -93468
package/src/llama.cpp/tools/mtmd/mtmd-audio.cpp +0 -855
package/src/llama.cpp/tools/mtmd/mtmd-audio.h +0 -62
package/src/llama.cpp/tools/mtmd/mtmd-cli.cpp +0 -377
package/src/llama.cpp/tools/mtmd/mtmd-helper.cpp +0 -297
package/src/llama.cpp/tools/mtmd/mtmd.cpp +0 -942
package/src/llama.cpp/tools/mtmd/mtmd.h +0 -362
package/src/llama.cpp/tools/mtmd/requirements.txt +0 -5
package/src/llama.cpp/tools/perplexity/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/perplexity/perplexity.cpp +0 -2063
package/src/llama.cpp/tools/quantize/CMakeLists.txt +0 -6
package/src/llama.cpp/tools/quantize/quantize.cpp +0 -519
package/src/llama.cpp/tools/rpc/CMakeLists.txt +0 -4
package/src/llama.cpp/tools/rpc/rpc-server.cpp +0 -322
package/src/llama.cpp/tools/run/CMakeLists.txt +0 -16
package/src/llama.cpp/tools/run/linenoise.cpp/linenoise.cpp +0 -1995
package/src/llama.cpp/tools/run/linenoise.cpp/linenoise.h +0 -137
package/src/llama.cpp/tools/run/run.cpp +0 -1261
package/src/llama.cpp/tools/server/CMakeLists.txt +0 -51
package/src/llama.cpp/tools/server/bench/requirements.txt +0 -2
package/src/llama.cpp/tools/server/httplib.h +0 -10506
package/src/llama.cpp/tools/server/server.cpp +0 -4966
package/src/llama.cpp/tools/server/tests/requirements.txt +0 -8
package/src/llama.cpp/tools/server/utils.hpp +0 -1337
package/src/llama.cpp/tools/tokenize/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/tokenize/tokenize.cpp +0 -416
package/src/llama.cpp/tools/tts/CMakeLists.txt +0 -5
package/src/llama.cpp/tools/tts/tts.cpp +0 -1092

package/src/llama.cpp/ggml/src/ggml-backend-impl.h DELETED Viewed

@@ -1,255 +0,0 @@
-#pragma once
-// ggml-backend internal header
-#include "ggml-backend.h"
-#ifdef  __cplusplus
-extern "C" {
-#endif
-    #define GGML_BACKEND_API_VERSION 1
-    //
-    // Backend buffer type
-    //
-    struct ggml_backend_buffer_type_i {
-        const char *          (*get_name)      (ggml_backend_buffer_type_t buft);
-        // allocate a buffer of this type
-        ggml_backend_buffer_t (*alloc_buffer)  (ggml_backend_buffer_type_t buft, size_t size);
-        // tensor alignment
-        size_t                (*get_alignment) (ggml_backend_buffer_type_t buft);
-        // (optional) max buffer size that can be allocated (defaults to SIZE_MAX)
-        size_t                (*get_max_size)  (ggml_backend_buffer_type_t buft);
-        // (optional) data size needed to allocate the tensor, including padding (defaults to ggml_nbytes)
-        size_t                (*get_alloc_size)(ggml_backend_buffer_type_t buft, const struct ggml_tensor * tensor);
-        // (optional) check if tensor data is in host memory and uses standard ggml tensor layout (defaults to false)
-        bool                  (*is_host)       (ggml_backend_buffer_type_t buft);
-    };
-    struct ggml_backend_buffer_type {
-        struct ggml_backend_buffer_type_i  iface;
-        ggml_backend_dev_t device;
-        void * context;
-    };
-    //
-    // Backend buffer
-    //
-    struct ggml_backend_buffer_i {
-        // (optional) free the buffer
-        void         (*free_buffer)  (ggml_backend_buffer_t buffer);
-        // base address of the buffer
-        void *       (*get_base)     (ggml_backend_buffer_t buffer);
-        // (optional) initialize a tensor in the buffer (eg. add tensor extras)
-        enum ggml_status (*init_tensor)(ggml_backend_buffer_t buffer, struct ggml_tensor * tensor);
-        // tensor data access
-        void         (*memset_tensor)(ggml_backend_buffer_t buffer,       struct ggml_tensor * tensor,     uint8_t value, size_t offset, size_t size);
-        void         (*set_tensor)   (ggml_backend_buffer_t buffer,       struct ggml_tensor * tensor, const void * data, size_t offset, size_t size);
-        void         (*get_tensor)   (ggml_backend_buffer_t buffer, const struct ggml_tensor * tensor,       void * data, size_t offset, size_t size);
-        // (optional) tensor copy: dst is in the buffer, src may be in any buffer, including buffers from a different backend (return false if not supported)
-        bool         (*cpy_tensor)   (ggml_backend_buffer_t buffer, const struct ggml_tensor * src, struct ggml_tensor * dst);
-        // clear the entire buffer
-        void         (*clear)        (ggml_backend_buffer_t buffer, uint8_t value);
-        // (optional) reset any internal state due to tensor initialization, such as tensor extras
-        void         (*reset)        (ggml_backend_buffer_t buffer);
-    };
-    struct ggml_backend_buffer {
-        struct ggml_backend_buffer_i  iface;
-        ggml_backend_buffer_type_t    buft;
-        void * context;
-        size_t size;
-        enum ggml_backend_buffer_usage usage;
-    };
-    GGML_API ggml_backend_buffer_t ggml_backend_buffer_init(
-                   ggml_backend_buffer_type_t buft,
-            struct ggml_backend_buffer_i      iface,
-                   void *                     context,
-                   size_t                     size);
-    // do not use directly, use ggml_backend_tensor_copy instead
-    GGML_API bool ggml_backend_buffer_copy_tensor(const struct ggml_tensor * src, struct ggml_tensor * dst);
-    // multi-buffer
-    // buffer that contains a collection of buffers
-    GGML_API ggml_backend_buffer_t ggml_backend_multi_buffer_alloc_buffer(ggml_backend_buffer_t * buffers, size_t n_buffers);
-    GGML_API bool                  ggml_backend_buffer_is_multi_buffer(ggml_backend_buffer_t buffer);
-    GGML_API void                  ggml_backend_multi_buffer_set_usage(ggml_backend_buffer_t buffer, enum ggml_backend_buffer_usage usage);
-    //
-    // Backend (stream)
-    //
-    struct ggml_backend_i {
-        const char * (*get_name)(ggml_backend_t backend);
-        void (*free)(ggml_backend_t backend);
-        // (optional) asynchronous tensor data access
-        void (*set_tensor_async)(ggml_backend_t backend,       struct ggml_tensor * tensor, const void * data, size_t offset, size_t size);
-        void (*get_tensor_async)(ggml_backend_t backend, const struct ggml_tensor * tensor,       void * data, size_t offset, size_t size);
-        bool (*cpy_tensor_async)(ggml_backend_t backend_src, ggml_backend_t backend_dst, const struct ggml_tensor * src, struct ggml_tensor * dst);
-        // (optional) complete all pending operations (required if the backend supports async operations)
-        void (*synchronize)(ggml_backend_t backend);
-        // (optional) graph plans (not used currently)
-        // compute graph with a plan
-        ggml_backend_graph_plan_t (*graph_plan_create) (ggml_backend_t backend, const struct ggml_cgraph * cgraph);
-        void                      (*graph_plan_free)   (ggml_backend_t backend, ggml_backend_graph_plan_t plan);
-        // update the plan with a new graph - this should be faster than creating a new plan when the graph has the same topology
-        void                      (*graph_plan_update) (ggml_backend_t backend, ggml_backend_graph_plan_t plan, const struct ggml_cgraph * cgraph);
-        // compute the graph with the plan
-        enum ggml_status          (*graph_plan_compute)(ggml_backend_t backend, ggml_backend_graph_plan_t plan);
-        // compute graph (always async if supported by the backend)
-        enum ggml_status          (*graph_compute)     (ggml_backend_t backend, struct ggml_cgraph * cgraph);
-        // (optional) event synchronization
-        // record an event on this stream
-        void (*event_record)(ggml_backend_t backend, ggml_backend_event_t event);
-        // wait for an event on on a different stream
-        void (*event_wait)  (ggml_backend_t backend, ggml_backend_event_t event);
-    };
-    struct ggml_backend {
-        ggml_guid_t guid;
-        struct ggml_backend_i iface;
-        ggml_backend_dev_t device;
-        void * context;
-    };
-    struct ggml_backend_event {
-        struct ggml_backend_device * device;
-        void * context;
-    };
-    //
-    // Backend device
-    //
-    // Note: if additional properties are needed, we should add a struct with all of them
-    //       the current functions to obtain the properties can remain, since they are more convenient for often used properties
-    struct ggml_backend_device_i {
-        // device name: short identifier for this device, such as "CPU" or "CUDA0"
-        const char * (*get_name)(ggml_backend_dev_t dev);
-        // device description: short informative description of the device, could be the model name
-        const char * (*get_description)(ggml_backend_dev_t dev);
-        // device memory in bytes
-        void         (*get_memory)(ggml_backend_dev_t dev, size_t * free, size_t * total);
-        // device type
-        enum ggml_backend_dev_type (*get_type)(ggml_backend_dev_t dev);
-        // device properties
-        void (*get_props)(ggml_backend_dev_t dev, struct ggml_backend_dev_props * props);
-        // backend (stream) initialization
-        ggml_backend_t (*init_backend)(ggml_backend_dev_t dev, const char * params);
-        // preferred buffer type
-        ggml_backend_buffer_type_t (*get_buffer_type)(ggml_backend_dev_t dev);
-        // (optional) host buffer type (in system memory, typically this is a pinned memory buffer for faster transfers between host and device)
-        ggml_backend_buffer_type_t (*get_host_buffer_type)(ggml_backend_dev_t dev);
-        // (optional) buffer from pointer: create a buffer from a host pointer (useful for memory mapped models and importing data from other libraries)
-        ggml_backend_buffer_t (*buffer_from_host_ptr)(ggml_backend_dev_t dev, void * ptr, size_t size, size_t max_tensor_size);
-        // check if the backend can compute an operation
-        bool (*supports_op)(ggml_backend_dev_t dev, const struct ggml_tensor * op);
-        // check if the backend can use tensors allocated in a buffer type
-        bool (*supports_buft)(ggml_backend_dev_t dev, ggml_backend_buffer_type_t buft);
-        // (optional) check if the backend wants to run an operation, even if the weights are allocated in an incompatible buffer
-        // these should be expensive operations that may benefit from running on this backend instead of the CPU backend
-        bool (*offload_op)(ggml_backend_dev_t dev, const struct ggml_tensor * op);
-        // (optional) event synchronization
-        ggml_backend_event_t (*event_new)         (ggml_backend_dev_t dev);
-        void                 (*event_free)        (ggml_backend_dev_t dev, ggml_backend_event_t event);
-        void                 (*event_synchronize) (ggml_backend_dev_t dev, ggml_backend_event_t event);
-    };
-    struct ggml_backend_device {
-        struct ggml_backend_device_i iface;
-        ggml_backend_reg_t reg;
-        void * context;
-    };
-    //
-    // Backend (reg)
-    //
-    struct ggml_backend_reg_i {
-        const char * (*get_name)(ggml_backend_reg_t reg);
-        // enumerate available devices
-        size_t             (*get_device_count)(ggml_backend_reg_t reg);
-        ggml_backend_dev_t (*get_device)(ggml_backend_reg_t reg, size_t index);
-        // (optional) get a pointer to a function in the backend
-        // backends can add custom functions that are not part of the standard ggml-backend interface
-        void * (*get_proc_address)(ggml_backend_reg_t reg, const char * name);
-    };
-    struct ggml_backend_reg {
-        int api_version; // initialize to GGML_BACKEND_API_VERSION
-        struct ggml_backend_reg_i iface;
-        void * context;
-    };
-    // Internal backend registry API
-    GGML_API void ggml_backend_register(ggml_backend_reg_t reg);
-    // Add backend dynamic loading support to the backend
-    // Initialize the backend
-    typedef ggml_backend_reg_t (*ggml_backend_init_t)(void);
-    // Optional: obtain a score for the backend based on the system configuration
-    // Higher scores are preferred, 0 means the backend is not supported in the current system
-    typedef int                (*ggml_backend_score_t)(void);
-#ifdef GGML_BACKEND_DL
-#    ifdef __cplusplus
-#        define GGML_BACKEND_DL_IMPL(reg_fn)                             \
-            extern "C" {                                                 \
-            GGML_BACKEND_API ggml_backend_reg_t ggml_backend_init(void); \
-            }                                                            \
-            ggml_backend_reg_t ggml_backend_init(void) {                 \
-                return reg_fn();                                         \
-            }
-#        define GGML_BACKEND_DL_SCORE_IMPL(score_fn)       \
-            extern "C" {                                   \
-            GGML_BACKEND_API int ggml_backend_score(void); \
-            }                                              \
-            int ggml_backend_score(void) {                 \
-                return score_fn();                         \
-            }
-#    else
-#        define GGML_BACKEND_DL_IMPL(reg_fn)                              \
-            GGML_BACKEND_API ggml_backend_reg_t ggml_backend_init(void);  \
-            ggml_backend_reg_t                  ggml_backend_init(void) { \
-                return reg_fn();                                          \
-            }
-#        define GGML_BACKEND_DL_SCORE_IMPL(score_fn)        \
-            GGML_BACKEND_API int ggml_backend_score(void);  \
-            int                  ggml_backend_score(void) { \
-                return score_fn();                          \
-            }
-#    endif
-#else
-#    define GGML_BACKEND_DL_IMPL(reg_fn)
-#    define GGML_BACKEND_DL_SCORE_IMPL(score_fn)
-#endif
-#ifdef  __cplusplus
-}
-#endif