llama-cpp-python 0.2.53__tar.gz → 0.2.54__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- llama_cpp_python-0.2.54/.git/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.54/.git/HEAD +1 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/config +1 -1
- llama_cpp_python-0.2.54/.git/index +0 -0
- llama_cpp_python-0.2.54/.git/logs/HEAD +1 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/HEAD +1 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/config +1 -1
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/config +1 -1
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +2 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +1 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.idx → llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.idx +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.pack → llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.pack +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.rev → llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.rev +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/4e/25511d01db635da1739c66e6c5551adccf8ebc +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/54/01e197f67d7e05c4ea5460287555c6722298d6 +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/60/7fe49d3ff151e661f52f83363b8f137d605995 +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/ad/35306c60c4e6ab83f1d6e1fb0cd94f05231f6b +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/c2/224f003bf9cf558b1a3c57033563e11a4de9a5 +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/ea/0610dbdc12d3c1527584fe710b172def2a22b2 +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/ec/711ee993236600dbf9b2d5c72692eac9425255 +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/pack/pack-1490421c864662f09473b15fde42fa3d90801bd4.idx +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/objects/pack/pack-2d74f02a59f1943182604fe1cb36111024efff36.pack → llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/pack/pack-1490421c864662f09473b15fde42fa3d90801bd4.pack +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/objects/pack/pack-1490421c864662f09473b15fde42fa3d90801bd4.rev +0 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/packed-refs +2 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
- llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/shallow +2 -0
- llama_cpp_python-0.2.54/.git/objects/pack/pack-2f0cfa1ecc73c12b9a6897e7c351b84eb55c7590.idx +0 -0
- llama_cpp_python-0.2.53/.git/objects/pack/pack-61676b95c7210237f5ac382e586f3f1575687cf6.pack → llama_cpp_python-0.2.54/.git/objects/pack/pack-2f0cfa1ecc73c12b9a6897e7c351b84eb55c7590.pack +0 -0
- llama_cpp_python-0.2.54/.git/objects/pack/pack-2f0cfa1ecc73c12b9a6897e7c351b84eb55c7590.rev +0 -0
- llama_cpp_python-0.2.54/.git/refs/tags/v0.2.54 +1 -0
- llama_cpp_python-0.2.54/.git/shallow +1 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/CHANGELOG.md +5 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/PKG-INFO +12 -3
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/README.md +11 -2
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/__init__.py +1 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/_internals.py +1 -21
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama.py +3 -5
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_cpp.py +5 -178
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/app.py +26 -24
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/errors.py +2 -2
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/model.py +11 -8
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/settings.py +6 -6
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/types.py +1 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/build.yml +22 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/README.md +1 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ci/run.sh +18 -18
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/build-info.cpp +1 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/common.cpp +1 -3
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/common.h +0 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/convert-hf-to-gguf.py +3 -4
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +6 -12
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama-bench/README.md +0 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +3 -27
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/README.md +1 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/server.cpp +249 -291
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/parallel.feature +22 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/steps/steps.py +26 -2
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/utils.hpp +122 -64
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-backend-impl.h +2 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-backend.c +14 -2
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-backend.h +1 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-cuda.cu +27 -8
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-kompute.cpp +7 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-metal.m +7 -1
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-metal.metal +30 -28
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-quants.c +125 -23
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-quants.h +5 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-sycl.cpp +51 -64
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-vulkan.cpp +31 -17
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml.c +52 -21
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml.h +10 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/llama.cpp +49 -187
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/llama.h +1 -47
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/compare-llama-bench.py +1 -1
- llama_cpp_python-0.2.54/vendor/llama.cpp/scripts/sync-ggml.last +1 -0
- llama_cpp_python-0.2.54/vendor/llama.cpp/unicode.h +784 -0
- llama_cpp_python-0.2.53/.git/FETCH_HEAD +0 -1
- llama_cpp_python-0.2.53/.git/HEAD +0 -1
- llama_cpp_python-0.2.53/.git/index +0 -0
- llama_cpp_python-0.2.53/.git/logs/HEAD +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/HEAD +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +0 -2
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/objects/pack/pack-2d74f02a59f1943182604fe1cb36111024efff36.idx +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/objects/pack/pack-2d74f02a59f1943182604fe1cb36111024efff36.rev +0 -0
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/packed-refs +0 -2
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/refs/tags/b2282 +0 -1
- llama_cpp_python-0.2.53/.git/modules/vendor/llama.cpp/shallow +0 -1
- llama_cpp_python-0.2.53/.git/objects/pack/pack-61676b95c7210237f5ac382e586f3f1575687cf6.idx +0 -0
- llama_cpp_python-0.2.53/.git/objects/pack/pack-61676b95c7210237f5ac382e586f3f1575687cf6.rev +0 -0
- llama_cpp_python-0.2.53/.git/refs/tags/v0.2.53 +0 -1
- llama_cpp_python-0.2.53/.git/shallow +0 -1
- llama_cpp_python-0.2.53/vendor/llama.cpp/awq-py/README.md +0 -116
- llama_cpp_python-0.2.53/vendor/llama.cpp/awq-py/awq/apply_awq.py +0 -254
- llama_cpp_python-0.2.53/vendor/llama.cpp/awq-py/requirements.txt +0 -2
- llama_cpp_python-0.2.53/vendor/llama.cpp/scripts/sync-ggml.last +0 -1
- llama_cpp_python-0.2.53/vendor/llama.cpp/unicode.h +0 -476
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.dockerignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/description +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/info/exclude +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/description +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/FETCH_HEAD +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/HEAD +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/description +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/info/exclude +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/objects/0c/588e19be7b9726e5ae8dae3569dea0fd990af1 +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/objects/19/17e497d955de87fc0a472e21cf8fbf31112adf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/objects/30/3b5ceb11c6e3878c575cd53d863e5edcbc4550 +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/objects/45/65194ed7c32d1d2efa32ceab4d3c6cae006306 +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/packed-refs +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/refs/heads/master +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/modules/kompute/shallow +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/dependabot.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/build-and-release.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/build-docker.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/publish-to-test.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/publish.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/test-pypi.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.github/workflows/test.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.gitmodules +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/.readthedocs.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/LICENSE.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/cuda_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/open_llama/Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/open_llama/build.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/open_llama/hug_model.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/open_llama/start.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/open_llama/start_server.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/openblas_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docker/simple/run.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/api-reference.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/changelog.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/index.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/install/macos.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/requirements.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/docs/server.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/gradio_chat/local.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/gradio_chat/server.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/hf_pull/main.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/high_level_api/fastapi_server.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/high_level_api/high_level_api_embedding.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/high_level_api/high_level_api_inference.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/high_level_api/high_level_api_streaming.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/high_level_api/langchain_custom_llm.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/Chat.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/Miku.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/ReasonAct.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/common.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/quantize.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/readme/low_level_api_llama_cpp.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/low_level_api/util.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/Batching.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/Clients.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/Functions.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/Guidance.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/Multimodal.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/OpenHermesFunctionCalling.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/examples/notebooks/PerformanceTuning.ipynb +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/_logger.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/_utils.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_cache.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_grammar.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_speculative.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_tokenizer.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llama_types.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/llava_cpp.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/py.typed +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/__init__.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/__main__.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/llama_cpp/server/cli.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/mkdocs.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/pyproject.toml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/tests/test_llama.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/tests/test_llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/tests/test_llama_grammar.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/tests/test_llama_speculative.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.clang-tidy +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/main-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/main-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/apps.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/devshells.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/docker.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/jetson-support.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/nixpkgs-instances.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/package.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/scope.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/nix/sif.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/server-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/server-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/server-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/server-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/server.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.devops/tools.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.dockerignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.ecrc +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.editorconfig +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.flake8 +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.git +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/nix-ci-aarch64.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/nix-ci.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/nix-flake-update.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/nix-publish-flake.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/python-check-requirements.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/python-lint.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/server.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/tidy-post.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/tidy-review.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.gitmodules +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/LICENSE +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/Package.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/README-sycl.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/build.zig +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ci/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/codecov.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/console.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/grammar-parser.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/log.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/stb_image.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/train.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/common/train.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/convert.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/docs/BLIS.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/docs/llama-star/idea-arch.key +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/docs/llama-star/idea-arch.pdf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/Miku.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/alpaca.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/base-translate.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/chat.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/embedding/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/finetune/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/finetune/finetune.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/imatrix/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/imatrix/imatrix.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/infill/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/json-schema-to-grammar.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Downloadable.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Llm.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainActivity.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainViewModel.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Color.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Theme.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Type.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_background.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_foreground.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher_round.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/themes.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/backup_rules.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/data_extraction_rules.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.jar +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/gradle.properties +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/gradlew +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.android/settings.gradle.kts +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/AppIcon.appiconset/Contents.json +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/Contents.json +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Models/LlamaState.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/ContentView.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/DownloadButton.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/InputButton.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/LoadCustomButton.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/llama_swiftuiApp.swift +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.pbxproj +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/contents.xcworkspacedata +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama.vim +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llama2.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/MobileVLM-README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/android/adb_run.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/android/build_64.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/clip.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/clip.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/llava-cli.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/llava-surgery-v2.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/llava.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/llava.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llava/requirements.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/llm.vim +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookahead/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookup/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main/main.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/make-ggml.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/parallel/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/passkey/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/pydantic-models-to-grammar-examples.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/pydantic_models_to_grammar.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/quantize/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/reason-act.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/api_like_OAI.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/chat.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/completion.js.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/deps.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/httplib.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/index.html.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/index.js.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/json-schema-to-grammar.mjs.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/json.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/oai.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/public/index.html +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/public/index.js +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/environment.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/issues.feature +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/security.feature +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/server.feature +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/features/wrong_usages.feature +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/requirements.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server/tests/tests.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/simple/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/speculative/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/build.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/run-llama2.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/win-build-sycl.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/sycl/win-run-llama2.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/tokenize/tokenize.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/flake.lock +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/flake.nix +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-alloc.c +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-cuda.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-impl.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-kompute.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-metal.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-mpi.c +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-mpi.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-opencl.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-sycl.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-vulkan-shaders.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml-vulkan.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/ggml_vk_generate_shaders.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/examples/reader.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/examples/writer.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/constants.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/gguf_reader.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/gguf_writer.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/tensor_mapping.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/gguf/vocab.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/pyproject.toml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/scripts/__init__.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/scripts/gguf-dump.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/scripts/gguf-set-metadata.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/c.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/json.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/grammars/list.gbnf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.ccls +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.clang-format +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.dockerignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.git +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.github/workflows/cpp_examples.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.github/workflows/cpp_tests.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.github/workflows/python_tests.yml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/CHANGELOG.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/CNAME +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/CODE_OF_CONDUCT.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/CONTRIBUTING.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/GOVERNANCE.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/LICENSE +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/MANIFEST.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/SECURITY.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/VERSION +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/bin2h.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/bin_file_to_header.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/check_vulkan_version.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/code_coverage.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/deprecation_warnings.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/komputeConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/cmake/vulkan_shader_compiler.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/config/FindSphinx.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docker-builders/KomputeBuilder.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docker-builders/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docker-builders/Swiftshader.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docker-builders/VulkanSDK.Dockerfile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/Doxyfile.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/Makefile +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/assets/custom.css +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/assets/gcov.css +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/conf.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/genindex.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/android-editor.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/android-kompute.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/binder-cpp.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/binder-python.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-architecture.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-cpp-video.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-python-video.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-algorithm.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-manager.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opcreatetensor.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-operations.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opmult.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-sequence.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-tensor.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/kompute.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/komputer-godot-4.gif +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/komputer-logos.gif +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/logistic-regression.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/queue-allocation.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/images/suspicious.jfif +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/index.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/make.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/advanced-examples.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/async-parallel.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/build-system.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/ci-tests.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/community.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/convolutional-net.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/custom-operations.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/game-engine-godot.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/matmul-benchmark.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/memory-management.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/mobile-android.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/python-examples.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/python-package.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/python-reference.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/raspberry-pi.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/reference.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/shaders-to-headers.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/docs/overview/variable-types.rst +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/build.gradle +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/kompute.jpg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeJniNative.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/java/com/ethicalml/kompute/KomputeJni.kt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/layout/activity_kompute_jni.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-anydpi-v26/kompute_icon.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-hdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-mdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon_foreground.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/dimens.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/kompute_icon_background.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/styles.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values-w820dp/dimens.xml +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/build.gradle +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle.properties +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/android/android-simple/settings.gradle +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/array_multiplication/src/main.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/SCsub +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/config.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/include/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_examples/project.godot +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/SCsub +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/config.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/include/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/TextFormat.theme +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/roboto.ttf +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/project.godot +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/logistic_regression/src/main.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/import_vgg7.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/out.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/run_vgg7.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_common.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_conv.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/w2wbinit.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/pi4_mesa_build/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/benchmark.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/first_example.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp1_naive.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp2_tiled.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp3_better_tiling.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/examples/python_naive_matmul/matmul_plot.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/external/bin/xxd.c +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/kompute-config.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/pylintrc +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/README.md +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/src/docstrings.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/src/main.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/src/utils.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/__init__.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/requirements-dev.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/test_array_multiplication.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/test_kompute.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/test_logistic_regression.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/test_tensor_types.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/python/test/utils.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/scripts/build_release_linux.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/scripts/build_release_windows.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/scripts/convert_shaders.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/scripts/push_folder_to_branch.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/scripts/requirements.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/setup.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/Algorithm.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/Core.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/Manager.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpAlgoDispatch.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpBufferSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpBufferSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpMemoryBarrier.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpTensorFill.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpTensorSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/OpTensorSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/Sequence.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/Tensor.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Algorithm.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Core.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Kompute.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Manager.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Sequence.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/Tensor.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/logger/Logger.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpAlgoDispatch.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBase.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMemoryBarrier.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMult.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorCopy.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorFill.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/logger/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/logger/Logger.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.hpp.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.hpp.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/src/shaders/hlsl/computeheadless.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestAsyncOperations.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestDestroy.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestLogisticRegression.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestManager.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestMultipleAlgoExecutions.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestOpShadersFromStringAndFile.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestOpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestOpTensorCreate.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestOpTensorSync.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestPushConstant.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestSequence.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestSpecializationConstant.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestTensor.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/TestWorkgroup.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_logistic_regression.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_op_custom_shader.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_workgroup.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/Utils.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/Utils.hpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/glsl/test_logistic_regression_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/glsl/test_op_custom_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/glsl/test_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/test/shaders/glsl/test_workgroup_shader.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute/vcpkg.json.opt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/common.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_add.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_addrow.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f16.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f32.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f16.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f32.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_diagmask.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_gelu.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_getrows.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_getrows_f16.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_0.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_1.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_getrows_q6_k.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_f16.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_mat_f32.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_0.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_1.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q6_k.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q8_0.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n_pre.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_norm.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_relu.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_rmsnorm.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_rope_f16.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_rope_f32.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_scale.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_scale_8.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_silu.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/op_softmax.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/kompute-shaders/rope_common.comp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/media/llama0-banner.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/media/llama0-logo.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/media/llama1-banner.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/media/llama1-logo.png +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/mypy.ini +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/assistant.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat-with-qwen.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/chat.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/dan.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements/requirements-convert.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/requirements.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/build-info.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/check-requirements.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/ci-run.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/compare-commits.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/gen-build-info-cpp.cmake +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/get-flags.mk +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/get-hellaswag.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/get-pg.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/get-winogrande.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/hf.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/install-oneapi.bat +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/run-with-preset.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/sync-ggml-am.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/spm-headers/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/spm-headers/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/spm-headers/llama.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/.gitignore +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-0-llama.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-0-llama.py +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_python-0.2.53 → llama_cpp_python-0.2.54}/vendor/llama.cpp/tests/test-tokenizer-1-llama.cpp +0 -0
|
@@ -0,0 +1 @@
|
|
|
1
|
+
d5df431278433b580e52222dbf4174f5102585b1 'd5df431278433b580e52222dbf4174f5102585b1' of https://github.com/abetlen/llama-cpp-python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
d5df431278433b580e52222dbf4174f5102585b1
|
|
@@ -9,7 +9,7 @@
|
|
|
9
9
|
[gc]
|
|
10
10
|
auto = 0
|
|
11
11
|
[http "https://github.com/"]
|
|
12
|
-
extraheader = AUTHORIZATION: basic
|
|
12
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzdpQXRKODgxbmFTbmVlTHlEM0pqN0pCRE1mazRldzBySUlxMw==
|
|
13
13
|
[submodule "vendor/llama.cpp"]
|
|
14
14
|
active = true
|
|
15
15
|
url = https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d5df431278433b580e52222dbf4174f5102585b1 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316972 +0000 checkout: moving from master to refs/tags/v0.2.54
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
c2224f003bf9cf558b1a3c57033563e11a4de9a5 'c2224f003bf9cf558b1a3c57033563e11a4de9a5' of https://github.com/ggerganov/llama.cpp
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
c2224f003bf9cf558b1a3c57033563e11a4de9a5
|
|
@@ -16,7 +16,7 @@
|
|
|
16
16
|
[gc]
|
|
17
17
|
auto = 0
|
|
18
18
|
[http "https://github.com/"]
|
|
19
|
-
extraheader = AUTHORIZATION: basic
|
|
19
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzdpQXRKODgxbmFTbmVlTHlEM0pqN0pCRE1mazRldzBySUlxMw==
|
|
20
20
|
[url "https://github.com/"]
|
|
21
21
|
insteadOf = git@github.com:
|
|
22
22
|
insteadOf = org-6826477@github.com:
|
|
Binary file
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 38d16b142624bdd7c41d9955752b7f7b59c5e048 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316973 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
2
|
+
38d16b142624bdd7c41d9955752b7f7b59c5e048 c2224f003bf9cf558b1a3c57033563e11a4de9a5 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316974 +0000 checkout: moving from master to c2224f003bf9cf558b1a3c57033563e11a4de9a5
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 38d16b142624bdd7c41d9955752b7f7b59c5e048 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316973 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 38d16b142624bdd7c41d9955752b7f7b59c5e048 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316973 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
[gc]
|
|
14
14
|
auto = 0
|
|
15
15
|
[http "https://github.com/"]
|
|
16
|
-
extraheader = AUTHORIZATION: basic
|
|
16
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzdpQXRKODgxbmFTbmVlTHlEM0pqN0pCRE1mazRldzBySUlxMw==
|
|
17
17
|
[url "https://github.com/"]
|
|
18
18
|
insteadOf = git@github.com:
|
|
19
19
|
insteadOf = org-6826477@github.com:
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316974 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
2
|
+
d1e3b0953cf66acc94b2e29693e221427b2c1f3f 4565194ed7c32d1d2efa32ceab4d3c6cae006306 runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316975 +0000 checkout: moving from master to 4565194ed7c32d1d2efa32ceab4d3c6cae006306
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316974 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
llama_cpp_python-0.2.54/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD
ADDED
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az1240-729.ompflkn1s5uuratdiiqak2yqtf.ex.internal.cloudapp.net> 1709316974 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
38d16b142624bdd7c41d9955752b7f7b59c5e048
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
d5df431278433b580e52222dbf4174f5102585b1
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
d5df431278433b580e52222dbf4174f5102585b1
|
|
@@ -7,6 +7,11 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
7
7
|
|
|
8
8
|
## [Unreleased]
|
|
9
9
|
|
|
10
|
+
## [0.2.54]
|
|
11
|
+
|
|
12
|
+
- feat: Update llama.cpp to ggerganov/llama.cpp@cb49e0f8c906e5da49e9f6d64a57742a9a241c6a
|
|
13
|
+
- docs: fix typo in README.md embeddings example by @iamlemec in #1232
|
|
14
|
+
|
|
10
15
|
## [0.2.53]
|
|
11
16
|
|
|
12
17
|
- feat: Update llama.cpp to ggerganov/llama.cpp@cb49e0f8c906e5da49e9f6d64a57742a9a241c6a
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.1
|
|
2
2
|
Name: llama_cpp_python
|
|
3
|
-
Version: 0.2.
|
|
3
|
+
Version: 0.2.54
|
|
4
4
|
Summary: Python bindings for the llama.cpp library
|
|
5
5
|
Author-Email: Andrei Betlen <abetlen@gmail.com>
|
|
6
6
|
License: MIT
|
|
@@ -329,7 +329,16 @@ By default [`from_pretrained`](https://llama-cpp-python.readthedocs.io/en/latest
|
|
|
329
329
|
|
|
330
330
|
The high-level API also provides a simple interface for chat completion.
|
|
331
331
|
|
|
332
|
-
|
|
332
|
+
Chat completion requires that the model know how to format the messages into a single prompt.
|
|
333
|
+
The `Llama` class does this using pre-registered chat formats (ie. `chatml`, `llama-2`, `gemma`, etc) or by providing a custom chat handler object.
|
|
334
|
+
|
|
335
|
+
The model will will format the messages into a single prompt using the following order of precedence:
|
|
336
|
+
- Use the `chat_handler` if provided
|
|
337
|
+
- Use the `chat_format` if provided
|
|
338
|
+
- Use the `tokenizer.chat_template` from the `gguf` model's metadata (should work for most new models, older models may not have this)
|
|
339
|
+
- else, fallback to the `llama-2` chat format
|
|
340
|
+
|
|
341
|
+
Set `verbose=True` to see the selected chat format.
|
|
333
342
|
|
|
334
343
|
```python
|
|
335
344
|
>>> from llama_cpp import Llama
|
|
@@ -568,7 +577,7 @@ To generate text embeddings use [`create_embedding`](http://localhost:8000/api-r
|
|
|
568
577
|
```python
|
|
569
578
|
import llama_cpp
|
|
570
579
|
|
|
571
|
-
llm = llama_cpp.Llama(model_path="path/to/model.gguf",
|
|
580
|
+
llm = llama_cpp.Llama(model_path="path/to/model.gguf", embedding=True)
|
|
572
581
|
|
|
573
582
|
embeddings = llm.create_embedding("Hello, world!")
|
|
574
583
|
|
|
@@ -286,7 +286,16 @@ By default [`from_pretrained`](https://llama-cpp-python.readthedocs.io/en/latest
|
|
|
286
286
|
|
|
287
287
|
The high-level API also provides a simple interface for chat completion.
|
|
288
288
|
|
|
289
|
-
|
|
289
|
+
Chat completion requires that the model know how to format the messages into a single prompt.
|
|
290
|
+
The `Llama` class does this using pre-registered chat formats (ie. `chatml`, `llama-2`, `gemma`, etc) or by providing a custom chat handler object.
|
|
291
|
+
|
|
292
|
+
The model will will format the messages into a single prompt using the following order of precedence:
|
|
293
|
+
- Use the `chat_handler` if provided
|
|
294
|
+
- Use the `chat_format` if provided
|
|
295
|
+
- Use the `tokenizer.chat_template` from the `gguf` model's metadata (should work for most new models, older models may not have this)
|
|
296
|
+
- else, fallback to the `llama-2` chat format
|
|
297
|
+
|
|
298
|
+
Set `verbose=True` to see the selected chat format.
|
|
290
299
|
|
|
291
300
|
```python
|
|
292
301
|
>>> from llama_cpp import Llama
|
|
@@ -525,7 +534,7 @@ To generate text embeddings use [`create_embedding`](http://localhost:8000/api-r
|
|
|
525
534
|
```python
|
|
526
535
|
import llama_cpp
|
|
527
536
|
|
|
528
|
-
llm = llama_cpp.Llama(model_path="path/to/model.gguf",
|
|
537
|
+
llm = llama_cpp.Llama(model_path="path/to/model.gguf", embedding=True)
|
|
529
538
|
|
|
530
539
|
embeddings = llm.create_embedding("Hello, world!")
|
|
531
540
|
|
|
@@ -357,21 +357,6 @@ class _LlamaContext:
|
|
|
357
357
|
penalty_present,
|
|
358
358
|
)
|
|
359
359
|
|
|
360
|
-
def sample_classifier_free_guidance(
|
|
361
|
-
self,
|
|
362
|
-
candidates: "_LlamaTokenDataArray",
|
|
363
|
-
guidance_ctx: "_LlamaContext",
|
|
364
|
-
scale: float,
|
|
365
|
-
):
|
|
366
|
-
assert self.ctx is not None
|
|
367
|
-
assert guidance_ctx.ctx is not None
|
|
368
|
-
llama_cpp.llama_sample_classifier_free_guidance(
|
|
369
|
-
self.ctx,
|
|
370
|
-
llama_cpp.byref(candidates.candidates),
|
|
371
|
-
guidance_ctx.ctx,
|
|
372
|
-
scale,
|
|
373
|
-
)
|
|
374
|
-
|
|
375
360
|
def sample_softmax(self, candidates: "_LlamaTokenDataArray"):
|
|
376
361
|
assert self.ctx is not None
|
|
377
362
|
llama_cpp.llama_sample_softmax(
|
|
@@ -720,7 +705,7 @@ class _LlamaSamplingContext:
|
|
|
720
705
|
return ctx_main.model.detokenize(self.prev[-n:]).decode("utf-8")
|
|
721
706
|
|
|
722
707
|
def sample(
|
|
723
|
-
self, ctx_main: _LlamaContext,
|
|
708
|
+
self, ctx_main: _LlamaContext, idx: int = 0, logits_array: Optional[npt.NDArray[np.single]] = None
|
|
724
709
|
):
|
|
725
710
|
n_vocab = ctx_main.model.n_vocab()
|
|
726
711
|
id: int = 0
|
|
@@ -741,11 +726,6 @@ class _LlamaSamplingContext:
|
|
|
741
726
|
) # TODO: Only create this once
|
|
742
727
|
token_data_array.copy_logits(logits_array)
|
|
743
728
|
|
|
744
|
-
if ctx_cfg is not None:
|
|
745
|
-
ctx_main.sample_classifier_free_guidance(
|
|
746
|
-
token_data_array, ctx_cfg, self.params.cfg_scale
|
|
747
|
-
)
|
|
748
|
-
|
|
749
729
|
# apply penalties
|
|
750
730
|
if len(self.prev) > 0:
|
|
751
731
|
nl_token = ctx_main.model.token_nl()
|
|
@@ -86,7 +86,6 @@ class Llama:
|
|
|
86
86
|
yarn_beta_fast: float = 32.0,
|
|
87
87
|
yarn_beta_slow: float = 1.0,
|
|
88
88
|
yarn_orig_ctx: int = 0,
|
|
89
|
-
mul_mat_q: bool = True,
|
|
90
89
|
logits_all: bool = False,
|
|
91
90
|
embedding: bool = False,
|
|
92
91
|
offload_kqv: bool = True,
|
|
@@ -291,7 +290,6 @@ class Llama:
|
|
|
291
290
|
yarn_beta_slow if yarn_beta_slow != 0.0 else 0
|
|
292
291
|
)
|
|
293
292
|
self.context_params.yarn_orig_ctx = yarn_orig_ctx if yarn_orig_ctx != 0 else 0
|
|
294
|
-
self.context_params.mul_mat_q = mul_mat_q
|
|
295
293
|
self.context_params.logits_all = (
|
|
296
294
|
logits_all if draft_model is None else True
|
|
297
295
|
) # Must be set to True for speculative decoding
|
|
@@ -412,7 +410,7 @@ class Llama:
|
|
|
412
410
|
bos_token = self._model.token_get_text(bos_token_id)
|
|
413
411
|
|
|
414
412
|
if self.verbose:
|
|
415
|
-
print(f"Using chat template: {template}", file=sys.stderr)
|
|
413
|
+
print(f"Using gguf chat template: {template}", file=sys.stderr)
|
|
416
414
|
print(f"Using chat eos_token: {eos_token}", file=sys.stderr)
|
|
417
415
|
print(f"Using chat bos_token: {bos_token}", file=sys.stderr)
|
|
418
416
|
|
|
@@ -422,6 +420,8 @@ class Llama:
|
|
|
422
420
|
|
|
423
421
|
if self.chat_format is None and self.chat_handler is None:
|
|
424
422
|
self.chat_format = "llama-2"
|
|
423
|
+
if self.verbose:
|
|
424
|
+
print(f"Using fallback chat format: {chat_format}", file=sys.stderr)
|
|
425
425
|
|
|
426
426
|
@property
|
|
427
427
|
def ctx(self) -> llama_cpp.llama_context_p:
|
|
@@ -1724,7 +1724,6 @@ class Llama:
|
|
|
1724
1724
|
yarn_beta_fast=self.context_params.yarn_beta_fast,
|
|
1725
1725
|
yarn_beta_slow=self.context_params.yarn_beta_slow,
|
|
1726
1726
|
yarn_orig_ctx=self.context_params.yarn_orig_ctx,
|
|
1727
|
-
mul_mat_q=self.context_params.mul_mat_q,
|
|
1728
1727
|
logits_all=self.context_params.logits_all,
|
|
1729
1728
|
embedding=self.context_params.embedding,
|
|
1730
1729
|
# Sampling Params
|
|
@@ -1768,7 +1767,6 @@ class Llama:
|
|
|
1768
1767
|
yarn_beta_fast=state["yarn_beta_fast"],
|
|
1769
1768
|
yarn_beta_slow=state["yarn_beta_slow"],
|
|
1770
1769
|
yarn_orig_ctx=state["yarn_orig_ctx"],
|
|
1771
|
-
mul_mat_q=state["mul_mat_q"],
|
|
1772
1770
|
logits_all=state["logits_all"],
|
|
1773
1771
|
embedding=state["embedding"],
|
|
1774
1772
|
# Sampling Params
|
|
@@ -111,6 +111,7 @@ if TYPE_CHECKING:
|
|
|
111
111
|
|
|
112
112
|
F = TypeVar("F", bound=Callable[..., Any])
|
|
113
113
|
|
|
114
|
+
|
|
114
115
|
def ctypes_function_for_shared_library(lib: ctypes.CDLL):
|
|
115
116
|
def ctypes_function(
|
|
116
117
|
name: str, argtypes: List[Any], restype: Any, enabled: bool = True
|
|
@@ -558,9 +559,7 @@ class llama_model_params(ctypes.Structure):
|
|
|
558
559
|
# enum ggml_type type_k; // data type for K cache
|
|
559
560
|
# enum ggml_type type_v; // data type for V cache
|
|
560
561
|
|
|
561
|
-
|
|
562
562
|
# // Keep the booleans together to avoid misalignment during copy-by-value.
|
|
563
|
-
# bool mul_mat_q; // if true, use experimental mul_mat_q kernels (DEPRECATED - always true)
|
|
564
563
|
# bool logits_all; // the llama_eval() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
|
|
565
564
|
# bool embedding; // embedding mode only
|
|
566
565
|
# bool offload_kqv; // whether to offload the KQV ops (including the KV cache) to GPU
|
|
@@ -588,7 +587,6 @@ class llama_context_params(ctypes.Structure):
|
|
|
588
587
|
cb_eval_user_data (ctypes.ctypes.c_void_p): user data for cb_eval
|
|
589
588
|
type_k (int): data type for K cache
|
|
590
589
|
type_v (int): data type for V cache
|
|
591
|
-
mul_mat_q (bool): if true, use experimental mul_mat_q kernels (DEPRECATED - always true)
|
|
592
590
|
logits_all (bool): the llama_eval() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
|
|
593
591
|
embedding (bool): embedding mode only
|
|
594
592
|
offload_kqv (bool): whether to offload the KQV ops (including the KV cache) to GPU
|
|
@@ -614,7 +612,6 @@ class llama_context_params(ctypes.Structure):
|
|
|
614
612
|
("cb_eval_user_data", ctypes.c_void_p),
|
|
615
613
|
("type_k", ctypes.c_int),
|
|
616
614
|
("type_v", ctypes.c_int),
|
|
617
|
-
("mul_mat_q", ctypes.c_bool),
|
|
618
615
|
("logits_all", ctypes.c_bool),
|
|
619
616
|
("embedding", ctypes.c_bool),
|
|
620
617
|
("offload_kqv", ctypes.c_bool),
|
|
@@ -938,18 +935,6 @@ def llama_supports_gpu_offload() -> bool:
|
|
|
938
935
|
...
|
|
939
936
|
|
|
940
937
|
|
|
941
|
-
# LLAMA_API DEPRECATED(bool llama_mmap_supported (void), "use llama_supports_mmap() instead");
|
|
942
|
-
@ctypes_function("llama_mmap_supported", [], ctypes.c_bool)
|
|
943
|
-
def llama_mmap_supported() -> bool:
|
|
944
|
-
...
|
|
945
|
-
|
|
946
|
-
|
|
947
|
-
# LLAMA_API DEPRECATED(bool llama_mlock_supported(void), "use llama_supports_mlock() instead");
|
|
948
|
-
@ctypes_function("llama_mlock_supported", [], ctypes.c_bool)
|
|
949
|
-
def llama_mlock_supported() -> bool:
|
|
950
|
-
...
|
|
951
|
-
|
|
952
|
-
|
|
953
938
|
# LLAMA_API const struct llama_model * llama_get_model(const struct llama_context * ctx);
|
|
954
939
|
@ctypes_function("llama_get_model", [llama_context_p_ctypes], llama_model_p_ctypes)
|
|
955
940
|
def llama_get_model(ctx: llama_context_p, /) -> Optional[llama_model_p]:
|
|
@@ -1158,47 +1143,6 @@ def llama_model_quantize(
|
|
|
1158
1143
|
...
|
|
1159
1144
|
|
|
1160
1145
|
|
|
1161
|
-
# // Apply a LoRA adapter to a loaded model
|
|
1162
|
-
# // path_base_model is the path to a higher quality model to use as a base for
|
|
1163
|
-
# // the layers modified by the adapter. Can be NULL to use the current loaded model.
|
|
1164
|
-
# // The model needs to be reloaded before applying a new adapter, otherwise the adapter
|
|
1165
|
-
# // will be applied on top of the previous one
|
|
1166
|
-
# // Returns 0 on success
|
|
1167
|
-
# LLAMA_API DEPRECATED(int32_t llama_apply_lora_from_file(
|
|
1168
|
-
# struct llama_context * ctx,
|
|
1169
|
-
# const char * path_lora,
|
|
1170
|
-
# float scale,
|
|
1171
|
-
# const char * path_base_model,
|
|
1172
|
-
# int32_t n_threads),
|
|
1173
|
-
# "use llama_model_apply_lora_from_file instead");
|
|
1174
|
-
@ctypes_function(
|
|
1175
|
-
"llama_apply_lora_from_file",
|
|
1176
|
-
[
|
|
1177
|
-
llama_context_p_ctypes,
|
|
1178
|
-
ctypes.c_char_p,
|
|
1179
|
-
ctypes.c_float,
|
|
1180
|
-
ctypes.c_char_p,
|
|
1181
|
-
ctypes.c_int32,
|
|
1182
|
-
],
|
|
1183
|
-
ctypes.c_int32,
|
|
1184
|
-
)
|
|
1185
|
-
def llama_apply_lora_from_file(
|
|
1186
|
-
ctx: llama_context_p,
|
|
1187
|
-
path_lora: Union[ctypes.c_char_p, bytes],
|
|
1188
|
-
scale: Union[ctypes.c_float, float],
|
|
1189
|
-
path_base_model: Union[ctypes.c_char_p, bytes],
|
|
1190
|
-
n_threads: Union[ctypes.c_int32, int],
|
|
1191
|
-
/,
|
|
1192
|
-
) -> int:
|
|
1193
|
-
"""Apply a LoRA adapter to a loaded model
|
|
1194
|
-
path_base_model is the path to a higher quality model to use as a base for
|
|
1195
|
-
the layers modified by the adapter. Can be NULL to use the current loaded model.
|
|
1196
|
-
The model needs to be reloaded before applying a new adapter, otherwise the adapter
|
|
1197
|
-
will be applied on top of the previous one
|
|
1198
|
-
Returns 0 on success"""
|
|
1199
|
-
...
|
|
1200
|
-
|
|
1201
|
-
|
|
1202
1146
|
# LLAMA_API int32_t llama_model_apply_lora_from_file(
|
|
1203
1147
|
# const struct llama_model * model,
|
|
1204
1148
|
# const char * path_lora,
|
|
@@ -1220,7 +1164,7 @@ def llama_model_apply_lora_from_file(
|
|
|
1220
1164
|
model: llama_model_p,
|
|
1221
1165
|
path_lora: Union[ctypes.c_char_p, bytes],
|
|
1222
1166
|
scale: Union[ctypes.c_float, float],
|
|
1223
|
-
path_base_model: Union[ctypes.c_char_p, bytes],
|
|
1167
|
+
path_base_model: Union[ctypes.c_char_p, bytes, None],
|
|
1224
1168
|
n_threads: Union[ctypes.c_int32, int],
|
|
1225
1169
|
/,
|
|
1226
1170
|
) -> int:
|
|
@@ -1571,11 +1515,11 @@ def llama_copy_state_data(
|
|
|
1571
1515
|
...
|
|
1572
1516
|
|
|
1573
1517
|
|
|
1574
|
-
# Set the state reading from the specified address
|
|
1575
|
-
# Returns the number of bytes read
|
|
1518
|
+
# // Set the state reading from the specified address
|
|
1519
|
+
# // Returns the number of bytes read
|
|
1576
1520
|
# LLAMA_API size_t llama_set_state_data(
|
|
1577
1521
|
# struct llama_context * ctx,
|
|
1578
|
-
#
|
|
1522
|
+
# const uint8_t * src);
|
|
1579
1523
|
@ctypes_function(
|
|
1580
1524
|
"llama_set_state_data",
|
|
1581
1525
|
[llama_context_p_ctypes, ctypes.POINTER(ctypes.c_uint8)],
|
|
@@ -1647,72 +1591,6 @@ def llama_save_session_file(
|
|
|
1647
1591
|
# //
|
|
1648
1592
|
|
|
1649
1593
|
|
|
1650
|
-
# // Run the llama inference to obtain the logits and probabilities for the next token(s).
|
|
1651
|
-
# // tokens + n_tokens is the provided batch of new tokens to process
|
|
1652
|
-
# // n_past is the number of tokens to use from previous eval calls
|
|
1653
|
-
# // Returns 0 on success
|
|
1654
|
-
# // DEPRECATED: use llama_decode() instead
|
|
1655
|
-
# LLAMA_API DEPRECATED(int llama_eval(
|
|
1656
|
-
# struct llama_context * ctx,
|
|
1657
|
-
# llama_token * tokens,
|
|
1658
|
-
# int32_t n_tokens,
|
|
1659
|
-
# int32_t n_past),
|
|
1660
|
-
# "use llama_decode() instead");
|
|
1661
|
-
@ctypes_function(
|
|
1662
|
-
"llama_eval",
|
|
1663
|
-
[
|
|
1664
|
-
llama_context_p_ctypes,
|
|
1665
|
-
llama_token_p,
|
|
1666
|
-
ctypes.c_int32,
|
|
1667
|
-
ctypes.c_int32,
|
|
1668
|
-
],
|
|
1669
|
-
ctypes.c_int,
|
|
1670
|
-
)
|
|
1671
|
-
def llama_eval(
|
|
1672
|
-
ctx: llama_context_p,
|
|
1673
|
-
tokens: CtypesArray[llama_token],
|
|
1674
|
-
n_tokens: Union[ctypes.c_int, int],
|
|
1675
|
-
n_past: Union[ctypes.c_int, int],
|
|
1676
|
-
/,
|
|
1677
|
-
) -> int:
|
|
1678
|
-
"""Run the llama inference to obtain the logits and probabilities for the next token(s).
|
|
1679
|
-
tokens + n_tokens is the provided batch of new tokens to process
|
|
1680
|
-
n_past is the number of tokens to use from previous eval calls
|
|
1681
|
-
Returns 0 on success
|
|
1682
|
-
DEPRECATED: use llama_decode() instead"""
|
|
1683
|
-
...
|
|
1684
|
-
|
|
1685
|
-
|
|
1686
|
-
# // Same as llama_eval, but use float matrix input directly.
|
|
1687
|
-
# // DEPRECATED: use llama_decode() instead
|
|
1688
|
-
# LLAMA_API DEPRECATED(int llama_eval_embd(
|
|
1689
|
-
# struct llama_context * ctx,
|
|
1690
|
-
# float * embd,
|
|
1691
|
-
# int32_t n_tokens,
|
|
1692
|
-
# int32_t n_past),
|
|
1693
|
-
# "use llama_decode() instead");
|
|
1694
|
-
@ctypes_function(
|
|
1695
|
-
"llama_eval_embd",
|
|
1696
|
-
[
|
|
1697
|
-
llama_context_p_ctypes,
|
|
1698
|
-
ctypes.POINTER(ctypes.c_float),
|
|
1699
|
-
ctypes.c_int32,
|
|
1700
|
-
ctypes.c_int32,
|
|
1701
|
-
],
|
|
1702
|
-
ctypes.c_int,
|
|
1703
|
-
)
|
|
1704
|
-
def llama_eval_embd(
|
|
1705
|
-
ctx: llama_context_p,
|
|
1706
|
-
embd: CtypesArray[ctypes.c_float],
|
|
1707
|
-
n_tokens: Union[ctypes.c_int, int],
|
|
1708
|
-
n_past: Union[ctypes.c_int, int],
|
|
1709
|
-
/,
|
|
1710
|
-
) -> int:
|
|
1711
|
-
"""Same as llama_eval, but use float matrix input directly.
|
|
1712
|
-
DEPRECATED: use llama_decode() instead"""
|
|
1713
|
-
...
|
|
1714
|
-
|
|
1715
|
-
|
|
1716
1594
|
# // Return batch for single sequence of tokens starting at pos_0
|
|
1717
1595
|
# //
|
|
1718
1596
|
# // NOTE: this is a helper function to facilitate transition to the new batch API - avoid using it
|
|
@@ -2247,35 +2125,6 @@ def llama_sample_apply_guidance(
|
|
|
2247
2125
|
...
|
|
2248
2126
|
|
|
2249
2127
|
|
|
2250
|
-
# LLAMA_API DEPRECATED(void llama_sample_classifier_free_guidance(
|
|
2251
|
-
# struct llama_context * ctx,
|
|
2252
|
-
# llama_token_data_array * candidates,
|
|
2253
|
-
# struct llama_context * guidance_ctx,
|
|
2254
|
-
# float scale),
|
|
2255
|
-
# "use llama_sample_apply_guidance() instead");
|
|
2256
|
-
@ctypes_function(
|
|
2257
|
-
"llama_sample_classifier_free_guidance",
|
|
2258
|
-
[
|
|
2259
|
-
llama_context_p_ctypes,
|
|
2260
|
-
llama_token_data_array_p,
|
|
2261
|
-
llama_context_p_ctypes,
|
|
2262
|
-
ctypes.c_float,
|
|
2263
|
-
],
|
|
2264
|
-
None,
|
|
2265
|
-
)
|
|
2266
|
-
def llama_sample_classifier_free_guidance(
|
|
2267
|
-
ctx: llama_context_p,
|
|
2268
|
-
candidates: Union[
|
|
2269
|
-
CtypesArray[llama_token_data_array], CtypesPointerOrRef[llama_token_data_array]
|
|
2270
|
-
],
|
|
2271
|
-
guidance_ctx: llama_context_p,
|
|
2272
|
-
scale: Union[ctypes.c_float, float],
|
|
2273
|
-
/,
|
|
2274
|
-
):
|
|
2275
|
-
"""Apply classifier-free guidance to the logits as described in academic paper "Stay on topic with Classifier-Free Guidance" https://arxiv.org/abs/2306.17806"""
|
|
2276
|
-
...
|
|
2277
|
-
|
|
2278
|
-
|
|
2279
2128
|
# /// @details Sorts candidate tokens by their logits in descending order and calculate probabilities based on logits.
|
|
2280
2129
|
# LLAMA_API void llama_sample_softmax(
|
|
2281
2130
|
# struct llama_context * ctx,
|
|
@@ -2474,28 +2323,6 @@ def llama_sample_temp(
|
|
|
2474
2323
|
...
|
|
2475
2324
|
|
|
2476
2325
|
|
|
2477
|
-
# LLAMA_API DEPRECATED(void llama_sample_temperature(
|
|
2478
|
-
# struct llama_context * ctx,
|
|
2479
|
-
# llama_token_data_array * candidates,
|
|
2480
|
-
# float temp),
|
|
2481
|
-
# "use llama_sample_temp instead");
|
|
2482
|
-
@ctypes_function(
|
|
2483
|
-
"llama_sample_temperature",
|
|
2484
|
-
[llama_context_p_ctypes, llama_token_data_array_p, ctypes.c_float],
|
|
2485
|
-
None,
|
|
2486
|
-
)
|
|
2487
|
-
def llama_sample_temperature(
|
|
2488
|
-
ctx: llama_context_p,
|
|
2489
|
-
candidates: Union[
|
|
2490
|
-
CtypesArray[llama_token_data_array], CtypesPointerOrRef[llama_token_data_array]
|
|
2491
|
-
],
|
|
2492
|
-
temp: Union[ctypes.c_float, float],
|
|
2493
|
-
/,
|
|
2494
|
-
):
|
|
2495
|
-
"""use llama_sample_temp instead"""
|
|
2496
|
-
...
|
|
2497
|
-
|
|
2498
|
-
|
|
2499
2326
|
# /// @details Apply constraints from grammar
|
|
2500
2327
|
# LLAMA_API void llama_sample_grammar(
|
|
2501
2328
|
# struct llama_context * ctx,
|