llama-cpp-python 0.2.68__tar.gz → 0.2.70__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- llama_cpp_python-0.2.70/.git/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.70/.git/HEAD +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/config +1 -1
- llama_cpp_python-0.2.70/.git/index +0 -0
- llama_cpp_python-0.2.70/.git/logs/HEAD +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/HEAD +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/config +1 -1
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/config +1 -1
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +2 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +1 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.idx → llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.idx +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.pack → llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.pack +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.rev → llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.rev +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/01/7b72ce9438337f2d9b47212cc6756883e2c7c5 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/07/3612af1b8eed962fde03e16b8da8feb3a0d23c +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/07/fde361951704cbb5b8bf5f9396be8d00f95cae +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/3d/a5317b3d9104fb070fc45f855e92396ed97eb8 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/43/2cc2b4feadff27c6ab01f49cfc961390f2f9d3 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/44/4d1e55ebd5404f70ce62f32f5ad08bbbdebd2d +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/4f/232e18d96915ded0d8c12944b7abd40bc27bd7 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/7a/a213bbdb7358b99a39dea01a26bfe6db65b3fa +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/7e/46f03e7f64f6e8b0104ba351e46ae2125fc888 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/82/179a1257f30f2b64dced028ff994732694275d +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/87/f163bbd3fcebbe0b8d8df073ee559869948bd0 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/94/a1cc66854f43c0d4f2292c2eeeb9ddd65c8c93 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/a1/1795973ca3f7e54a2c407fe9d6d8fea450f645 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/a9/eee7cfc8f5eef59c4d4fa805ad3bbe86ea86d8 +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/b2/7c1291e4088be86d97f742d3a5aa1ade2d24fa +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/c0/e6fbf8c380718102bd25fcb8d2e55f8f9480d1 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/c4/ef15122655860b2ed615ceb918ce025c45865d +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/d7/f4bf8ea90d2d73885e4c201800fddb425c098c +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/f9/3cc522eb7f6bfdb0ec0adb499f4661d9fdbe93 +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/pack/pack-293eaa2a3e2852809e9943866a5773635399bf4c.idx +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.pack → llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/pack/pack-293eaa2a3e2852809e9943866a5773635399bf4c.pack +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/objects/pack/pack-293eaa2a3e2852809e9943866a5773635399bf4c.rev +0 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/packed-refs +2 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
- llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/shallow +2 -0
- llama_cpp_python-0.2.70/.git/objects/pack/pack-17b9384a6754c7e02e6df20dcc0e6bb5d5098e8a.idx +0 -0
- llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.pack → llama_cpp_python-0.2.70/.git/objects/pack/pack-17b9384a6754c7e02e6df20dcc0e6bb5d5098e8a.pack +0 -0
- llama_cpp_python-0.2.70/.git/objects/pack/pack-17b9384a6754c7e02e6df20dcc0e6bb5d5098e8a.rev +0 -0
- llama_cpp_python-0.2.70/.git/refs/tags/v0.2.70 +1 -0
- llama_cpp_python-0.2.70/.git/shallow +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/dependabot.yml +6 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/CHANGELOG.md +24 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/PKG-INFO +53 -43
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/README.md +52 -42
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/__init__.py +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/_internals.py +7 -5
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/_utils.py +11 -14
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama.py +48 -8
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_chat_format.py +507 -137
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_cpp.py +7 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_grammar.py +5 -11
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/app.py +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/model.py +15 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/settings.py +4 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/types.py +0 -2
- llama_cpp_python-0.2.70/vendor/llama.cpp/.flake8 +17 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/bench.yml +13 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/close-issue.yml +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/python-lint.yml +1 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.pre-commit-config.yaml +3 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/CMakeLists.txt +10 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/Makefile +1 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/README.md +22 -52
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ci/run.sh +6 -5
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/build-info.cpp +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/common.cpp +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/common.h +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/log.h +2 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/sampling.cpp +5 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/sampling.h +1 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert-hf-to-gguf-update.py +98 -75
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert-hf-to-gguf.py +134 -153
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +27 -24
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert-lora-to-ggml.py +17 -15
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert-persimmon-to-gguf.py +16 -12
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/convert.py +36 -24
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/docs/BLIS.md +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/docs/HOWTO-add-model.md +2 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf-split/gguf-split.cpp +15 -4
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf-split/tests.sh +7 -7
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/imatrix/imatrix.cpp +29 -7
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +15 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/README.md +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main/README.md +2 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main/main.cpp +2 -2
- llama_cpp_python-0.2.70/vendor/llama.cpp/examples/perplexity/README.md +132 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +175 -55
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/README.md +13 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/server.cpp +26 -11
- llama_cpp_python-0.2.70/vendor/llama.cpp/examples/server/tests/features/results.feature +81 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/steps/steps.py +100 -48
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/README.md +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/flake.lock +12 -18
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/common.cuh +40 -5
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/fattn.cu +3 -3
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda.cu +3 -3
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-metal.m +2 -36
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-metal.metal +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml.c +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml_vk_generate_shaders.py +9 -3
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/examples/reader.py +10 -8
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/constants.py +1 -3
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/gguf_reader.py +3 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/gguf_writer.py +4 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/vocab.py +13 -29
- llama_cpp_python-0.2.70/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +134 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/scripts/gguf-dump.py +20 -9
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/scripts/gguf-set-metadata.py +18 -13
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/README.md +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/llama.cpp +24 -7
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/llama.h +4 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert.txt +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/compare-llama-bench.py +16 -24
- llama_cpp_python-0.2.70/vendor/llama.cpp/scripts/gen-unicode-data.py +66 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/run-with-preset.py +10 -4
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/verify-checksum-models.py +8 -5
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/CMakeLists.txt +5 -2
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-tokenizer-0.cpp +30 -9
- llama_cpp_python-0.2.70/vendor/llama.cpp/tests/test-tokenizer-0.py +46 -0
- llama_cpp_python-0.2.70/vendor/llama.cpp/tests/test-tokenizer-0.sh +34 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/unicode-data.cpp +458 -416
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/unicode-data.h +1 -1
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/unicode.cpp +11 -11
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/unicode.h +1 -1
- llama_cpp_python-0.2.68/.git/FETCH_HEAD +0 -1
- llama_cpp_python-0.2.68/.git/HEAD +0 -1
- llama_cpp_python-0.2.68/.git/index +0 -0
- llama_cpp_python-0.2.68/.git/logs/HEAD +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/HEAD +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +0 -2
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.idx +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.rev +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/packed-refs +0 -2
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/shallow +0 -1
- llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.idx +0 -0
- llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.rev +0 -0
- llama_cpp_python-0.2.68/.git/refs/tags/v0.2.68 +0 -1
- llama_cpp_python-0.2.68/.git/shallow +0 -1
- llama_cpp_python-0.2.68/vendor/llama.cpp/.flake8 +0 -3
- llama_cpp_python-0.2.68/vendor/llama.cpp/examples/perplexity/README.md +0 -20
- llama_cpp_python-0.2.68/vendor/llama.cpp/examples/server/tests/features/results.feature +0 -57
- llama_cpp_python-0.2.68/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +0 -112
- llama_cpp_python-0.2.68/vendor/llama.cpp/tests/test-tokenizer-0-bpe.py +0 -117
- llama_cpp_python-0.2.68/vendor/llama.cpp/tests/test-tokenizer-0-spm.py +0 -114
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.dockerignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/config.worktree +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/description +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/info/exclude +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/description +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/FETCH_HEAD +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/HEAD +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/description +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/info/exclude +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/objects/0c/588e19be7b9726e5ae8dae3569dea0fd990af1 +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/objects/19/17e497d955de87fc0a472e21cf8fbf31112adf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/objects/30/3b5ceb11c6e3878c575cd53d863e5edcbc4550 +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/objects/45/65194ed7c32d1d2efa32ceab4d3c6cae006306 +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/packed-refs +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/refs/heads/master +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/modules/kompute/shallow +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/build-and-release.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/build-docker.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/build-wheels-cuda.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/build-wheels-metal.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/generate-index-from-release.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/publish-to-test.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/publish.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/test-pypi.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.github/workflows/test.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.gitmodules +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/.readthedocs.yaml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/LICENSE.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/Makefile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/cuda_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/open_llama/Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/open_llama/build.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/open_llama/hug_model.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/open_llama/start.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/open_llama/start_server.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/openblas_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docker/simple/run.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/api-reference.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/changelog.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/index.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/install/macos.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/docs/server.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/batch-processing/server.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/gradio_chat/local.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/gradio_chat/server.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/hf_pull/main.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/high_level_api/fastapi_server.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/high_level_api/high_level_api_embedding.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/high_level_api/high_level_api_inference.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/high_level_api/high_level_api_streaming.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/high_level_api/langchain_custom_llm.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/Chat.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/Miku.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/ReasonAct.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/common.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/quantize.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/readme/low_level_api_llama_cpp.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/low_level_api/util.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/Batching.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/Clients.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/Functions.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/Guidance.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/Multimodal.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/OpenHermesFunctionCalling.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/examples/notebooks/PerformanceTuning.ipynb +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/_logger.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_cache.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_speculative.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_tokenizer.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llama_types.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/llava_cpp.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/py.typed +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/__init__.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/__main__.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/cli.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/llama_cpp/server/errors.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/mkdocs.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/pyproject.toml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/scripts/releases-to-pep-503.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/tests/test_llama.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/tests/test_llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/tests/test_llama_grammar.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/tests/test_llama_speculative.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.clang-tidy +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/main-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/main-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/apps.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/devshells.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/docker.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/jetson-support.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/nixpkgs-instances.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/package.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/scope.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/nix/sif.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/server-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/server-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/server-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/server-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/server.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.devops/tools.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.dockerignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.ecrc +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.editorconfig +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.git +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/nix-ci-aarch64.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/nix-ci.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/nix-flake-update.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/nix-publish-flake.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/python-check-requirements.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/server.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/.gitmodules +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/AUTHORS +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/LICENSE +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/Package.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/README-sycl.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/SECURITY.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/build.zig +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ci/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/codecov.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/console.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/grammar-parser.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/json-schema-to-grammar.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/json.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/ngram-cache.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/ngram-cache.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/stb_image.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/train.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/common/train.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/docs/llama-star/idea-arch.key +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/docs/llama-star/idea-arch.pdf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/Miku.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/alpaca.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/base-translate.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/chat.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/embedding/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/eval-callback/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/finetune/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/finetune/finetune.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gbnf-validator/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gbnf-validator/gbnf-validator.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf-split/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gguf-split/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gritlm/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gritlm/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/gritlm/gritlm.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/imatrix/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/infill/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/json-schema-pydantic-example.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/json_schema_to_grammar.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama-bench/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Downloadable.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Llm.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainActivity.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainViewModel.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Color.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Theme.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Type.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_background.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_foreground.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher_round.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/themes.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/backup_rules.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/data_extraction_rules.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.jar +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/gradle.properties +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/gradlew +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.android/settings.gradle.kts +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/AppIcon.appiconset/Contents.json +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/Contents.json +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Models/LlamaState.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/ContentView.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/DownloadButton.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/InputButton.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/LoadCustomButton.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/llama_swiftuiApp.swift +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.pbxproj +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/contents.xcworkspacedata +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama.vim +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llama2.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/MobileVLM-README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/android/adb_run.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/android/build_64.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/clip.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/clip.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/llava-cli.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/llava-surgery-v2.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/llava.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/llava.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llava/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/llm.vim +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookahead/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/make-ggml.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/parallel/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/passkey/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/pydantic-models-to-grammar-examples.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/pydantic_models_to_grammar.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize/tests.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/reason-act.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/regex-to-grammar.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/retrieval/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/bench/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/bench/bench.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/bench/prometheus.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/bench/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/bench/script.js +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/chat.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/deps.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/httplib.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/public/index.html +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/public/index.js +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/embeddings.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/environment.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/issues.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/parallel.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/passkey.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/security.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/server.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/slotsave.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/features/wrong_usages.feature +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/tests/tests.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server/utils.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server-embd.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/simple/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/speculative/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/build.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/run-llama2.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/win-build-sycl.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/sycl/win-run-llama2.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/tokenize/tokenize.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/examples/ts-type-to-grammar.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/flake.nix +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-alloc.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-backend-impl.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-backend.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-common.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/acc.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/acc.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/alibi.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/alibi.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/arange.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/arange.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/argsort.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/argsort.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/binbcast.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/binbcast.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/clamp.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/clamp.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/concat.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/concat.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/convert.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/convert.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/cpy.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/cpy.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/dequantize.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/diagmask.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/diagmask.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/dmmv.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/dmmv.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/fattn.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/getrows.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/getrows.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/im2col.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/im2col.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/mmq.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/mmq.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/mmvq.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/mmvq.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/norm.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/norm.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/pad.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/pad.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/pool2d.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/pool2d.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/quantize.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/quantize.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/rope.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/rope.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/scale.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/scale.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/softmax.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/softmax.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/sumrows.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/sumrows.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/tsembd.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/tsembd.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/unary.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/unary.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/upscale.cu +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/upscale.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda/vecdotq.cuh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-cuda.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-impl.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-kompute.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-kompute.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-metal.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-mpi.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-mpi.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-opencl.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-quants.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-quants.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-sycl.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-sycl.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-vulkan-shaders.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-vulkan.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml-vulkan.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/ggml.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/examples/writer.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/gguf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/gguf/tensor_mapping.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/pyproject.toml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/scripts/__init__.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/scripts/gguf-new-metadata.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/c.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/json.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/grammars/list.gbnf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.ccls +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.clang-format +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.dockerignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.git +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.github/workflows/cpp_examples.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.github/workflows/cpp_tests.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.github/workflows/python_tests.yml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/CHANGELOG.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/CNAME +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/CODE_OF_CONDUCT.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/CONTRIBUTING.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/GOVERNANCE.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/LICENSE +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/MANIFEST.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/Makefile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/SECURITY.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/VERSION +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/bin2h.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/bin_file_to_header.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/check_vulkan_version.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/code_coverage.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/deprecation_warnings.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/komputeConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/cmake/vulkan_shader_compiler.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/config/FindSphinx.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docker-builders/KomputeBuilder.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docker-builders/Makefile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docker-builders/Swiftshader.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docker-builders/VulkanSDK.Dockerfile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/Doxyfile.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/Makefile +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/assets/custom.css +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/assets/gcov.css +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/conf.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/genindex.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/android-editor.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/android-kompute.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/binder-cpp.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/binder-python.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-architecture.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-cpp-video.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-python-video.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-algorithm.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-manager.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opcreatetensor.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-operations.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opmult.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-sequence.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-tensor.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/kompute.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/komputer-godot-4.gif +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/komputer-logos.gif +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/logistic-regression.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/queue-allocation.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/images/suspicious.jfif +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/index.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/make.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/advanced-examples.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/async-parallel.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/build-system.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/ci-tests.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/community.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/convolutional-net.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/custom-operations.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/game-engine-godot.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/matmul-benchmark.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/memory-management.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/mobile-android.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/python-examples.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/python-package.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/python-reference.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/raspberry-pi.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/reference.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/shaders-to-headers.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/docs/overview/variable-types.rst +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/build.gradle +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/kompute.jpg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeJniNative.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/java/com/ethicalml/kompute/KomputeJni.kt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/layout/activity_kompute_jni.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-anydpi-v26/kompute_icon.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-hdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-mdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon_foreground.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/dimens.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/kompute_icon_background.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/styles.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values-w820dp/dimens.xml +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/build.gradle +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle.properties +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/android/android-simple/settings.gradle +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/array_multiplication/src/main.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/SCsub +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/config.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/include/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_examples/project.godot +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/SCsub +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/config.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/include/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/TextFormat.theme +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/roboto.ttf +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/project.godot +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/logistic_regression/src/main.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/import_vgg7.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/out.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/run_vgg7.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_common.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_conv.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/w2wbinit.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/pi4_mesa_build/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/benchmark.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/first_example.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp1_naive.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp2_tiled.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp3_better_tiling.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/examples/python_naive_matmul/matmul_plot.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/external/bin/xxd.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/kompute-config.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/pylintrc +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/README.md +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/src/docstrings.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/src/main.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/src/utils.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/__init__.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/requirements-dev.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/test_array_multiplication.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/test_kompute.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/test_logistic_regression.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/test_tensor_types.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/python/test/utils.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/scripts/build_release_linux.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/scripts/build_release_windows.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/scripts/convert_shaders.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/scripts/push_folder_to_branch.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/scripts/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/setup.py +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/Algorithm.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/Core.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/Manager.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpAlgoDispatch.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpBufferSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpBufferSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpMemoryBarrier.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpTensorFill.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpTensorSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/OpTensorSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/Sequence.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/Tensor.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Algorithm.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Core.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Kompute.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Manager.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Sequence.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/Tensor.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/logger/Logger.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpAlgoDispatch.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBase.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMemoryBarrier.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMult.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorCopy.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorFill.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/logger/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/logger/Logger.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.hpp.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.hpp.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/src/shaders/hlsl/computeheadless.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestAsyncOperations.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestDestroy.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestLogisticRegression.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestManager.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestMultipleAlgoExecutions.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestOpShadersFromStringAndFile.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestOpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestOpTensorCreate.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestOpTensorSync.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestPushConstant.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestSequence.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestSpecializationConstant.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestTensor.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/TestWorkgroup.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_logistic_regression.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_op_custom_shader.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_workgroup.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/Utils.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/Utils.hpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/glsl/test_logistic_regression_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/glsl/test_op_custom_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/glsl/test_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/test/shaders/glsl/test_workgroup_shader.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute/vcpkg.json.opt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/common.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_add.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_addrow.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f16.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f32.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f16.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f32.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_diagmask.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_gelu.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_getrows.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_getrows_f16.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_0.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_1.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_getrows_q6_k.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_f16.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_mat_f32.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_0.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_1.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q6_k.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q8_0.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n_pre.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_norm.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_relu.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_rmsnorm.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_rope_f16.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_rope_f32.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_scale.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_scale_8.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_silu.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/op_softmax.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/kompute-shaders/rope_common.comp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/llama0-banner.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/llama0-logo.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/llama1-banner.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/llama1-logo.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/matmul.png +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/media/matmul.svg +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/mypy.ini +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/assistant.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat-with-qwen.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/chat.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/dan.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf-update.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/requirements.txt +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/build-info.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/check-requirements.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/ci-run.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/compare-commits.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/gen-authors.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/gen-build-info-cpp.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-flags.mk +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-hellaswag.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-pg.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-wikitext-103.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/get-winogrande.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/hf.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/install-oneapi.bat +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/pod-llama.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/sync-ggml-am.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/sync-ggml.last +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/scripts/xxd.cmake +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/sgemm.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/sgemm.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/spm-headers/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/spm-headers/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/spm-headers/llama.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/.gitignore +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/run-json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-grammar-integration.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_python-0.2.68 → llama_cpp_python-0.2.70}/vendor/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
|
@@ -0,0 +1 @@
|
|
|
1
|
+
9ce5cb376a12a56028aec1fd3b0edc55949b996f '9ce5cb376a12a56028aec1fd3b0edc55949b996f' of https://github.com/abetlen/llama-cpp-python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
9ce5cb376a12a56028aec1fd3b0edc55949b996f
|
|
@@ -9,7 +9,7 @@
|
|
|
9
9
|
[gc]
|
|
10
10
|
auto = 0
|
|
11
11
|
[http "https://github.com/"]
|
|
12
|
-
extraheader = AUTHORIZATION: basic
|
|
12
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1VKZzRtOWNLdzR0dno0b0Z5M1U4QkhFd1NrRGI3NTFSSWpZTw==
|
|
13
13
|
[submodule "vendor/llama.cpp"]
|
|
14
14
|
active = true
|
|
15
15
|
url = https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 9ce5cb376a12a56028aec1fd3b0edc55949b996f runner <runner@fv-az564-924.(none)> 1715150262 +0000 checkout: moving from master to refs/tags/v0.2.70
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
c0e6fbf8c380718102bd25fcb8d2e55f8f9480d1 'c0e6fbf8c380718102bd25fcb8d2e55f8f9480d1' of https://github.com/ggerganov/llama.cpp
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
c0e6fbf8c380718102bd25fcb8d2e55f8f9480d1
|
|
@@ -16,7 +16,7 @@
|
|
|
16
16
|
[gc]
|
|
17
17
|
auto = 0
|
|
18
18
|
[http "https://github.com/"]
|
|
19
|
-
extraheader = AUTHORIZATION: basic
|
|
19
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1VKZzRtOWNLdzR0dno0b0Z5M1U4QkhFd1NrRGI3NTFSSWpZTw==
|
|
20
20
|
[url "https://github.com/"]
|
|
21
21
|
insteadOf = git@github.com:
|
|
22
22
|
insteadOf = org-6826477@github.com:
|
|
Binary file
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 3855416027cb25d9a708ffa5581cf503a87856a6 runner <runner@fv-az564-924.(none)> 1715150263 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
2
|
+
3855416027cb25d9a708ffa5581cf503a87856a6 c0e6fbf8c380718102bd25fcb8d2e55f8f9480d1 runner <runner@fv-az564-924.(none)> 1715150264 +0000 checkout: moving from master to c0e6fbf8c380718102bd25fcb8d2e55f8f9480d1
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 3855416027cb25d9a708ffa5581cf503a87856a6 runner <runner@fv-az564-924.(none)> 1715150263 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 3855416027cb25d9a708ffa5581cf503a87856a6 runner <runner@fv-az564-924.(none)> 1715150263 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
[gc]
|
|
14
14
|
auto = 0
|
|
15
15
|
[http "https://github.com/"]
|
|
16
|
-
extraheader = AUTHORIZATION: basic
|
|
16
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1VKZzRtOWNLdzR0dno0b0Z5M1U4QkhFd1NrRGI3NTFSSWpZTw==
|
|
17
17
|
[url "https://github.com/"]
|
|
18
18
|
insteadOf = git@github.com:
|
|
19
19
|
insteadOf = org-6826477@github.com:
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az564-924.(none)> 1715150265 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
2
|
+
d1e3b0953cf66acc94b2e29693e221427b2c1f3f 4565194ed7c32d1d2efa32ceab4d3c6cae006306 runner <runner@fv-az564-924.(none)> 1715150266 +0000 checkout: moving from master to 4565194ed7c32d1d2efa32ceab4d3c6cae006306
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az564-924.(none)> 1715150265 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
llama_cpp_python-0.2.70/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD
ADDED
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az564-924.(none)> 1715150265 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
x+)JMU064e040031Q�����,���+�d���t��i��m|�Yv�]�,9?��$1����_YO�f��7j�l_}��P�u�����4��T���MME��>���o��II|QjbJjH��V�Ѯ,�6�O_�w�ي�ճ�U�e�@T�<��P���A�o���M�ܾ���P��z%��)��>����5g�n�u�Q7=� �US��W�_��XP�����i)���oWed_-ޡ7i�U������$���U���{�:sk��|�A�۞����
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
3855416027cb25d9a708ffa5581cf503a87856a6
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
9ce5cb376a12a56028aec1fd3b0edc55949b996f
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
9ce5cb376a12a56028aec1fd3b0edc55949b996f
|
|
@@ -8,8 +8,12 @@ updates:
|
|
|
8
8
|
- package-ecosystem: "pip" # See documentation for possible values
|
|
9
9
|
directory: "/" # Location of package manifests
|
|
10
10
|
schedule:
|
|
11
|
-
interval: "
|
|
11
|
+
interval: "daily"
|
|
12
12
|
- package-ecosystem: "github-actions"
|
|
13
13
|
directory: "/"
|
|
14
14
|
schedule:
|
|
15
|
-
interval: "
|
|
15
|
+
interval: "daily"
|
|
16
|
+
- package-ecosystem: "docker"
|
|
17
|
+
directory: "/"
|
|
18
|
+
schedule:
|
|
19
|
+
interval: "daily"
|
|
@@ -7,9 +7,32 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
7
7
|
|
|
8
8
|
## [Unreleased]
|
|
9
9
|
|
|
10
|
-
## [0.2.
|
|
10
|
+
## [0.2.70]
|
|
11
11
|
|
|
12
12
|
- feat: Update llama.cpp to ggerganov/llama.cpp@
|
|
13
|
+
- feat: fill-in-middle support by @CISC in #1386
|
|
14
|
+
- fix: adding missing args in create_completion for functionary chat handler by @skalade in #1430
|
|
15
|
+
- docs: update README.md @eltociear in #1432
|
|
16
|
+
- fix: chat_format log where auto-detected format prints None by @balvisio in #1434
|
|
17
|
+
- feat(server): Add support for setting root_path by @abetlen in 0318702cdc860999ee70f277425edbbfe0e60419
|
|
18
|
+
- feat(ci): Add docker checks and check deps more frequently by @Smartappli in #1426
|
|
19
|
+
- fix: detokenization case where first token does not start with a leading space by @noamgat in #1375
|
|
20
|
+
- feat: Implement streaming for Functionary v2 + Bug fixes by @jeffrey-fong in #1419
|
|
21
|
+
- fix: Use memmove to copy str_value kv_override by @abetlen in 9f7a85571ae80d3b6ddbd3e1bae407b9f1e3448a
|
|
22
|
+
- feat(server): Remove temperature bounds checks for server by @abetlen in 0a454bebe67d12a446981eb16028c168ca5faa81
|
|
23
|
+
- fix(server): Propagate flash_attn to model load by @dthuerck in #1424
|
|
24
|
+
|
|
25
|
+
## [0.2.69]
|
|
26
|
+
|
|
27
|
+
- feat: Update llama.cpp to ggerganov/llama.cpp@6ecf3189e00a1e8e737a78b6d10e1d7006e050a2
|
|
28
|
+
- feat: Add llama-3-vision-alpha chat format by @abetlen in 31b1d95a6c19f5b615a3286069f181a415f872e8
|
|
29
|
+
- fix: Change default verbose value of verbose in image chat format handlers to True to match Llama by @abetlen in 4f01c452b6c738dc56eacac3758119b12c57ea94
|
|
30
|
+
- fix: Suppress all logs when verbose=False, use hardcoded fileno's to work in colab notebooks by @abetlen in f116175a5a7c84569c88cad231855c1e6e59ff6e
|
|
31
|
+
- fix: UTF-8 handling with grammars by @jsoma in #1415
|
|
32
|
+
|
|
33
|
+
## [0.2.68]
|
|
34
|
+
|
|
35
|
+
- feat: Update llama.cpp to ggerganov/llama.cpp@77e15bec6217a39be59b9cc83d6b9afb6b0d8167
|
|
13
36
|
- feat: Add option to enable flash_attn to Lllama params and ModelSettings by @abetlen in 22d77eefd2edaf0148f53374d0cac74d0e25d06e
|
|
14
37
|
- fix(ci): Fix build-and-release.yaml by @Smartappli in #1413
|
|
15
38
|
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.1
|
|
2
2
|
Name: llama_cpp_python
|
|
3
|
-
Version: 0.2.
|
|
3
|
+
Version: 0.2.70
|
|
4
4
|
Summary: Python bindings for the llama.cpp library
|
|
5
5
|
Author-Email: Andrei Betlen <abetlen@gmail.com>
|
|
6
6
|
License: MIT
|
|
@@ -321,20 +321,26 @@ The high-level API provides a simple managed interface through the [`Llama`](htt
|
|
|
321
321
|
Below is a short example demonstrating how to use the high-level API to for basic text completion:
|
|
322
322
|
|
|
323
323
|
```python
|
|
324
|
-
|
|
325
|
-
|
|
324
|
+
from llama_cpp import Llama
|
|
325
|
+
|
|
326
|
+
llm = Llama(
|
|
326
327
|
model_path="./models/7B/llama-model.gguf",
|
|
327
328
|
# n_gpu_layers=-1, # Uncomment to use GPU acceleration
|
|
328
329
|
# seed=1337, # Uncomment to set a specific seed
|
|
329
330
|
# n_ctx=2048, # Uncomment to increase the context window
|
|
330
331
|
)
|
|
331
|
-
|
|
332
|
+
output = llm(
|
|
332
333
|
"Q: Name the planets in the solar system? A: ", # Prompt
|
|
333
334
|
max_tokens=32, # Generate up to 32 tokens, set to None to generate up to the end of the context window
|
|
334
335
|
stop=["Q:", "\n"], # Stop generating just before the model would generate a new question
|
|
335
336
|
echo=True # Echo the prompt back in the output
|
|
336
337
|
) # Generate a completion, can also call create_completion
|
|
337
|
-
|
|
338
|
+
print(output)
|
|
339
|
+
```
|
|
340
|
+
|
|
341
|
+
By default `llama-cpp-python` generates completions in an OpenAI compatible format:
|
|
342
|
+
|
|
343
|
+
```python
|
|
338
344
|
{
|
|
339
345
|
"id": "cmpl-xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
|
|
340
346
|
"object": "text_completion",
|
|
@@ -389,12 +395,12 @@ The model will will format the messages into a single prompt using the following
|
|
|
389
395
|
Set `verbose=True` to see the selected chat format.
|
|
390
396
|
|
|
391
397
|
```python
|
|
392
|
-
|
|
393
|
-
|
|
398
|
+
from llama_cpp import Llama
|
|
399
|
+
llm = Llama(
|
|
394
400
|
model_path="path/to/llama-2/llama-model.gguf",
|
|
395
401
|
chat_format="llama-2"
|
|
396
402
|
)
|
|
397
|
-
|
|
403
|
+
llm.create_chat_completion(
|
|
398
404
|
messages = [
|
|
399
405
|
{"role": "system", "content": "You are an assistant who perfectly describes images."},
|
|
400
406
|
{
|
|
@@ -419,9 +425,9 @@ To constrain chat responses to only valid JSON or a specific JSON Schema use the
|
|
|
419
425
|
The following example will constrain the response to valid JSON strings only.
|
|
420
426
|
|
|
421
427
|
```python
|
|
422
|
-
|
|
423
|
-
|
|
424
|
-
|
|
428
|
+
from llama_cpp import Llama
|
|
429
|
+
llm = Llama(model_path="path/to/model.gguf", chat_format="chatml")
|
|
430
|
+
llm.create_chat_completion(
|
|
425
431
|
messages=[
|
|
426
432
|
{
|
|
427
433
|
"role": "system",
|
|
@@ -441,9 +447,9 @@ The following example will constrain the response to valid JSON strings only.
|
|
|
441
447
|
To constrain the response further to a specific JSON Schema add the schema to the `schema` property of the `response_format` argument.
|
|
442
448
|
|
|
443
449
|
```python
|
|
444
|
-
|
|
445
|
-
|
|
446
|
-
|
|
450
|
+
from llama_cpp import Llama
|
|
451
|
+
llm = Llama(model_path="path/to/model.gguf", chat_format="chatml")
|
|
452
|
+
llm.create_chat_completion(
|
|
447
453
|
messages=[
|
|
448
454
|
{
|
|
449
455
|
"role": "system",
|
|
@@ -468,9 +474,9 @@ To constrain the response further to a specific JSON Schema add the schema to th
|
|
|
468
474
|
The high-level API supports OpenAI compatible function and tool calling. This is possible through the `functionary` pre-trained models chat format or through the generic `chatml-function-calling` chat format.
|
|
469
475
|
|
|
470
476
|
```python
|
|
471
|
-
|
|
472
|
-
|
|
473
|
-
|
|
477
|
+
from llama_cpp import Llama
|
|
478
|
+
llm = Llama(model_path="path/to/chatml/llama-model.gguf", chat_format="chatml-function-calling")
|
|
479
|
+
llm.create_chat_completion(
|
|
474
480
|
messages = [
|
|
475
481
|
{
|
|
476
482
|
"role": "system",
|
|
@@ -520,9 +526,9 @@ The various gguf-converted files for this set of models can be found [here](http
|
|
|
520
526
|
Due to discrepancies between llama.cpp and HuggingFace's tokenizers, it is required to provide HF Tokenizer for functionary. The `LlamaHFTokenizer` class can be initialized and passed into the Llama class. This will override the default llama.cpp tokenizer used in Llama class. The tokenizer files are already included in the respective HF repositories hosting the gguf files.
|
|
521
527
|
|
|
522
528
|
```python
|
|
523
|
-
|
|
524
|
-
|
|
525
|
-
|
|
529
|
+
from llama_cpp import Llama
|
|
530
|
+
from llama_cpp.llama_tokenizer import LlamaHFTokenizer
|
|
531
|
+
llm = Llama.from_pretrained(
|
|
526
532
|
repo_id="meetkai/functionary-small-v2.2-GGUF",
|
|
527
533
|
filename="functionary-small-v2.2.q4_0.gguf",
|
|
528
534
|
chat_format="functionary-v2",
|
|
@@ -548,15 +554,15 @@ You'll first need to download one of the available multi-modal models in GGUF fo
|
|
|
548
554
|
Then you'll need to use a custom chat handler to load the clip model and process the chat messages and images.
|
|
549
555
|
|
|
550
556
|
```python
|
|
551
|
-
|
|
552
|
-
|
|
553
|
-
|
|
554
|
-
|
|
557
|
+
from llama_cpp import Llama
|
|
558
|
+
from llama_cpp.llama_chat_format import Llava15ChatHandler
|
|
559
|
+
chat_handler = Llava15ChatHandler(clip_model_path="path/to/llava/mmproj.bin")
|
|
560
|
+
llm = Llama(
|
|
555
561
|
model_path="./path/to/llava/llama-model.gguf",
|
|
556
562
|
chat_handler=chat_handler,
|
|
557
|
-
n_ctx=2048, # n_ctx should be increased to
|
|
563
|
+
n_ctx=2048, # n_ctx should be increased to accommodate the image embedding
|
|
558
564
|
)
|
|
559
|
-
|
|
565
|
+
llm.create_chat_completion(
|
|
560
566
|
messages = [
|
|
561
567
|
{"role": "system", "content": "You are an assistant who perfectly describes images."},
|
|
562
568
|
{
|
|
@@ -573,19 +579,22 @@ Then you'll need to use a custom chat handler to load the clip model and process
|
|
|
573
579
|
You can also pull the model from the Hugging Face Hub using the `from_pretrained` method.
|
|
574
580
|
|
|
575
581
|
```python
|
|
576
|
-
|
|
577
|
-
|
|
578
|
-
|
|
582
|
+
from llama_cpp import Llama
|
|
583
|
+
from llama_cpp.llama_chat_format import MoondreamChatHandler
|
|
584
|
+
|
|
585
|
+
chat_handler = MoondreamChatHandler.from_pretrained(
|
|
579
586
|
repo_id="vikhyatk/moondream2",
|
|
580
587
|
filename="*mmproj*",
|
|
581
588
|
)
|
|
582
|
-
|
|
583
|
-
|
|
589
|
+
|
|
590
|
+
llm = Llama.from_pretrained(
|
|
591
|
+
repo_id="vikhyatk/moondream2",
|
|
584
592
|
filename="*text-model*",
|
|
585
593
|
chat_handler=chat_handler,
|
|
586
|
-
n_ctx=2048, # n_ctx should be increased to
|
|
594
|
+
n_ctx=2048, # n_ctx should be increased to accommodate the image embedding
|
|
587
595
|
)
|
|
588
|
-
|
|
596
|
+
|
|
597
|
+
respoonse = llm.create_chat_completion(
|
|
589
598
|
messages = [
|
|
590
599
|
{
|
|
591
600
|
"role": "user",
|
|
@@ -597,6 +606,7 @@ You can also pull the model from the Hugging Face Hub using the `from_pretrained
|
|
|
597
606
|
}
|
|
598
607
|
]
|
|
599
608
|
)
|
|
609
|
+
print(response["choices"][0]["text"])
|
|
600
610
|
```
|
|
601
611
|
|
|
602
612
|
**Note**: Multi-modal models also support tool calling and JSON mode.
|
|
@@ -749,18 +759,18 @@ The entire low-level API can be found in [llama_cpp/llama_cpp.py](https://github
|
|
|
749
759
|
Below is a short example demonstrating how to use the low-level API to tokenize a prompt:
|
|
750
760
|
|
|
751
761
|
```python
|
|
752
|
-
|
|
753
|
-
|
|
754
|
-
|
|
755
|
-
|
|
762
|
+
import llama_cpp
|
|
763
|
+
import ctypes
|
|
764
|
+
llama_cpp.llama_backend_init(False) # Must be called once at the start of each program
|
|
765
|
+
params = llama_cpp.llama_context_default_params()
|
|
756
766
|
# use bytes for char * params
|
|
757
|
-
|
|
758
|
-
|
|
759
|
-
|
|
767
|
+
model = llama_cpp.llama_load_model_from_file(b"./models/7b/llama-model.gguf", params)
|
|
768
|
+
ctx = llama_cpp.llama_new_context_with_model(model, params)
|
|
769
|
+
max_tokens = params.n_ctx
|
|
760
770
|
# use ctypes arrays for array params
|
|
761
|
-
|
|
762
|
-
|
|
763
|
-
|
|
771
|
+
tokens = (llama_cpp.llama_token * int(max_tokens))()
|
|
772
|
+
n_tokens = llama_cpp.llama_tokenize(ctx, b"Q: Name the planets in the solar system? A: ", tokens, max_tokens, llama_cpp.c_bool(True))
|
|
773
|
+
llama_cpp.llama_free(ctx)
|
|
764
774
|
```
|
|
765
775
|
|
|
766
776
|
Check out the [examples folder](examples/low_level_api) for more examples of using the low-level API.
|
|
@@ -277,20 +277,26 @@ The high-level API provides a simple managed interface through the [`Llama`](htt
|
|
|
277
277
|
Below is a short example demonstrating how to use the high-level API to for basic text completion:
|
|
278
278
|
|
|
279
279
|
```python
|
|
280
|
-
|
|
281
|
-
|
|
280
|
+
from llama_cpp import Llama
|
|
281
|
+
|
|
282
|
+
llm = Llama(
|
|
282
283
|
model_path="./models/7B/llama-model.gguf",
|
|
283
284
|
# n_gpu_layers=-1, # Uncomment to use GPU acceleration
|
|
284
285
|
# seed=1337, # Uncomment to set a specific seed
|
|
285
286
|
# n_ctx=2048, # Uncomment to increase the context window
|
|
286
287
|
)
|
|
287
|
-
|
|
288
|
+
output = llm(
|
|
288
289
|
"Q: Name the planets in the solar system? A: ", # Prompt
|
|
289
290
|
max_tokens=32, # Generate up to 32 tokens, set to None to generate up to the end of the context window
|
|
290
291
|
stop=["Q:", "\n"], # Stop generating just before the model would generate a new question
|
|
291
292
|
echo=True # Echo the prompt back in the output
|
|
292
293
|
) # Generate a completion, can also call create_completion
|
|
293
|
-
|
|
294
|
+
print(output)
|
|
295
|
+
```
|
|
296
|
+
|
|
297
|
+
By default `llama-cpp-python` generates completions in an OpenAI compatible format:
|
|
298
|
+
|
|
299
|
+
```python
|
|
294
300
|
{
|
|
295
301
|
"id": "cmpl-xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
|
|
296
302
|
"object": "text_completion",
|
|
@@ -345,12 +351,12 @@ The model will will format the messages into a single prompt using the following
|
|
|
345
351
|
Set `verbose=True` to see the selected chat format.
|
|
346
352
|
|
|
347
353
|
```python
|
|
348
|
-
|
|
349
|
-
|
|
354
|
+
from llama_cpp import Llama
|
|
355
|
+
llm = Llama(
|
|
350
356
|
model_path="path/to/llama-2/llama-model.gguf",
|
|
351
357
|
chat_format="llama-2"
|
|
352
358
|
)
|
|
353
|
-
|
|
359
|
+
llm.create_chat_completion(
|
|
354
360
|
messages = [
|
|
355
361
|
{"role": "system", "content": "You are an assistant who perfectly describes images."},
|
|
356
362
|
{
|
|
@@ -375,9 +381,9 @@ To constrain chat responses to only valid JSON or a specific JSON Schema use the
|
|
|
375
381
|
The following example will constrain the response to valid JSON strings only.
|
|
376
382
|
|
|
377
383
|
```python
|
|
378
|
-
|
|
379
|
-
|
|
380
|
-
|
|
384
|
+
from llama_cpp import Llama
|
|
385
|
+
llm = Llama(model_path="path/to/model.gguf", chat_format="chatml")
|
|
386
|
+
llm.create_chat_completion(
|
|
381
387
|
messages=[
|
|
382
388
|
{
|
|
383
389
|
"role": "system",
|
|
@@ -397,9 +403,9 @@ The following example will constrain the response to valid JSON strings only.
|
|
|
397
403
|
To constrain the response further to a specific JSON Schema add the schema to the `schema` property of the `response_format` argument.
|
|
398
404
|
|
|
399
405
|
```python
|
|
400
|
-
|
|
401
|
-
|
|
402
|
-
|
|
406
|
+
from llama_cpp import Llama
|
|
407
|
+
llm = Llama(model_path="path/to/model.gguf", chat_format="chatml")
|
|
408
|
+
llm.create_chat_completion(
|
|
403
409
|
messages=[
|
|
404
410
|
{
|
|
405
411
|
"role": "system",
|
|
@@ -424,9 +430,9 @@ To constrain the response further to a specific JSON Schema add the schema to th
|
|
|
424
430
|
The high-level API supports OpenAI compatible function and tool calling. This is possible through the `functionary` pre-trained models chat format or through the generic `chatml-function-calling` chat format.
|
|
425
431
|
|
|
426
432
|
```python
|
|
427
|
-
|
|
428
|
-
|
|
429
|
-
|
|
433
|
+
from llama_cpp import Llama
|
|
434
|
+
llm = Llama(model_path="path/to/chatml/llama-model.gguf", chat_format="chatml-function-calling")
|
|
435
|
+
llm.create_chat_completion(
|
|
430
436
|
messages = [
|
|
431
437
|
{
|
|
432
438
|
"role": "system",
|
|
@@ -476,9 +482,9 @@ The various gguf-converted files for this set of models can be found [here](http
|
|
|
476
482
|
Due to discrepancies between llama.cpp and HuggingFace's tokenizers, it is required to provide HF Tokenizer for functionary. The `LlamaHFTokenizer` class can be initialized and passed into the Llama class. This will override the default llama.cpp tokenizer used in Llama class. The tokenizer files are already included in the respective HF repositories hosting the gguf files.
|
|
477
483
|
|
|
478
484
|
```python
|
|
479
|
-
|
|
480
|
-
|
|
481
|
-
|
|
485
|
+
from llama_cpp import Llama
|
|
486
|
+
from llama_cpp.llama_tokenizer import LlamaHFTokenizer
|
|
487
|
+
llm = Llama.from_pretrained(
|
|
482
488
|
repo_id="meetkai/functionary-small-v2.2-GGUF",
|
|
483
489
|
filename="functionary-small-v2.2.q4_0.gguf",
|
|
484
490
|
chat_format="functionary-v2",
|
|
@@ -504,15 +510,15 @@ You'll first need to download one of the available multi-modal models in GGUF fo
|
|
|
504
510
|
Then you'll need to use a custom chat handler to load the clip model and process the chat messages and images.
|
|
505
511
|
|
|
506
512
|
```python
|
|
507
|
-
|
|
508
|
-
|
|
509
|
-
|
|
510
|
-
|
|
513
|
+
from llama_cpp import Llama
|
|
514
|
+
from llama_cpp.llama_chat_format import Llava15ChatHandler
|
|
515
|
+
chat_handler = Llava15ChatHandler(clip_model_path="path/to/llava/mmproj.bin")
|
|
516
|
+
llm = Llama(
|
|
511
517
|
model_path="./path/to/llava/llama-model.gguf",
|
|
512
518
|
chat_handler=chat_handler,
|
|
513
|
-
n_ctx=2048, # n_ctx should be increased to
|
|
519
|
+
n_ctx=2048, # n_ctx should be increased to accommodate the image embedding
|
|
514
520
|
)
|
|
515
|
-
|
|
521
|
+
llm.create_chat_completion(
|
|
516
522
|
messages = [
|
|
517
523
|
{"role": "system", "content": "You are an assistant who perfectly describes images."},
|
|
518
524
|
{
|
|
@@ -529,19 +535,22 @@ Then you'll need to use a custom chat handler to load the clip model and process
|
|
|
529
535
|
You can also pull the model from the Hugging Face Hub using the `from_pretrained` method.
|
|
530
536
|
|
|
531
537
|
```python
|
|
532
|
-
|
|
533
|
-
|
|
534
|
-
|
|
538
|
+
from llama_cpp import Llama
|
|
539
|
+
from llama_cpp.llama_chat_format import MoondreamChatHandler
|
|
540
|
+
|
|
541
|
+
chat_handler = MoondreamChatHandler.from_pretrained(
|
|
535
542
|
repo_id="vikhyatk/moondream2",
|
|
536
543
|
filename="*mmproj*",
|
|
537
544
|
)
|
|
538
|
-
|
|
539
|
-
|
|
545
|
+
|
|
546
|
+
llm = Llama.from_pretrained(
|
|
547
|
+
repo_id="vikhyatk/moondream2",
|
|
540
548
|
filename="*text-model*",
|
|
541
549
|
chat_handler=chat_handler,
|
|
542
|
-
n_ctx=2048, # n_ctx should be increased to
|
|
550
|
+
n_ctx=2048, # n_ctx should be increased to accommodate the image embedding
|
|
543
551
|
)
|
|
544
|
-
|
|
552
|
+
|
|
553
|
+
respoonse = llm.create_chat_completion(
|
|
545
554
|
messages = [
|
|
546
555
|
{
|
|
547
556
|
"role": "user",
|
|
@@ -553,6 +562,7 @@ You can also pull the model from the Hugging Face Hub using the `from_pretrained
|
|
|
553
562
|
}
|
|
554
563
|
]
|
|
555
564
|
)
|
|
565
|
+
print(response["choices"][0]["text"])
|
|
556
566
|
```
|
|
557
567
|
|
|
558
568
|
**Note**: Multi-modal models also support tool calling and JSON mode.
|
|
@@ -705,18 +715,18 @@ The entire low-level API can be found in [llama_cpp/llama_cpp.py](https://github
|
|
|
705
715
|
Below is a short example demonstrating how to use the low-level API to tokenize a prompt:
|
|
706
716
|
|
|
707
717
|
```python
|
|
708
|
-
|
|
709
|
-
|
|
710
|
-
|
|
711
|
-
|
|
718
|
+
import llama_cpp
|
|
719
|
+
import ctypes
|
|
720
|
+
llama_cpp.llama_backend_init(False) # Must be called once at the start of each program
|
|
721
|
+
params = llama_cpp.llama_context_default_params()
|
|
712
722
|
# use bytes for char * params
|
|
713
|
-
|
|
714
|
-
|
|
715
|
-
|
|
723
|
+
model = llama_cpp.llama_load_model_from_file(b"./models/7b/llama-model.gguf", params)
|
|
724
|
+
ctx = llama_cpp.llama_new_context_with_model(model, params)
|
|
725
|
+
max_tokens = params.n_ctx
|
|
716
726
|
# use ctypes arrays for array params
|
|
717
|
-
|
|
718
|
-
|
|
719
|
-
|
|
727
|
+
tokens = (llama_cpp.llama_token * int(max_tokens))()
|
|
728
|
+
n_tokens = llama_cpp.llama_tokenize(ctx, b"Q: Name the planets in the solar system? A: ", tokens, max_tokens, llama_cpp.c_bool(True))
|
|
729
|
+
llama_cpp.llama_free(ctx)
|
|
720
730
|
```
|
|
721
731
|
|
|
722
732
|
Check out the [examples folder](examples/low_level_api) for more examples of using the low-level API.
|