llama-cpp-python 0.2.67__tar.gz → 0.2.68__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- llama_cpp_python-0.2.68/.git/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.68/.git/HEAD +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/config +1 -1
- llama_cpp_python-0.2.68/.git/index +0 -0
- llama_cpp_python-0.2.68/.git/logs/HEAD +1 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/HEAD +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/config +1 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/config +1 -1
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +2 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +1 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.idx → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.idx +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.pack → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.pack +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.rev → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.rev +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.idx +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.pack → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.pack +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.rev +0 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/packed-refs +2 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
- llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/shallow +1 -0
- llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.idx +0 -0
- llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.pack → llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.pack +0 -0
- llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.rev +0 -0
- llama_cpp_python-0.2.68/.git/refs/tags/v0.2.68 +1 -0
- llama_cpp_python-0.2.68/.git/shallow +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-and-release.yaml +3 -8
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/CHANGELOG.md +6 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/PKG-INFO +3 -2
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/README.md +2 -1
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/__init__.py +1 -1
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama.py +4 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_cpp.py +7 -3
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/settings.py +3 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ci/run.sh +6 -2
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/build-info.cpp +1 -1
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/common.cpp +7 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/common.h +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-hf-to-gguf-update.py +10 -6
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-hf-to-gguf.py +8 -4
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +17 -11
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +27 -3
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/bench.py +1 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/server.cpp +3 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/common.cuh +26 -14
- llama_cpp_python-0.2.68/vendor/llama.cpp/ggml-cuda/fattn.cu +944 -0
- llama_cpp_python-0.2.68/vendor/llama.cpp/ggml-cuda/fattn.cuh +3 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/softmax.cu +36 -10
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda.cu +6 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-kompute.cpp +7 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.m +410 -176
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.metal +654 -18
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-sycl.cpp +5 -1
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan.cpp +5 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml.c +360 -15
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml.h +20 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/llama.cpp +367 -197
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/llama.h +3 -2
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-backend-ops.cpp +48 -4
- llama_cpp_python-0.2.67/.git/FETCH_HEAD +0 -1
- llama_cpp_python-0.2.67/.git/HEAD +0 -1
- llama_cpp_python-0.2.67/.git/index +0 -0
- llama_cpp_python-0.2.67/.git/logs/HEAD +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/HEAD +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +0 -2
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.idx +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.rev +0 -0
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/packed-refs +0 -2
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/refs/tags/b2769 +0 -1
- llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/shallow +0 -1
- llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.idx +0 -0
- llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.rev +0 -0
- llama_cpp_python-0.2.67/.git/refs/tags/v0.2.67 +0 -1
- llama_cpp_python-0.2.67/.git/shallow +0 -1
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.dockerignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/config.worktree +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/description +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/info/exclude +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/description +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/FETCH_HEAD +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/HEAD +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/description +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/info/exclude +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/0c/588e19be7b9726e5ae8dae3569dea0fd990af1 +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/19/17e497d955de87fc0a472e21cf8fbf31112adf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/30/3b5ceb11c6e3878c575cd53d863e5edcbc4550 +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/45/65194ed7c32d1d2efa32ceab4d3c6cae006306 +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/packed-refs +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/refs/heads/master +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/shallow +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/dependabot.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-docker.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-wheels-cuda.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-wheels-metal.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/generate-index-from-release.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/publish-to-test.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/publish.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/test-pypi.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/test.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.gitmodules +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.readthedocs.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/LICENSE.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/cuda_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/build.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/hug_model.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/start.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/start_server.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/openblas_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/simple/run.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/api-reference.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/changelog.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/index.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/install/macos.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/server.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/batch-processing/server.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/gradio_chat/local.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/gradio_chat/server.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/hf_pull/main.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/fastapi_server.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_embedding.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_inference.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_streaming.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/langchain_custom_llm.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/Chat.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/Miku.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/ReasonAct.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/common.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/quantize.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/readme/low_level_api_llama_cpp.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/util.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Batching.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Clients.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Functions.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Guidance.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Multimodal.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/OpenHermesFunctionCalling.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/PerformanceTuning.ipynb +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_internals.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_logger.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_utils.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_cache.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_grammar.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_speculative.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_tokenizer.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_types.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llava_cpp.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/py.typed +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/__init__.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/__main__.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/app.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/cli.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/errors.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/model.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/types.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/mkdocs.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/pyproject.toml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/scripts/releases-to-pep-503.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_grammar.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_speculative.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.clang-tidy +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/apps.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/devshells.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/docker.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/jetson-support.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/nixpkgs-instances.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/package.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/scope.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/sif.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-intel.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-vulkan.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/tools.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.dockerignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.ecrc +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.editorconfig +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.flake8 +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.git +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/bench.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/close-issue.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-ci-aarch64.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-ci.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-flake-update.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-publish-flake.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/python-check-requirements.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/python-lint.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/server.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.gitmodules +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/AUTHORS +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/LICENSE +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/Package.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/README-sycl.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/SECURITY.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/build.zig +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ci/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/codecov.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/console.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/grammar-parser.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json-schema-to-grammar.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/log.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/ngram-cache.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/ngram-cache.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/stb_image.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/train.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/train.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/BLIS.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/HOWTO-add-model.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/llama-star/idea-arch.key +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/llama-star/idea-arch.pdf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/Miku.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/alpaca.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/base-translate.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/finetune.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gbnf-validator/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gbnf-validator/gbnf-validator.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/gguf-split.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/tests.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/gritlm.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/imatrix.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/json-schema-pydantic-example.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/json_schema_to_grammar.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Downloadable.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Llm.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainActivity.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainViewModel.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Color.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Theme.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Type.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_background.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_foreground.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher_round.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/themes.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/backup_rules.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/data_extraction_rules.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.jar +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle.properties +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradlew +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/settings.gradle.kts +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/AppIcon.appiconset/Contents.json +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/Contents.json +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Models/LlamaState.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/ContentView.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/DownloadButton.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/InputButton.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/LoadCustomButton.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/llama_swiftuiApp.swift +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.pbxproj +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/contents.xcworkspacedata +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.vim +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama2.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/MobileVLM-README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/android/adb_run.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/android/build_64.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/clip.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/clip.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-cli.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-surgery-v2.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llm.vim +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/main.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/make-ggml.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/pydantic-models-to-grammar-examples.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/pydantic_models_to_grammar.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/tests.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/reason-act.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/regex-to-grammar.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/prometheus.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/script.js +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/deps.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/httplib.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/index.html +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/index.js +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/embeddings.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/environment.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/issues.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/parallel.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/passkey.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/results.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/security.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/server.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/slotsave.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/steps/steps.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/wrong_usages.feature +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/tests.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/utils.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server-embd.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/build.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/run-llama2.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/win-build-sycl.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/win-run-llama2.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/tokenize/tokenize.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/ts-type-to-grammar.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/flake.lock +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/flake.nix +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-alloc.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend-impl.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-common.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/acc.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/acc.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/alibi.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/alibi.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/arange.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/arange.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/argsort.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/argsort.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/binbcast.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/binbcast.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/clamp.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/clamp.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/concat.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/concat.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/convert.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/convert.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/cpy.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/cpy.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dequantize.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/diagmask.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/diagmask.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dmmv.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dmmv.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/getrows.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/getrows.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/im2col.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/im2col.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmq.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmq.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmvq.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmvq.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/norm.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/norm.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pad.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pad.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pool2d.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pool2d.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/quantize.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/quantize.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/rope.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/rope.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/scale.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/scale.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/softmax.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/sumrows.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/sumrows.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/tsembd.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/tsembd.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/unary.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/unary.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/upscale.cu +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/upscale.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/vecdotq.cuh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-impl.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-kompute.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-mpi.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-mpi.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-opencl.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-quants.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-quants.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-sycl.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan-shaders.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml_vk_generate_shaders.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/examples/reader.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/examples/writer.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/constants.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf_reader.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf_writer.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/tensor_mapping.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/vocab.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/pyproject.toml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/__init__.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-dump.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-new-metadata.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-set-metadata.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/c.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/json.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/list.gbnf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.ccls +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.clang-format +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.dockerignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.git +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/cpp_examples.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/cpp_tests.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/python_tests.yml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CHANGELOG.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CNAME +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CODE_OF_CONDUCT.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CONTRIBUTING.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/GOVERNANCE.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/LICENSE +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/MANIFEST.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/SECURITY.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/VERSION +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/bin2h.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/bin_file_to_header.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/check_vulkan_version.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/code_coverage.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/deprecation_warnings.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/komputeConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/vulkan_shader_compiler.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/config/FindSphinx.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/KomputeBuilder.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/Swiftshader.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/VulkanSDK.Dockerfile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/Doxyfile.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/Makefile +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/assets/custom.css +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/assets/gcov.css +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/conf.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/genindex.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/android-editor.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/android-kompute.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/binder-cpp.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/binder-python.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-architecture.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-cpp-video.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-python-video.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-algorithm.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-manager.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opcreatetensor.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-operations.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opmult.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-sequence.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-tensor.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-godot-4.gif +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-logos.gif +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/logistic-regression.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/queue-allocation.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/suspicious.jfif +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/index.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/make.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/advanced-examples.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/async-parallel.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/build-system.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/ci-tests.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/community.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/convolutional-net.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/custom-operations.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/game-engine-godot.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/matmul-benchmark.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/memory-management.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/mobile-android.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-examples.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-package.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-reference.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/raspberry-pi.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/reference.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/shaders-to-headers.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/variable-types.rst +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/build.gradle +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/kompute.jpg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/komputer-2.gif +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeJniNative.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/java/com/ethicalml/kompute/KomputeJni.kt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/layout/activity_kompute_jni.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-anydpi-v26/kompute_icon.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-hdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-mdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon_foreground.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxxhdpi/ic_launcher.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/dimens.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/kompute_icon_background.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/styles.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values-w820dp/dimens.xml +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/build.gradle +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle.properties +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/settings.gradle +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/src/main.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/SCsub +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/config.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/include/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/project.godot +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/SCsub +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/config.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/include/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeGdNative.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_engine/.gdignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/DynamicExampleScene.tscn +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/TextFormat.theme +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/default_env.tres +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png.import +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/roboto.ttf +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/DynamicExampleScript.gd +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/project.godot +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/my_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/src/main.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/import_vgg7.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/out.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/run_vgg7.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_common.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_conv.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/w2wbinit.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/pi4_mesa_build/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/benchmark.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/first_example.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp1_naive.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp2_tiled.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp3_better_tiling.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/matmul_plot.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/external/bin/xxd.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/kompute-config.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/pylintrc +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/README.md +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/docstrings.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/main.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/utils.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/__init__.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/requirements-dev.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_array_multiplication.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_kompute.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_logistic_regression.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_tensor_types.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/utils.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/build_release_linux.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/build_release_windows.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/convert_shaders.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/push_folder_to_branch.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/setup.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Algorithm.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Core.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Manager.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpAlgoDispatch.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpBufferSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpBufferSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpMemoryBarrier.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorFill.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorSyncDevice.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorSyncLocal.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Sequence.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Tensor.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Algorithm.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Core.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Kompute.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Manager.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Sequence.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Tensor.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/logger/Logger.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpAlgoDispatch.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBase.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMemoryBarrier.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMult.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorCopy.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorFill.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncDevice.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncLocal.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/logger/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/logger/Logger.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.hpp.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.hpp.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/hlsl/computeheadless.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestAsyncOperations.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestDestroy.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestLogisticRegression.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestManager.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestMultipleAlgoExecutions.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpShadersFromStringAndFile.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorCopy.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorCreate.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorSync.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestPushConstant.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestSequence.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestSpecializationConstant.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestTensor.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestWorkgroup.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_logistic_regression.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_op_custom_shader.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_workgroup.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/Utils.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/Utils.hpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_logistic_regression_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_op_custom_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_workgroup_shader.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/vcpkg.json.opt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/common.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_add.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_addrow.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f16.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f32.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f16.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f32.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_diagmask.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_gelu.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_f16.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_0.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_1.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q6_k.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_f16.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_mat_f32.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_0.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_1.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q6_k.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q8_0.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n_pre.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_norm.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_relu.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rmsnorm.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rope_f16.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rope_f32.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_scale.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_scale_8.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_silu.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_softmax.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/rope_common.comp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama0-banner.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama0-logo.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama1-banner.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama1-logo.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/matmul.png +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/matmul.svg +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/mypy.ini +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/assistant.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-qwen.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/dan.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf-update.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/build-info.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/check-requirements.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/ci-run.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/compare-commits.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/compare-llama-bench.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/gen-authors.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/gen-build-info-cpp.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-flags.mk +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-hellaswag.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-pg.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-wikitext-103.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-winogrande.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/hf.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/install-oneapi.bat +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/pod-llama.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-with-preset.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml-am.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml.last +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/xxd.cmake +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/sgemm.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/sgemm.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/llama.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/.gitignore +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/run-json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grammar-integration.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0-bpe.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0-spm.py +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode-data.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode-data.h +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode.cpp +0 -0
- {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode.h +0 -0
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b14dd98922c7f18468ae202eadbaf58fe17f5320 'b14dd98922c7f18468ae202eadbaf58fe17f5320' of https://github.com/abetlen/llama-cpp-python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b14dd98922c7f18468ae202eadbaf58fe17f5320
|
|
@@ -9,7 +9,7 @@
|
|
|
9
9
|
[gc]
|
|
10
10
|
auto = 0
|
|
11
11
|
[http "https://github.com/"]
|
|
12
|
-
extraheader = AUTHORIZATION: basic
|
|
12
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
|
|
13
13
|
[submodule "vendor/llama.cpp"]
|
|
14
14
|
active = true
|
|
15
15
|
url = https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 b14dd98922c7f18468ae202eadbaf58fe17f5320 runner <runner@fv-az847-33.(none)> 1714484689 +0000 checkout: moving from master to refs/tags/v0.2.68
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
77e15bec6217a39be59b9cc83d6b9afb6b0d8167
|
|
@@ -16,7 +16,7 @@
|
|
|
16
16
|
[gc]
|
|
17
17
|
auto = 0
|
|
18
18
|
[http "https://github.com/"]
|
|
19
|
-
extraheader = AUTHORIZATION: basic
|
|
19
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
|
|
20
20
|
[url "https://github.com/"]
|
|
21
21
|
insteadOf = git@github.com:
|
|
22
22
|
insteadOf = org-6826477@github.com:
|
|
Binary file
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
2
|
+
77e15bec6217a39be59b9cc83d6b9afb6b0d8167 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484691 +0000 checkout: moving from master to 77e15bec6217a39be59b9cc83d6b9afb6b0d8167
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
[gc]
|
|
14
14
|
auto = 0
|
|
15
15
|
[http "https://github.com/"]
|
|
16
|
-
extraheader = AUTHORIZATION: basic
|
|
16
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
|
|
17
17
|
[url "https://github.com/"]
|
|
18
18
|
insteadOf = git@github.com:
|
|
19
19
|
insteadOf = org-6826477@github.com:
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
2
|
+
d1e3b0953cf66acc94b2e29693e221427b2c1f3f 4565194ed7c32d1d2efa32ceab4d3c6cae006306 runner <runner@fv-az847-33.(none)> 1714484692 +0000 checkout: moving from master to 4565194ed7c32d1d2efa32ceab4d3c6cae006306
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD
ADDED
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
77e15bec6217a39be59b9cc83d6b9afb6b0d8167
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
77e15bec6217a39be59b9cc83d6b9afb6b0d8167
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b14dd98922c7f18468ae202eadbaf58fe17f5320
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b14dd98922c7f18468ae202eadbaf58fe17f5320
|
{llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-and-release.yaml
RENAMED
|
@@ -39,7 +39,7 @@ jobs:
|
|
|
39
39
|
|
|
40
40
|
- uses: actions/upload-artifact@v4
|
|
41
41
|
with:
|
|
42
|
-
name: wheels
|
|
42
|
+
name: wheels-${{ matrix.os }}
|
|
43
43
|
path: ./wheelhouse/*.whl
|
|
44
44
|
|
|
45
45
|
build_wheels_arm64:
|
|
@@ -100,14 +100,9 @@ jobs:
|
|
|
100
100
|
runs-on: ubuntu-latest
|
|
101
101
|
|
|
102
102
|
steps:
|
|
103
|
-
-
|
|
104
|
-
uses: actions/upload-artifact/merge@v4
|
|
103
|
+
- uses: actions/download-artifact@v4
|
|
105
104
|
with:
|
|
106
|
-
|
|
107
|
-
|
|
108
|
-
- uses: actions/download-artifact@v3
|
|
109
|
-
with:
|
|
110
|
-
name: release
|
|
105
|
+
merge-multiple: true
|
|
111
106
|
path: dist
|
|
112
107
|
|
|
113
108
|
- uses: softprops/action-gh-release@v2
|
|
@@ -7,6 +7,12 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
7
7
|
|
|
8
8
|
## [Unreleased]
|
|
9
9
|
|
|
10
|
+
## [0.2.68]
|
|
11
|
+
|
|
12
|
+
- feat: Update llama.cpp to ggerganov/llama.cpp@
|
|
13
|
+
- feat: Add option to enable flash_attn to Lllama params and ModelSettings by @abetlen in 22d77eefd2edaf0148f53374d0cac74d0e25d06e
|
|
14
|
+
- fix(ci): Fix build-and-release.yaml by @Smartappli in #1413
|
|
15
|
+
|
|
10
16
|
## [0.2.67]
|
|
11
17
|
|
|
12
18
|
- fix: Ensure image renders before text in chat formats regardless of message content order by @abetlen in 3489ef09d3775f4a87fb7114f619e8ba9cb6b656
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.1
|
|
2
2
|
Name: llama_cpp_python
|
|
3
|
-
Version: 0.2.
|
|
3
|
+
Version: 0.2.68
|
|
4
4
|
Summary: Python bindings for the llama.cpp library
|
|
5
5
|
Author-Email: Andrei Betlen <abetlen@gmail.com>
|
|
6
6
|
License: MIT
|
|
@@ -165,7 +165,7 @@ CMAKE_ARGS="-DLLAMA_CUDA=on" pip install llama-cpp-python
|
|
|
165
165
|
|
|
166
166
|
It is also possible to install a pre-built wheel with CUDA support. As long as your system meets some requirements:
|
|
167
167
|
|
|
168
|
-
- CUDA Version is 12.1, 12.2 or 12.
|
|
168
|
+
- CUDA Version is 12.1, 12.2, 12.3, or 12.4
|
|
169
169
|
- Python Version is 3.10, 3.11 or 3.12
|
|
170
170
|
|
|
171
171
|
```bash
|
|
@@ -177,6 +177,7 @@ Where `<cuda-version>` is one of the following:
|
|
|
177
177
|
- `cu121`: CUDA 12.1
|
|
178
178
|
- `cu122`: CUDA 12.2
|
|
179
179
|
- `cu123`: CUDA 12.3
|
|
180
|
+
- `cu124`: CUDA 12.4
|
|
180
181
|
|
|
181
182
|
For example, to install the CUDA 12.1 wheel:
|
|
182
183
|
|
|
@@ -121,7 +121,7 @@ CMAKE_ARGS="-DLLAMA_CUDA=on" pip install llama-cpp-python
|
|
|
121
121
|
|
|
122
122
|
It is also possible to install a pre-built wheel with CUDA support. As long as your system meets some requirements:
|
|
123
123
|
|
|
124
|
-
- CUDA Version is 12.1, 12.2 or 12.
|
|
124
|
+
- CUDA Version is 12.1, 12.2, 12.3, or 12.4
|
|
125
125
|
- Python Version is 3.10, 3.11 or 3.12
|
|
126
126
|
|
|
127
127
|
```bash
|
|
@@ -133,6 +133,7 @@ Where `<cuda-version>` is one of the following:
|
|
|
133
133
|
- `cu121`: CUDA 12.1
|
|
134
134
|
- `cu122`: CUDA 12.2
|
|
135
135
|
- `cu123`: CUDA 12.3
|
|
136
|
+
- `cu124`: CUDA 12.4
|
|
136
137
|
|
|
137
138
|
For example, to install the CUDA 12.1 wheel:
|
|
138
139
|
|
|
@@ -92,6 +92,7 @@ class Llama:
|
|
|
92
92
|
logits_all: bool = False,
|
|
93
93
|
embedding: bool = False,
|
|
94
94
|
offload_kqv: bool = True,
|
|
95
|
+
flash_attn: bool = False,
|
|
95
96
|
# Sampling Params
|
|
96
97
|
last_n_tokens_size: int = 64,
|
|
97
98
|
# LoRA Params
|
|
@@ -168,6 +169,7 @@ class Llama:
|
|
|
168
169
|
logits_all: Return logits for all tokens, not just the last token. Must be True for completion to return logprobs.
|
|
169
170
|
embedding: Embedding mode only.
|
|
170
171
|
offload_kqv: Offload K, Q, V to GPU.
|
|
172
|
+
flash_attn: Use flash attention.
|
|
171
173
|
last_n_tokens_size: Maximum number of tokens to keep in the last_n_tokens deque.
|
|
172
174
|
lora_base: Optional path to base model, useful if using a quantized base model and you want to apply LoRA to an f16 model.
|
|
173
175
|
lora_path: Path to a LoRA file to apply to the model.
|
|
@@ -310,6 +312,7 @@ class Llama:
|
|
|
310
312
|
) # Must be set to True for speculative decoding
|
|
311
313
|
self.context_params.embeddings = embedding # TODO: Rename to embeddings
|
|
312
314
|
self.context_params.offload_kqv = offload_kqv
|
|
315
|
+
self.context_params.flash_attn = flash_attn
|
|
313
316
|
# KV cache quantization
|
|
314
317
|
if type_k is not None:
|
|
315
318
|
self.context_params.type_k = type_k
|
|
@@ -1774,6 +1777,7 @@ class Llama:
|
|
|
1774
1777
|
logits_all=self.context_params.logits_all,
|
|
1775
1778
|
embedding=self.context_params.embeddings,
|
|
1776
1779
|
offload_kqv=self.context_params.offload_kqv,
|
|
1780
|
+
flash_attn=self.context_params.flash_attn,
|
|
1777
1781
|
# Sampling Params
|
|
1778
1782
|
last_n_tokens_size=self.last_n_tokens_size,
|
|
1779
1783
|
# LoRA Params
|
|
@@ -242,8 +242,8 @@ LLAMA_FILE_MAGIC_GGSQ = 0x67677371
|
|
|
242
242
|
|
|
243
243
|
# define LLAMA_SESSION_MAGIC LLAMA_FILE_MAGIC_GGSN
|
|
244
244
|
LLAMA_SESSION_MAGIC = LLAMA_FILE_MAGIC_GGSN
|
|
245
|
-
# define LLAMA_SESSION_VERSION
|
|
246
|
-
LLAMA_SESSION_VERSION =
|
|
245
|
+
# define LLAMA_SESSION_VERSION 6
|
|
246
|
+
LLAMA_SESSION_VERSION = 6
|
|
247
247
|
|
|
248
248
|
# define LLAMA_STATE_SEQ_MAGIC LLAMA_FILE_MAGIC_GGSQ
|
|
249
249
|
LLAMA_STATE_SEQ_MAGIC = LLAMA_FILE_MAGIC_GGSQ
|
|
@@ -730,6 +730,7 @@ class llama_model_params(ctypes.Structure):
|
|
|
730
730
|
# bool logits_all; // the llama_decode() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
|
|
731
731
|
# bool embeddings; // if true, extract embeddings (together with logits)
|
|
732
732
|
# bool offload_kqv; // whether to offload the KQV ops (including the KV cache) to GPU
|
|
733
|
+
# bool flash_attn; // whether to use flash attention
|
|
733
734
|
|
|
734
735
|
|
|
735
736
|
# // Abort callback
|
|
@@ -766,6 +767,7 @@ class llama_context_params(ctypes.Structure):
|
|
|
766
767
|
logits_all (bool): the llama_eval() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
|
|
767
768
|
embeddings (bool): if true, extract embeddings (together with logits)
|
|
768
769
|
offload_kqv (bool): whether to offload the KQV ops (including the KV cache) to GPU
|
|
770
|
+
flash_attn (bool): whether to use flash attention
|
|
769
771
|
abort_callback (ggml_abort_callback): abort callback if it returns true, execution of llama_decode() will be aborted
|
|
770
772
|
abort_callback_data (ctypes.ctypes.c_void_p): data for abort_callback
|
|
771
773
|
"""
|
|
@@ -795,6 +797,7 @@ class llama_context_params(ctypes.Structure):
|
|
|
795
797
|
logits_all: bool
|
|
796
798
|
embeddings: bool
|
|
797
799
|
offload_kqv: bool
|
|
800
|
+
flash_attn: bool
|
|
798
801
|
abort_callback: Callable[[ctypes.c_void_p], bool]
|
|
799
802
|
abort_callback_data: ctypes.c_void_p
|
|
800
803
|
|
|
@@ -823,6 +826,7 @@ class llama_context_params(ctypes.Structure):
|
|
|
823
826
|
("logits_all", ctypes.c_bool),
|
|
824
827
|
("embeddings", ctypes.c_bool),
|
|
825
828
|
("offload_kqv", ctypes.c_bool),
|
|
829
|
+
("flash_attn", ctypes.c_bool),
|
|
826
830
|
("abort_callback", ggml_abort_callback),
|
|
827
831
|
("abort_callback_data", ctypes.c_void_p),
|
|
828
832
|
]
|
|
@@ -1615,7 +1619,7 @@ def llama_get_kv_cache_used_cells(ctx: llama_context_p, /) -> int:
|
|
|
1615
1619
|
...
|
|
1616
1620
|
|
|
1617
1621
|
|
|
1618
|
-
# // Clear the KV cache
|
|
1622
|
+
# // Clear the KV cache - both cell info is erased and KV data is zeroed
|
|
1619
1623
|
# LLAMA_API void llama_kv_cache_clear(
|
|
1620
1624
|
# struct llama_context * ctx);
|
|
1621
1625
|
@ctypes_function("llama_kv_cache_clear", [llama_context_p_ctypes], None)
|
|
@@ -96,6 +96,9 @@ class ModelSettings(BaseSettings):
|
|
|
96
96
|
offload_kqv: bool = Field(
|
|
97
97
|
default=True, description="Whether to offload kqv to the GPU."
|
|
98
98
|
)
|
|
99
|
+
flash_attn: bool = Field(
|
|
100
|
+
default=False, description="Whether to use flash attention."
|
|
101
|
+
)
|
|
99
102
|
# Sampling Params
|
|
100
103
|
last_n_tokens_size: int = Field(
|
|
101
104
|
default=64,
|
|
@@ -336,7 +336,8 @@ function gg_run_open_llama_3b_v2 {
|
|
|
336
336
|
|
|
337
337
|
(time ./bin/imatrix --model ${model_f16} -f ${wiki_test_60} -c 128 -b 128 --chunks 1 ) 2>&1 | tee -a $OUT/${ci}-imatrix.log
|
|
338
338
|
|
|
339
|
-
(time ./bin/save-load-state
|
|
339
|
+
(time ./bin/save-load-state --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
340
|
+
(time ./bin/save-load-state -fa --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
340
341
|
|
|
341
342
|
function check_ppl {
|
|
342
343
|
qnt="$1"
|
|
@@ -517,7 +518,10 @@ function gg_run_open_llama_7b_v2 {
|
|
|
517
518
|
|
|
518
519
|
(time ./bin/imatrix --model ${model_f16} -f ${wiki_test} -t 1 -ngl 999 -c 2048 -b 512 --chunks 4 ) 2>&1 | tee -a $OUT/${ci}-imatrix.log
|
|
519
520
|
|
|
520
|
-
(time ./bin/save-load-state --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
521
|
+
(time ./bin/save-load-state -ngl 10 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
522
|
+
(time ./bin/save-load-state -fa -ngl 10 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
523
|
+
(time ./bin/save-load-state -ngl 99 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
524
|
+
(time ./bin/save-load-state -fa -ngl 99 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
|
|
521
525
|
|
|
522
526
|
function check_ppl {
|
|
523
527
|
qnt="$1"
|
|
@@ -947,6 +947,10 @@ bool gpt_params_find_arg(int argc, char ** argv, const std::string & arg, gpt_pa
|
|
|
947
947
|
params.cont_batching = true;
|
|
948
948
|
return true;
|
|
949
949
|
}
|
|
950
|
+
if (arg == "-fa" || arg == "--flash-attn") {
|
|
951
|
+
params.flash_attn = true;
|
|
952
|
+
return true;
|
|
953
|
+
}
|
|
950
954
|
if (arg == "--color") {
|
|
951
955
|
params.use_color = true;
|
|
952
956
|
return true;
|
|
@@ -1513,6 +1517,7 @@ void gpt_print_usage(int /*argc*/, char ** argv, const gpt_params & params) {
|
|
|
1513
1517
|
printf(" -ns N, --sequences N number of sequences to decode (default: %d)\n", params.n_sequences);
|
|
1514
1518
|
printf(" -ps N, --p-split N speculative decoding split probability (default: %.1f)\n", (double)params.p_split);
|
|
1515
1519
|
printf(" -cb, --cont-batching enable continuous batching (a.k.a dynamic batching) (default: disabled)\n");
|
|
1520
|
+
printf(" -fa, --flash-attn enable Flash Attention (default: %s)\n", params.flash_attn ? "enabled" : "disabled");
|
|
1516
1521
|
printf(" --mmproj MMPROJ_FILE path to a multimodal projector file for LLaVA. see examples/llava/README.md\n");
|
|
1517
1522
|
printf(" --image IMAGE_FILE path to an image file. use with multimodal models. Specify multiple times for batching\n");
|
|
1518
1523
|
if (llama_supports_mlock()) {
|
|
@@ -1885,6 +1890,7 @@ struct llama_context_params llama_context_params_from_gpt_params(const gpt_param
|
|
|
1885
1890
|
cparams.cb_eval = params.cb_eval;
|
|
1886
1891
|
cparams.cb_eval_user_data = params.cb_eval_user_data;
|
|
1887
1892
|
cparams.offload_kqv = !params.no_kv_offload;
|
|
1893
|
+
cparams.flash_attn = params.flash_attn;
|
|
1888
1894
|
|
|
1889
1895
|
cparams.type_k = kv_cache_type_from_str(params.cache_type_k);
|
|
1890
1896
|
cparams.type_v = kv_cache_type_from_str(params.cache_type_v);
|
|
@@ -2707,6 +2713,7 @@ void dump_non_result_info_yaml(FILE * stream, const gpt_params & params, const l
|
|
|
2707
2713
|
fprintf(stream, "seed: %u # default: -1 (random seed)\n", params.seed);
|
|
2708
2714
|
fprintf(stream, "simple_io: %s # default: false\n", params.simple_io ? "true" : "false");
|
|
2709
2715
|
fprintf(stream, "cont_batching: %s # default: false\n", params.cont_batching ? "true" : "false");
|
|
2716
|
+
fprintf(stream, "flash_attn: %s # default: false\n", params.flash_attn ? "true" : "false");
|
|
2710
2717
|
fprintf(stream, "temp: %f # default: 0.8\n", sparams.temp);
|
|
2711
2718
|
|
|
2712
2719
|
const std::vector<float> tensor_split_vector(params.tensor_split, params.tensor_split + llama_max_devices());
|
|
@@ -150,6 +150,7 @@ struct gpt_params {
|
|
|
150
150
|
bool multiline_input = false; // reverse the usage of `\`
|
|
151
151
|
bool simple_io = false; // improves compatibility with subprocesses and limited consoles
|
|
152
152
|
bool cont_batching = true; // insert new sequences for decoding on-the-fly
|
|
153
|
+
bool flash_attn = false; // flash attention
|
|
153
154
|
|
|
154
155
|
bool input_prefix_bos = false; // prefix BOS to user inputs, preceding input_prefix
|
|
155
156
|
bool ignore_eos = false; // ignore generated EOS tokens
|
{llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-hf-to-gguf-update.py
RENAMED
|
@@ -128,7 +128,7 @@ for model in models:
|
|
|
128
128
|
print(f"chkhsh: {chkhsh}")
|
|
129
129
|
|
|
130
130
|
# print the "pre_tokenizer" content from the tokenizer.json
|
|
131
|
-
with open(f"models/tokenizers/{name}/tokenizer.json", "r") as f:
|
|
131
|
+
with open(f"models/tokenizers/{name}/tokenizer.json", "r", encoding="utf-8") as f:
|
|
132
132
|
cfg = json.load(f)
|
|
133
133
|
pre_tokenizer = cfg["pre_tokenizer"]
|
|
134
134
|
print("pre_tokenizer: " + json.dumps(pre_tokenizer, indent=4))
|
|
@@ -156,15 +156,19 @@ src_func += " print(f\"chkhsh: {chkhsh}\")\n"
|
|
|
156
156
|
src_func += "\n"
|
|
157
157
|
src_func += " res = None\n"
|
|
158
158
|
src_func += "\n"
|
|
159
|
-
src_func += " # NOTE: if you get an error here, you need to
|
|
160
|
-
src_func += " #
|
|
159
|
+
src_func += " # NOTE: if you get an error here, you need to update the convert-hf-to-gguf-update.py script\n"
|
|
160
|
+
src_func += " # or pull the latest version of the model from Huggingface\n"
|
|
161
|
+
src_func += " # don't edit the hashes manually!\n"
|
|
161
162
|
src_func += f"{src_ifs}\n"
|
|
162
163
|
src_func += " if res is None:\n"
|
|
163
164
|
src_func += " print(\"\\n\")\n"
|
|
164
165
|
src_func += " print(\"**************************************************************************************\")\n"
|
|
165
166
|
src_func += " print(\"** WARNING: The BPE pre-tokenizer was not recognized!\")\n"
|
|
166
|
-
src_func += " print(\"**
|
|
167
|
-
src_func += " print(\"**
|
|
167
|
+
src_func += " print(\"** There are 2 possible reasons for this:\")\n"
|
|
168
|
+
src_func += " print(\"** - the model has not been added to convert-hf-to-gguf-update.py yet\")\n"
|
|
169
|
+
src_func += " print(\"** - the pre-tokenization config has changed upstream\")\n"
|
|
170
|
+
src_func += " print(\"** Check your model files and convert-hf-to-gguf-update.py and update them accordingly.\")\n"
|
|
171
|
+
src_func += " print(\"** ref: https://github.com/ggerganov/llama.cpp/pull/6920\")\n"
|
|
168
172
|
src_func += " print(\"**\")\n"
|
|
169
173
|
src_func += " print(f\"** chkhsh: {chkhsh}\")\n"
|
|
170
174
|
src_func += " print(\"**************************************************************************************\")\n"
|
|
@@ -249,7 +253,7 @@ for model in models:
|
|
|
249
253
|
from transformers import AutoTokenizer
|
|
250
254
|
tokenizer = AutoTokenizer.from_pretrained(f"models/tokenizers/{name}")
|
|
251
255
|
|
|
252
|
-
with open(f"models/ggml-vocab-{name}.gguf.inp", "w") as f:
|
|
256
|
+
with open(f"models/ggml-vocab-{name}.gguf.inp", "w", encoding="utf-8") as f:
|
|
253
257
|
for text in tests:
|
|
254
258
|
f.write(f"{text}")
|
|
255
259
|
f.write("\n__ggml_vocab_test__\n")
|
|
@@ -279,8 +279,9 @@ class Model(ABC):
|
|
|
279
279
|
|
|
280
280
|
res = None
|
|
281
281
|
|
|
282
|
-
# NOTE: if you get an error here, you need to
|
|
283
|
-
#
|
|
282
|
+
# NOTE: if you get an error here, you need to update the convert-hf-to-gguf-update.py script
|
|
283
|
+
# or pull the latest version of the model from Huggingface
|
|
284
|
+
# don't edit the hashes manually!
|
|
284
285
|
if chkhsh == "0ef9807a4087ebef797fc749390439009c3b9eda9ad1a097abbe738f486c01e5":
|
|
285
286
|
# ref: https://huggingface.co/meta-llama/Meta-Llama-3-8B
|
|
286
287
|
res = "llama-bpe"
|
|
@@ -310,8 +311,11 @@ class Model(ABC):
|
|
|
310
311
|
print("\n")
|
|
311
312
|
print("**************************************************************************************")
|
|
312
313
|
print("** WARNING: The BPE pre-tokenizer was not recognized!")
|
|
313
|
-
print("**
|
|
314
|
-
print("**
|
|
314
|
+
print("** There are 2 possible reasons for this:")
|
|
315
|
+
print("** - the model has not been added to convert-hf-to-gguf-update.py yet")
|
|
316
|
+
print("** - the pre-tokenization config has changed upstream")
|
|
317
|
+
print("** Check your model files and convert-hf-to-gguf-update.py and update them accordingly.")
|
|
318
|
+
print("** ref: https://github.com/ggerganov/llama.cpp/pull/6920")
|
|
315
319
|
print("**")
|
|
316
320
|
print(f"** chkhsh: {chkhsh}")
|
|
317
321
|
print("**************************************************************************************")
|
|
@@ -32,7 +32,7 @@ int main(int argc, char ** argv) {
|
|
|
32
32
|
gpt_params params;
|
|
33
33
|
|
|
34
34
|
if (argc == 1 || argv[1][0] == '-') {
|
|
35
|
-
printf("usage: %s MODEL_PATH [N_KV_MAX] [N_BATCH] [N_UBATCH] [IS_PP_SHARED] [NGL] <PP> <TG> <PL>\n" , argv[0]);
|
|
35
|
+
printf("usage: %s MODEL_PATH [N_KV_MAX] [N_BATCH] [N_UBATCH] [FATTN] [IS_PP_SHARED] [NGL] <PP> <TG> <PL>\n" , argv[0]);
|
|
36
36
|
printf(" <PP>, <TG> and PL are comma-separated lists of numbers without spaces\n\n");
|
|
37
37
|
printf(" example: %s ggml-model-f16.gguf 2048 2048 512 0 999 128,256,512 128,256 1,2,4,8,16,32\n\n", argv[0]);
|
|
38
38
|
return 1 ;
|
|
@@ -41,6 +41,7 @@ int main(int argc, char ** argv) {
|
|
|
41
41
|
int n_kv_max = 2048;
|
|
42
42
|
int n_batch = 2048;
|
|
43
43
|
int n_ubatch = 512;
|
|
44
|
+
bool flash_attn = false;
|
|
44
45
|
int is_pp_shared = 0;
|
|
45
46
|
int n_gpu_layers = 0;
|
|
46
47
|
|
|
@@ -66,23 +67,27 @@ int main(int argc, char ** argv) {
|
|
|
66
67
|
}
|
|
67
68
|
|
|
68
69
|
if (argc >= 6) {
|
|
69
|
-
|
|
70
|
+
flash_attn = std::atoi(argv[5]);
|
|
70
71
|
}
|
|
71
72
|
|
|
72
73
|
if (argc >= 7) {
|
|
73
|
-
|
|
74
|
+
is_pp_shared = std::atoi(argv[6]);
|
|
74
75
|
}
|
|
75
76
|
|
|
76
77
|
if (argc >= 8) {
|
|
77
|
-
|
|
78
|
+
n_gpu_layers = std::atoi(argv[7]);
|
|
78
79
|
}
|
|
79
80
|
|
|
80
81
|
if (argc >= 9) {
|
|
81
|
-
|
|
82
|
+
n_pp = parse_list(argv[8]);
|
|
82
83
|
}
|
|
83
84
|
|
|
84
85
|
if (argc >= 10) {
|
|
85
|
-
|
|
86
|
+
n_tg = parse_list(argv[9]);
|
|
87
|
+
}
|
|
88
|
+
|
|
89
|
+
if (argc >= 11) {
|
|
90
|
+
n_pl = parse_list(argv[10]);
|
|
86
91
|
}
|
|
87
92
|
|
|
88
93
|
// init LLM
|
|
@@ -108,10 +113,11 @@ int main(int argc, char ** argv) {
|
|
|
108
113
|
|
|
109
114
|
llama_context_params ctx_params = llama_context_default_params();
|
|
110
115
|
|
|
111
|
-
ctx_params.seed
|
|
112
|
-
ctx_params.n_ctx
|
|
113
|
-
ctx_params.n_batch
|
|
114
|
-
ctx_params.n_ubatch
|
|
116
|
+
ctx_params.seed = 1234;
|
|
117
|
+
ctx_params.n_ctx = n_kv_max;
|
|
118
|
+
ctx_params.n_batch = n_batch;
|
|
119
|
+
ctx_params.n_ubatch = n_ubatch;
|
|
120
|
+
ctx_params.flash_attn = flash_attn;
|
|
115
121
|
|
|
116
122
|
ctx_params.n_threads = params.n_threads;
|
|
117
123
|
ctx_params.n_threads_batch = params.n_threads_batch == -1 ? params.n_threads : params.n_threads_batch;
|
|
@@ -169,7 +175,7 @@ int main(int argc, char ** argv) {
|
|
|
169
175
|
}
|
|
170
176
|
|
|
171
177
|
LOG_TEE("\n");
|
|
172
|
-
LOG_TEE("%s: n_kv_max = %d, n_batch = %d, n_ubatch = %d, is_pp_shared = %d, n_gpu_layers = %d, n_threads = %u, n_threads_batch = %u\n", __func__, n_kv_max, n_batch, n_ubatch, is_pp_shared, n_gpu_layers, ctx_params.n_threads, ctx_params.n_threads_batch);
|
|
178
|
+
LOG_TEE("%s: n_kv_max = %d, n_batch = %d, n_ubatch = %d, flash_attn = %d, is_pp_shared = %d, n_gpu_layers = %d, n_threads = %u, n_threads_batch = %u\n", __func__, n_kv_max, n_batch, n_ubatch, flash_attn, is_pp_shared, n_gpu_layers, ctx_params.n_threads, ctx_params.n_threads_batch);
|
|
173
179
|
LOG_TEE("\n");
|
|
174
180
|
|
|
175
181
|
LOG_TEE("|%6s | %6s | %4s | %6s | %8s | %8s | %8s | %8s | %8s | %8s |\n", "PP", "TG", "B", "N_KV", "T_PP s", "S_PP t/s", "T_TG s", "S_TG t/s", "T s", "S t/s");
|