llama-cpp-python 0.2.38__tar.gz → 0.2.39__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- llama_cpp_python-0.2.39/.git/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.39/.git/HEAD +1 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/config +1 -1
- llama_cpp_python-0.2.39/.git/index +0 -0
- llama_cpp_python-0.2.39/.git/logs/HEAD +1 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/HEAD +1 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/config +1 -1
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/95/161b3f4b3d6c1c35e9f423a1a933b0735bec4f +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/b0/8f22c882a1443e6b97081f3ce718a4d1a741f8 +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/dd/fe289fed86e1d59a21ea2d6f625ff44620eec5 +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/pack/pack-d5af55203ef291c34ac81ee488254e42e1f134d3.idx +0 -0
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/objects/pack/pack-840f4459d494ce7fd10b79596f309b54b31652b8.pack → llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/pack/pack-d5af55203ef291c34ac81ee488254e42e1f134d3.pack +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/objects/pack/pack-d5af55203ef291c34ac81ee488254e42e1f134d3.rev +0 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/packed-refs +2 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
- llama_cpp_python-0.2.39/.git/modules/vendor/llama.cpp/shallow +2 -0
- llama_cpp_python-0.2.39/.git/objects/pack/pack-b1310bf828284f1e9291e80af9059046b7d97b6b.idx +0 -0
- llama_cpp_python-0.2.38/.git/objects/pack/pack-a38d8e19feb0b2901a657ea0b79846878599b3fc.pack → llama_cpp_python-0.2.39/.git/objects/pack/pack-b1310bf828284f1e9291e80af9059046b7d97b6b.pack +0 -0
- llama_cpp_python-0.2.39/.git/objects/pack/pack-b1310bf828284f1e9291e80af9059046b7d97b6b.rev +0 -0
- llama_cpp_python-0.2.39/.git/refs/tags/v0.2.39 +1 -0
- llama_cpp_python-0.2.39/.git/shallow +1 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/CHANGELOG.md +6 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/PKG-INFO +1 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/__init__.py +1 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/_internals.py +20 -31
- llama_cpp_python-0.2.39/llama_cpp/_logger.py +37 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama.py +4 -3
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_cpp.py +2 -2
- llama_cpp_python-0.2.39/vendor/llama.cpp/.devops/main-intel.Dockerfile +28 -0
- llama_cpp_python-0.2.39/vendor/llama.cpp/.devops/main-vulkan.Dockerfile +29 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/package.nix +17 -4
- llama_cpp_python-0.2.39/vendor/llama.cpp/.devops/server-intel.Dockerfile +28 -0
- llama_cpp_python-0.2.39/vendor/llama.cpp/.devops/server-vulkan.Dockerfile +29 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/CMakeLists.txt +23 -3
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/Makefile +142 -54
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/README-sycl.md +119 -49
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/README.md +98 -35
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/build-info.cpp +1 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/common.cpp +18 -4
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/common.h +1 -2
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/convert-hf-to-gguf.py +178 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/convert.py +7 -3
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/imatrix/imatrix.cpp +112 -4
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama-bench/README.md +21 -13
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +70 -22
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main/main.cpp +2 -2
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +6 -6
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/quantize/quantize.cpp +2 -2
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +2 -2
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/README.md +19 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/server.cpp +63 -33
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/win-run-llama2.bat +1 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/flake.lock +9 -9
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/flake.nix +1 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-cuda.cu +101 -145
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-impl.h +2 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-quants.c +39 -94
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-quants.h +68 -59
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-sycl.cpp +204 -116
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-sycl.h +2 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-vulkan-shaders.hpp +1585 -10719
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-vulkan.cpp +258 -179
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml.c +6 -3
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml_vk_generate_shaders.py +90 -126
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/constants.py +18 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/gguf_writer.py +3 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/tensor_mapping.py +12 -2
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/llama.cpp +230 -29
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/llama.h +1 -1
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/server-llm.sh +75 -43
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-llama-grammar.cpp +1 -1
- llama_cpp_python-0.2.38/.git/FETCH_HEAD +0 -1
- llama_cpp_python-0.2.38/.git/HEAD +0 -1
- llama_cpp_python-0.2.38/.git/index +0 -0
- llama_cpp_python-0.2.38/.git/logs/HEAD +0 -1
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/HEAD +0 -1
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/objects/pack/pack-840f4459d494ce7fd10b79596f309b54b31652b8.idx +0 -0
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/objects/pack/pack-840f4459d494ce7fd10b79596f309b54b31652b8.rev +0 -0
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/packed-refs +0 -2
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
- llama_cpp_python-0.2.38/.git/modules/vendor/llama.cpp/shallow +0 -1
- llama_cpp_python-0.2.38/.git/objects/pack/pack-a38d8e19feb0b2901a657ea0b79846878599b3fc.idx +0 -0
- llama_cpp_python-0.2.38/.git/objects/pack/pack-a38d8e19feb0b2901a657ea0b79846878599b3fc.rev +0 -0
- llama_cpp_python-0.2.38/.git/refs/tags/v0.2.38 +0 -1
- llama_cpp_python-0.2.38/.git/shallow +0 -1
- llama_cpp_python-0.2.38/vendor/llama.cpp/.devops/main-intel.Dockerfile +0 -26
- llama_cpp_python-0.2.38/vendor/llama.cpp/.devops/server-intel.Dockerfile +0 -25
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.dockerignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/description +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/info/exclude +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/description +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/dependabot.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/build-and-release.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/build-docker.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/publish-to-test.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/publish.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/test-pypi.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.github/workflows/test.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.gitmodules +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/.readthedocs.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/LICENSE.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/Makefile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/cuda_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/open_llama/Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/open_llama/build.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/open_llama/hug_model.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/open_llama/start.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/open_llama/start_server.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/openblas_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docker/simple/run.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/api-reference.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/changelog.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/index.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/install/macos.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/requirements.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/docs/server.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/high_level_api/fastapi_server.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/high_level_api/high_level_api_embedding.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/high_level_api/high_level_api_inference.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/high_level_api/high_level_api_streaming.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/high_level_api/langchain_custom_llm.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/Chat.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/Miku.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/ReasonAct.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/common.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/quantize.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/readme/low_level_api_llama_cpp.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/low_level_api/util.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/Batching.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/Clients.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/Functions.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/Guidance.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/Multimodal.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/examples/notebooks/PerformanceTuning.ipynb +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/_utils.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_cache.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_grammar.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_speculative.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llama_types.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/llava_cpp.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/py.typed +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/__init__.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/__main__.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/app.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/cli.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/errors.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/model.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/settings.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/llama_cpp/server/types.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/mkdocs.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/pyproject.toml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/tests/test_grammar.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/tests/test_llama.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/tests/test_llama_chat_format.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/tests/test_llama_speculative.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.clang-tidy +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/apps.nix +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/devshells.nix +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/jetson-support.nix +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/nixpkgs-instances.nix +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/scope.nix +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/server-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/server-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/server.Dockerfile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/tools.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.dockerignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.ecrc +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.editorconfig +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.flake8 +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.git +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/nix-ci-aarch64.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/nix-ci.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/nix-flake-update.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/nix-publish-flake.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/python-check-requirements.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/python-lint.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/tidy-post.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/tidy-review.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.gitmodules +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/LICENSE +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/Package.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/SHA256SUMS +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/awq-py/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/awq-py/awq/apply_awq.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/awq-py/requirements.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/build.zig +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ci/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ci/run.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/codecov.yml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/console.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/grammar-parser.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/log.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/stb_image.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/train.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/common/train.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/docs/BLIS.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/docs/llama-star/idea-arch.key +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/docs/llama-star/idea-arch.pdf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/Miku.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/alpaca.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/base-translate.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/chat.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/embedding/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/finetune/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/finetune/finetune.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/imatrix/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/infill/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/json-schema-to-grammar.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/proguard-rules.pro +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/AndroidManifest.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Downloadable.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Llm.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainActivity.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainViewModel.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Color.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Theme.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Type.kt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_background.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_foreground.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher_round.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher_round.webp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/colors.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/strings.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/themes.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/backup_rules.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/data_extraction_rules.xml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/build.gradle.kts +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.jar +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.properties +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/gradle.properties +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/gradlew +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.android/settings.gradle.kts +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/AppIcon.appiconset/Contents.json +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/Contents.json +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Models/LlamaState.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/ContentView.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/DownloadButton.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/InputButton.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/LoadCustomButton.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/llama_swiftuiApp.swift +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.pbxproj +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/contents.xcworkspacedata +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama.vim +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llama2.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/MobileVLM-README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/android/adb_run.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/android/build_64.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/clip.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/clip.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/llava-cli.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/llava.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llava/llava.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/llm.vim +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookahead/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookup/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/make-ggml.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/parallel/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/passkey/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/pydantic-models-to-grammar-examples.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/pydantic_models_to_grammar.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/quantize/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/reason-act.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/api_like_OAI.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/chat.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/completion.js.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/deps.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/httplib.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/index.html.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/index.js.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/json-schema-to-grammar.mjs.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/json.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/oai.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/public/index.html +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/public/index.js +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server/utils.hpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/simple/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/speculative/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/build.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/run-llama2.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/sycl/win-build-sycl.bat +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/tokenize/tokenize.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-alloc.c +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-backend-impl.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-backend.c +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-cuda.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-kompute.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-kompute.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-metal.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-metal.m +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-metal.metal +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-mpi.c +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-mpi.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-opencl.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml-vulkan.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/ggml.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/examples/writer.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/gguf_reader.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/gguf/vocab.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/pyproject.toml +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/scripts/__init__.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/scripts/gguf-dump.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/scripts/gguf-set-metadata.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/README.md +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/c.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/json.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/grammars/list.gbnf +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/common.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_add.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_addrow.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f16.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f32.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f16.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f32.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_diagmask.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_gelu.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_getrows.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_getrows_f16.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_0.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_1.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_getrows_q6_k.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_f16.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_mat_f32.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_0.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_1.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q6_k.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q8_0.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n_pre.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_norm.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_relu.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_rmsnorm.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_rope_f16.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_rope_f32.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_scale.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_scale_8.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_silu.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/op_softmax.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/kompute-shaders/rope_common.comp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/media/llama0-banner.png +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/media/llama0-logo.png +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/media/llama1-banner.png +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/media/llama1-logo.png +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/mypy.ini +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/assistant.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat-with-qwen.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/chat.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/dan.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements/requirements-convert.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/requirements.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/build-info.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/check-requirements.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/ci-run.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/compare-llama-bench.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/gen-build-info-cpp.cmake +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/get-flags.mk +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/get-hellaswag.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/get-pg.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/get-winogrande.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/install-oneapi.bat +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/run-with-preset.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/sync-ggml-am.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/sync-ggml.last +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/spm-headers/llama.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/.gitignore +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-0-llama.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-0-llama.py +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/tests/test-tokenizer-1-llama.cpp +0 -0
- {llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/unicode.h +0 -0
|
@@ -0,0 +1 @@
|
|
|
1
|
+
34f31040f610925552a66b3a033e31320b6f6ad8 '34f31040f610925552a66b3a033e31320b6f6ad8' of https://github.com/abetlen/llama-cpp-python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
34f31040f610925552a66b3a033e31320b6f6ad8
|
|
@@ -9,7 +9,7 @@
|
|
|
9
9
|
[gc]
|
|
10
10
|
auto = 0
|
|
11
11
|
[http "https://github.com/"]
|
|
12
|
-
extraheader = AUTHORIZATION: basic
|
|
12
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX3J2Wk5WNnkzdklaWVhQWDVqc2F4NXZUUTJQdXpUcDRCUXVHSQ==
|
|
13
13
|
[submodule "vendor/llama.cpp"]
|
|
14
14
|
active = true
|
|
15
15
|
url = https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 34f31040f610925552a66b3a033e31320b6f6ad8 runner <runner@fv-az1019-910.m5ch4o5xfz2e5czaqtqza4205h.dx.internal.cloudapp.net> 1707241738 +0000 checkout: moving from master to refs/tags/v0.2.39
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b08f22c882a1443e6b97081f3ce718a4d1a741f8 'b08f22c882a1443e6b97081f3ce718a4d1a741f8' of https://github.com/ggerganov/llama.cpp
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b08f22c882a1443e6b97081f3ce718a4d1a741f8
|
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
[gc]
|
|
14
14
|
auto = 0
|
|
15
15
|
[http "https://github.com/"]
|
|
16
|
-
extraheader = AUTHORIZATION: basic
|
|
16
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX3J2Wk5WNnkzdklaWVhQWDVqc2F4NXZUUTJQdXpUcDRCUXVHSQ==
|
|
17
17
|
[url "https://github.com/"]
|
|
18
18
|
insteadOf = git@github.com:
|
|
19
19
|
insteadOf = org-6826477@github.com:
|
|
Binary file
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 17c97fb0620448b37516a3f53fea6c482b0a30a4 runner <runner@fv-az1019-910.m5ch4o5xfz2e5czaqtqza4205h.dx.internal.cloudapp.net> 1707241739 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
2
|
+
17c97fb0620448b37516a3f53fea6c482b0a30a4 b08f22c882a1443e6b97081f3ce718a4d1a741f8 runner <runner@fv-az1019-910.m5ch4o5xfz2e5czaqtqza4205h.dx.internal.cloudapp.net> 1707241741 +0000 checkout: moving from master to b08f22c882a1443e6b97081f3ce718a4d1a741f8
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 17c97fb0620448b37516a3f53fea6c482b0a30a4 runner <runner@fv-az1019-910.m5ch4o5xfz2e5czaqtqza4205h.dx.internal.cloudapp.net> 1707241739 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 17c97fb0620448b37516a3f53fea6c482b0a30a4 runner <runner@fv-az1019-910.m5ch4o5xfz2e5czaqtqza4205h.dx.internal.cloudapp.net> 1707241739 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
17c97fb0620448b37516a3f53fea6c482b0a30a4
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
34f31040f610925552a66b3a033e31320b6f6ad8
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
34f31040f610925552a66b3a033e31320b6f6ad8
|
|
@@ -7,11 +7,16 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
7
7
|
|
|
8
8
|
## [Unreleased]
|
|
9
9
|
|
|
10
|
+
## [0.2.39]
|
|
11
|
+
|
|
12
|
+
- feat: Update llama.cpp to ggerganov/llama.cpp@b08f22c882a1443e6b97081f3ce718a4d1a741f8
|
|
13
|
+
- fix: Fix destructor logging bugs by using llama_log_callback to avoid suppress_stdout_stderr by @abetlen in 59760c85eddc72dfcc1839f43760ef72c23d6874
|
|
14
|
+
|
|
10
15
|
## [0.2.38]
|
|
11
16
|
|
|
12
17
|
- feat: Update llama.cpp to ggerganov/llama.cpp@1cfb5372cf5707c8ec6dde7c874f4a44a6c4c915
|
|
13
18
|
- feat: Add speculative decoding by @abetlen in #1120
|
|
14
|
-
- fix: Pass raise_exception and add_generation_prompt to jinja2 chat template 078cca0361bf5a94d2cf52ed04980d20e32d6f95
|
|
19
|
+
- fix: Pass raise_exception and add_generation_prompt to jinja2 chat template by @abetlen in 078cca0361bf5a94d2cf52ed04980d20e32d6f95
|
|
15
20
|
|
|
16
21
|
## [0.2.37]
|
|
17
22
|
|
|
@@ -18,8 +18,6 @@ from .llama_grammar import LlamaGrammar
|
|
|
18
18
|
|
|
19
19
|
import llama_cpp.llama_cpp as llama_cpp
|
|
20
20
|
|
|
21
|
-
from ._utils import suppress_stdout_stderr
|
|
22
|
-
|
|
23
21
|
|
|
24
22
|
# Python wrappers over llama.h structs
|
|
25
23
|
|
|
@@ -30,7 +28,6 @@ class _LlamaModel:
|
|
|
30
28
|
|
|
31
29
|
_llama_free_model = None
|
|
32
30
|
# NOTE: this must be "saved" here to avoid exceptions when calling __del__
|
|
33
|
-
_suppress_stdout_stderr = suppress_stdout_stderr
|
|
34
31
|
|
|
35
32
|
def __init__(
|
|
36
33
|
self,
|
|
@@ -48,16 +45,14 @@ class _LlamaModel:
|
|
|
48
45
|
if not os.path.exists(path_model):
|
|
49
46
|
raise ValueError(f"Model path does not exist: {path_model}")
|
|
50
47
|
|
|
51
|
-
|
|
52
|
-
self.
|
|
53
|
-
|
|
54
|
-
)
|
|
48
|
+
self.model = llama_cpp.llama_load_model_from_file(
|
|
49
|
+
self.path_model.encode("utf-8"), self.params
|
|
50
|
+
)
|
|
55
51
|
|
|
56
52
|
def __del__(self):
|
|
57
|
-
|
|
58
|
-
|
|
59
|
-
|
|
60
|
-
self.model = None
|
|
53
|
+
if self.model is not None and self._llama_free_model is not None:
|
|
54
|
+
self._llama_free_model(self.model)
|
|
55
|
+
self.model = None
|
|
61
56
|
|
|
62
57
|
def vocab_type(self) -> int:
|
|
63
58
|
assert self.model is not None
|
|
@@ -240,8 +235,6 @@ class _LlamaContext:
|
|
|
240
235
|
NOTE: For stability it's recommended you use the Llama class instead."""
|
|
241
236
|
|
|
242
237
|
_llama_free = None
|
|
243
|
-
# NOTE: this must be "saved" here to avoid exceptions when calling __del__
|
|
244
|
-
_suppress_stdout_stderr = suppress_stdout_stderr
|
|
245
238
|
|
|
246
239
|
def __init__(
|
|
247
240
|
self,
|
|
@@ -256,16 +249,16 @@ class _LlamaContext:
|
|
|
256
249
|
|
|
257
250
|
self._llama_free = llama_cpp._lib.llama_free # type: ignore
|
|
258
251
|
|
|
259
|
-
|
|
260
|
-
|
|
261
|
-
|
|
262
|
-
|
|
252
|
+
assert self.model.model is not None
|
|
253
|
+
|
|
254
|
+
self.ctx = llama_cpp.llama_new_context_with_model(
|
|
255
|
+
self.model.model, self.params
|
|
256
|
+
)
|
|
263
257
|
|
|
264
258
|
def __del__(self):
|
|
265
|
-
|
|
266
|
-
|
|
267
|
-
|
|
268
|
-
self.ctx = None
|
|
259
|
+
if self.ctx is not None and self._llama_free is not None:
|
|
260
|
+
self._llama_free(self.ctx)
|
|
261
|
+
self.ctx = None
|
|
269
262
|
|
|
270
263
|
def n_ctx(self) -> int:
|
|
271
264
|
assert self.ctx is not None
|
|
@@ -493,8 +486,6 @@ class _LlamaContext:
|
|
|
493
486
|
|
|
494
487
|
class _LlamaBatch:
|
|
495
488
|
_llama_batch_free = None
|
|
496
|
-
# NOTE: this must be "saved" here to avoid exceptions when calling __del__
|
|
497
|
-
_suppress_stdout_stderr = suppress_stdout_stderr
|
|
498
489
|
|
|
499
490
|
def __init__(
|
|
500
491
|
self, *, n_tokens: int, embd: int, n_seq_max: int, verbose: bool = True
|
|
@@ -506,16 +497,14 @@ class _LlamaBatch:
|
|
|
506
497
|
|
|
507
498
|
self._llama_batch_free = llama_cpp._lib.llama_batch_free # type: ignore
|
|
508
499
|
|
|
509
|
-
|
|
510
|
-
self.
|
|
511
|
-
|
|
512
|
-
)
|
|
500
|
+
self.batch = llama_cpp.llama_batch_init(
|
|
501
|
+
self.n_tokens, self.embd, self.n_seq_max
|
|
502
|
+
)
|
|
513
503
|
|
|
514
504
|
def __del__(self):
|
|
515
|
-
|
|
516
|
-
|
|
517
|
-
|
|
518
|
-
self.batch = None
|
|
505
|
+
if self.batch is not None and self._llama_batch_free is not None:
|
|
506
|
+
self._llama_batch_free(self.batch)
|
|
507
|
+
self.batch = None
|
|
519
508
|
|
|
520
509
|
def set_batch(self, batch: Sequence[int], n_past: int, logits_all: bool):
|
|
521
510
|
assert self.batch is not None
|
|
@@ -0,0 +1,37 @@
|
|
|
1
|
+
import sys
|
|
2
|
+
import ctypes
|
|
3
|
+
import logging
|
|
4
|
+
|
|
5
|
+
import llama_cpp
|
|
6
|
+
|
|
7
|
+
# enum ggml_log_level {
|
|
8
|
+
# GGML_LOG_LEVEL_ERROR = 2,
|
|
9
|
+
# GGML_LOG_LEVEL_WARN = 3,
|
|
10
|
+
# GGML_LOG_LEVEL_INFO = 4,
|
|
11
|
+
# GGML_LOG_LEVEL_DEBUG = 5
|
|
12
|
+
# };
|
|
13
|
+
GGML_LOG_LEVEL_TO_LOGGING_LEVEL = {
|
|
14
|
+
2: logging.ERROR,
|
|
15
|
+
3: logging.WARNING,
|
|
16
|
+
4: logging.INFO,
|
|
17
|
+
5: logging.DEBUG,
|
|
18
|
+
}
|
|
19
|
+
|
|
20
|
+
logger = logging.getLogger("llama-cpp-python")
|
|
21
|
+
|
|
22
|
+
|
|
23
|
+
@llama_cpp.llama_log_callback
|
|
24
|
+
def llama_log_callback(
|
|
25
|
+
level: int,
|
|
26
|
+
text: bytes,
|
|
27
|
+
user_data: ctypes.c_void_p,
|
|
28
|
+
):
|
|
29
|
+
if logger.level <= GGML_LOG_LEVEL_TO_LOGGING_LEVEL[level]:
|
|
30
|
+
print(text.decode("utf-8"), end="", flush=True, file=sys.stderr)
|
|
31
|
+
|
|
32
|
+
|
|
33
|
+
llama_cpp.llama_log_set(llama_log_callback, ctypes.c_void_p(0))
|
|
34
|
+
|
|
35
|
+
|
|
36
|
+
def set_verbose(verbose: bool):
|
|
37
|
+
logger.setLevel(logging.DEBUG if verbose else logging.ERROR)
|
|
@@ -35,7 +35,6 @@ from llama_cpp.llama_speculative import LlamaDraftModel
|
|
|
35
35
|
import numpy as np
|
|
36
36
|
import numpy.typing as npt
|
|
37
37
|
|
|
38
|
-
from ._utils import suppress_stdout_stderr
|
|
39
38
|
from ._internals import (
|
|
40
39
|
_LlamaModel, # type: ignore
|
|
41
40
|
_LlamaContext, # type: ignore
|
|
@@ -44,6 +43,7 @@ from ._internals import (
|
|
|
44
43
|
_LlamaSamplingParams, # type: ignore
|
|
45
44
|
_LlamaSamplingContext, # type: ignore
|
|
46
45
|
)
|
|
46
|
+
from ._logger import set_verbose
|
|
47
47
|
|
|
48
48
|
|
|
49
49
|
class Llama:
|
|
@@ -169,10 +169,11 @@ class Llama:
|
|
|
169
169
|
"""
|
|
170
170
|
self.verbose = verbose
|
|
171
171
|
|
|
172
|
+
set_verbose(verbose)
|
|
173
|
+
|
|
172
174
|
self.numa = numa
|
|
173
175
|
if not Llama.__backend_initialized:
|
|
174
|
-
|
|
175
|
-
llama_cpp.llama_backend_init(self.numa)
|
|
176
|
+
llama_cpp.llama_backend_init(self.numa)
|
|
176
177
|
Llama.__backend_initialized = True
|
|
177
178
|
|
|
178
179
|
self.model_path = model_path
|
|
@@ -445,7 +445,7 @@ class llama_model_params(Structure):
|
|
|
445
445
|
# uint32_t n_batch; // prompt processing maximum batch size
|
|
446
446
|
# uint32_t n_threads; // number of threads to use for generation
|
|
447
447
|
# uint32_t n_threads_batch; // number of threads to use for batch processing
|
|
448
|
-
#
|
|
448
|
+
# int32_t rope_scaling_type; // RoPE scaling type, from `enum llama_rope_scaling_type`
|
|
449
449
|
|
|
450
450
|
# // ref: https://github.com/ggerganov/llama.cpp/pull/2054
|
|
451
451
|
# float rope_freq_base; // RoPE base frequency, 0 = from model
|
|
@@ -502,7 +502,7 @@ class llama_context_params(Structure):
|
|
|
502
502
|
("n_batch", c_uint32),
|
|
503
503
|
("n_threads", c_uint32),
|
|
504
504
|
("n_threads_batch", c_uint32),
|
|
505
|
-
("rope_scaling_type",
|
|
505
|
+
("rope_scaling_type", c_int32),
|
|
506
506
|
("rope_freq_base", c_float),
|
|
507
507
|
("rope_freq_scale", c_float),
|
|
508
508
|
("yarn_ext_factor", c_float),
|
|
@@ -0,0 +1,28 @@
|
|
|
1
|
+
ARG ONEAPI_VERSION=2024.0.1-devel-ubuntu22.04
|
|
2
|
+
|
|
3
|
+
FROM intel/oneapi-basekit:$ONEAPI_VERSION as build
|
|
4
|
+
|
|
5
|
+
ARG LLAMA_SYCL_F16=OFF
|
|
6
|
+
RUN apt-get update && \
|
|
7
|
+
apt-get install -y git
|
|
8
|
+
|
|
9
|
+
WORKDIR /app
|
|
10
|
+
|
|
11
|
+
COPY . .
|
|
12
|
+
|
|
13
|
+
RUN mkdir build && \
|
|
14
|
+
cd build && \
|
|
15
|
+
if [ "${LLAMA_SYCL_F16}" = "ON" ]; then \
|
|
16
|
+
echo "LLAMA_SYCL_F16 is set" && \
|
|
17
|
+
export OPT_SYCL_F16="-DLLAMA_SYCL_F16=ON"; \
|
|
18
|
+
fi && \
|
|
19
|
+
cmake .. -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx ${OPT_SYCL_F16} && \
|
|
20
|
+
cmake --build . --config Release --target main
|
|
21
|
+
|
|
22
|
+
FROM intel/oneapi-basekit:$ONEAPI_VERSION as runtime
|
|
23
|
+
|
|
24
|
+
COPY --from=build /app/build/bin/main /main
|
|
25
|
+
|
|
26
|
+
ENV LC_ALL=C.utf8
|
|
27
|
+
|
|
28
|
+
ENTRYPOINT [ "/main" ]
|
|
@@ -0,0 +1,29 @@
|
|
|
1
|
+
ARG UBUNTU_VERSION=jammy
|
|
2
|
+
|
|
3
|
+
FROM ubuntu:$UBUNTU_VERSION as build
|
|
4
|
+
|
|
5
|
+
# Install build tools
|
|
6
|
+
RUN apt update && apt install -y git build-essential cmake wget
|
|
7
|
+
|
|
8
|
+
# Install Vulkan SDK
|
|
9
|
+
RUN wget -qO - https://packages.lunarg.com/lunarg-signing-key-pub.asc | apt-key add - && \
|
|
10
|
+
wget -qO /etc/apt/sources.list.d/lunarg-vulkan-jammy.list https://packages.lunarg.com/vulkan/lunarg-vulkan-jammy.list && \
|
|
11
|
+
apt update -y && \
|
|
12
|
+
apt-get install -y vulkan-sdk
|
|
13
|
+
|
|
14
|
+
# Build it
|
|
15
|
+
WORKDIR /app
|
|
16
|
+
COPY . .
|
|
17
|
+
RUN mkdir build && \
|
|
18
|
+
cd build && \
|
|
19
|
+
cmake .. -DLLAMA_VULKAN=1 && \
|
|
20
|
+
cmake --build . --config Release --target main
|
|
21
|
+
|
|
22
|
+
# Clean up
|
|
23
|
+
WORKDIR /
|
|
24
|
+
RUN cp /app/build/bin/main /main && \
|
|
25
|
+
rm -rf /app
|
|
26
|
+
|
|
27
|
+
ENV LC_ALL=C.utf8
|
|
28
|
+
|
|
29
|
+
ENTRYPOINT [ "/main" ]
|
{llama_cpp_python-0.2.38 → llama_cpp_python-0.2.39}/vendor/llama.cpp/.devops/nix/package.nix
RENAMED
|
@@ -13,18 +13,22 @@
|
|
|
13
13
|
cudaPackages,
|
|
14
14
|
darwin,
|
|
15
15
|
rocmPackages,
|
|
16
|
+
vulkan-headers,
|
|
17
|
+
vulkan-loader,
|
|
16
18
|
clblast,
|
|
17
19
|
useBlas ? builtins.all (x: !x) [
|
|
18
20
|
useCuda
|
|
19
21
|
useMetalKit
|
|
20
22
|
useOpenCL
|
|
21
23
|
useRocm
|
|
24
|
+
useVulkan
|
|
22
25
|
],
|
|
23
26
|
useCuda ? config.cudaSupport,
|
|
24
27
|
useMetalKit ? stdenv.isAarch64 && stdenv.isDarwin && !useOpenCL,
|
|
25
28
|
useMpi ? false, # Increases the runtime closure size by ~700M
|
|
26
29
|
useOpenCL ? false,
|
|
27
30
|
useRocm ? config.rocmSupport,
|
|
31
|
+
useVulkan ? false,
|
|
28
32
|
llamaVersion ? "0.0.0", # Arbitrary version, substituted by the flake
|
|
29
33
|
}@inputs:
|
|
30
34
|
|
|
@@ -48,7 +52,8 @@ let
|
|
|
48
52
|
++ lib.optionals useMetalKit [ "MetalKit" ]
|
|
49
53
|
++ lib.optionals useMpi [ "MPI" ]
|
|
50
54
|
++ lib.optionals useOpenCL [ "OpenCL" ]
|
|
51
|
-
++ lib.optionals useRocm [ "ROCm" ]
|
|
55
|
+
++ lib.optionals useRocm [ "ROCm" ]
|
|
56
|
+
++ lib.optionals useVulkan [ "Vulkan" ];
|
|
52
57
|
|
|
53
58
|
pnameSuffix =
|
|
54
59
|
strings.optionalString (suffices != [ ])
|
|
@@ -108,6 +113,11 @@ let
|
|
|
108
113
|
hipblas
|
|
109
114
|
rocblas
|
|
110
115
|
];
|
|
116
|
+
|
|
117
|
+
vulkanBuildInputs = [
|
|
118
|
+
vulkan-headers
|
|
119
|
+
vulkan-loader
|
|
120
|
+
];
|
|
111
121
|
in
|
|
112
122
|
|
|
113
123
|
effectiveStdenv.mkDerivation (
|
|
@@ -164,7 +174,8 @@ effectiveStdenv.mkDerivation (
|
|
|
164
174
|
++ optionals useCuda cudaBuildInputs
|
|
165
175
|
++ optionals useMpi [ mpi ]
|
|
166
176
|
++ optionals useOpenCL [ clblast ]
|
|
167
|
-
++ optionals useRocm rocmBuildInputs
|
|
177
|
+
++ optionals useRocm rocmBuildInputs
|
|
178
|
+
++ optionals useVulkan vulkanBuildInputs;
|
|
168
179
|
|
|
169
180
|
cmakeFlags =
|
|
170
181
|
[
|
|
@@ -178,6 +189,7 @@ effectiveStdenv.mkDerivation (
|
|
|
178
189
|
(cmakeBool "LLAMA_HIPBLAS" useRocm)
|
|
179
190
|
(cmakeBool "LLAMA_METAL" useMetalKit)
|
|
180
191
|
(cmakeBool "LLAMA_MPI" useMpi)
|
|
192
|
+
(cmakeBool "LLAMA_VULKAN" useVulkan)
|
|
181
193
|
]
|
|
182
194
|
++ optionals useCuda [
|
|
183
195
|
(
|
|
@@ -218,6 +230,7 @@ effectiveStdenv.mkDerivation (
|
|
|
218
230
|
useMpi
|
|
219
231
|
useOpenCL
|
|
220
232
|
useRocm
|
|
233
|
+
useVulkan
|
|
221
234
|
;
|
|
222
235
|
|
|
223
236
|
shell = mkShell {
|
|
@@ -242,11 +255,11 @@ effectiveStdenv.mkDerivation (
|
|
|
242
255
|
# Configurations we don't want even the CI to evaluate. Results in the
|
|
243
256
|
# "unsupported platform" messages. This is mostly a no-op, because
|
|
244
257
|
# cudaPackages would've refused to evaluate anyway.
|
|
245
|
-
badPlatforms = optionals (useCuda || useOpenCL) lib.platforms.darwin;
|
|
258
|
+
badPlatforms = optionals (useCuda || useOpenCL || useVulkan) lib.platforms.darwin;
|
|
246
259
|
|
|
247
260
|
# Configurations that are known to result in build failures. Can be
|
|
248
261
|
# overridden by importing Nixpkgs with `allowBroken = true`.
|
|
249
|
-
broken = (useMetalKit && !effectiveStdenv.isDarwin);
|
|
262
|
+
broken = (useMetalKit && !effectiveStdenv.isDarwin) || (useVulkan && effectiveStdenv.isDarwin);
|
|
250
263
|
|
|
251
264
|
description = "Inference of LLaMA model in pure C/C++${descriptionSuffix}";
|
|
252
265
|
homepage = "https://github.com/ggerganov/llama.cpp/";
|
|
@@ -0,0 +1,28 @@
|
|
|
1
|
+
ARG ONEAPI_VERSION=2024.0.1-devel-ubuntu22.04
|
|
2
|
+
|
|
3
|
+
FROM intel/oneapi-basekit:$ONEAPI_VERSION as build
|
|
4
|
+
|
|
5
|
+
ARG LLAMA_SYCL_F16=OFF
|
|
6
|
+
RUN apt-get update && \
|
|
7
|
+
apt-get install -y git
|
|
8
|
+
|
|
9
|
+
WORKDIR /app
|
|
10
|
+
|
|
11
|
+
COPY . .
|
|
12
|
+
|
|
13
|
+
RUN mkdir build && \
|
|
14
|
+
cd build && \
|
|
15
|
+
if [ "${LLAMA_SYCL_F16}" = "ON" ]; then \
|
|
16
|
+
echo "LLAMA_SYCL_F16 is set" && \
|
|
17
|
+
export OPT_SYCL_F16="-DLLAMA_SYCL_F16=ON"; \
|
|
18
|
+
fi && \
|
|
19
|
+
cmake .. -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx ${OPT_SYCL_F16} && \
|
|
20
|
+
cmake --build . --config Release --target server
|
|
21
|
+
|
|
22
|
+
FROM intel/oneapi-basekit:$ONEAPI_VERSION as runtime
|
|
23
|
+
|
|
24
|
+
COPY --from=build /app/build/bin/server /server
|
|
25
|
+
|
|
26
|
+
ENV LC_ALL=C.utf8
|
|
27
|
+
|
|
28
|
+
ENTRYPOINT [ "/server" ]
|
|
@@ -0,0 +1,29 @@
|
|
|
1
|
+
ARG UBUNTU_VERSION=jammy
|
|
2
|
+
|
|
3
|
+
FROM ubuntu:$UBUNTU_VERSION as build
|
|
4
|
+
|
|
5
|
+
# Install build tools
|
|
6
|
+
RUN apt update && apt install -y git build-essential cmake wget
|
|
7
|
+
|
|
8
|
+
# Install Vulkan SDK
|
|
9
|
+
RUN wget -qO - https://packages.lunarg.com/lunarg-signing-key-pub.asc | apt-key add - && \
|
|
10
|
+
wget -qO /etc/apt/sources.list.d/lunarg-vulkan-jammy.list https://packages.lunarg.com/vulkan/lunarg-vulkan-jammy.list && \
|
|
11
|
+
apt update -y && \
|
|
12
|
+
apt-get install -y vulkan-sdk
|
|
13
|
+
|
|
14
|
+
# Build it
|
|
15
|
+
WORKDIR /app
|
|
16
|
+
COPY . .
|
|
17
|
+
RUN mkdir build && \
|
|
18
|
+
cd build && \
|
|
19
|
+
cmake .. -DLLAMA_VULKAN=1 && \
|
|
20
|
+
cmake --build . --config Release --target server
|
|
21
|
+
|
|
22
|
+
# Clean up
|
|
23
|
+
WORKDIR /
|
|
24
|
+
RUN cp /app/build/bin/server /server && \
|
|
25
|
+
rm -rf /app
|
|
26
|
+
|
|
27
|
+
ENV LC_ALL=C.utf8
|
|
28
|
+
|
|
29
|
+
ENTRYPOINT [ "/server" ]
|
|
@@ -79,7 +79,7 @@ if (NOT MSVC)
|
|
|
79
79
|
endif()
|
|
80
80
|
|
|
81
81
|
if (WIN32)
|
|
82
|
-
|
|
82
|
+
set(LLAMA_WIN_VER "0x602" CACHE STRING "llama: Windows Version")
|
|
83
83
|
endif()
|
|
84
84
|
|
|
85
85
|
# 3rd party libs
|
|
@@ -100,6 +100,10 @@ option(LLAMA_HIPBLAS "llama: use hipBLAS"
|
|
|
100
100
|
option(LLAMA_HIP_UMA "llama: use HIP unified memory architecture" OFF)
|
|
101
101
|
option(LLAMA_CLBLAST "llama: use CLBlast" OFF)
|
|
102
102
|
option(LLAMA_VULKAN "llama: use Vulkan" OFF)
|
|
103
|
+
option(LLAMA_VULKAN_CHECK_RESULTS "llama: run Vulkan op checks" OFF)
|
|
104
|
+
option(LLAMA_VULKAN_DEBUG "llama: enable Vulkan debug output" OFF)
|
|
105
|
+
option(LLAMA_VULKAN_VALIDATE "llama: enable Vulkan validation" OFF)
|
|
106
|
+
option(LLAMA_VULKAN_RUN_TESTS "llama: run Vulkan tests" OFF)
|
|
103
107
|
option(LLAMA_METAL "llama: use Metal" ${LLAMA_METAL_DEFAULT})
|
|
104
108
|
option(LLAMA_METAL_NDEBUG "llama: disable Metal debugging" OFF)
|
|
105
109
|
option(LLAMA_METAL_SHADER_DEBUG "llama: compile Metal with -fno-fast-math" OFF)
|
|
@@ -431,6 +435,22 @@ if (LLAMA_VULKAN)
|
|
|
431
435
|
|
|
432
436
|
add_compile_definitions(GGML_USE_VULKAN)
|
|
433
437
|
|
|
438
|
+
if (LLAMA_VULKAN_CHECK_RESULTS)
|
|
439
|
+
target_compile_definitions(ggml-vulkan PRIVATE GGML_VULKAN_CHECK_RESULTS)
|
|
440
|
+
endif()
|
|
441
|
+
|
|
442
|
+
if (LLAMA_VULKAN_DEBUG)
|
|
443
|
+
target_compile_definitions(ggml-vulkan PRIVATE GGML_VULKAN_DEBUG)
|
|
444
|
+
endif()
|
|
445
|
+
|
|
446
|
+
if (LLAMA_VULKAN_VALIDATE)
|
|
447
|
+
target_compile_definitions(ggml-vulkan PRIVATE GGML_VULKAN_VALIDATE)
|
|
448
|
+
endif()
|
|
449
|
+
|
|
450
|
+
if (LLAMA_VULKAN_RUN_TESTS)
|
|
451
|
+
target_compile_definitions(ggml-vulkan PRIVATE GGML_VULKAN_RUN_TESTS)
|
|
452
|
+
endif()
|
|
453
|
+
|
|
434
454
|
set(LLAMA_EXTRA_LIBS ${LLAMA_EXTRA_LIBS} ggml-vulkan)
|
|
435
455
|
else()
|
|
436
456
|
message(WARNING "Vulkan not found")
|
|
@@ -789,9 +809,9 @@ if (LLAMA_CCACHE)
|
|
|
789
809
|
if (LLAMA_CCACHE_FOUND)
|
|
790
810
|
set_property(GLOBAL PROPERTY RULE_LAUNCH_COMPILE ccache)
|
|
791
811
|
set(ENV{CCACHE_SLOPPINESS} time_macros)
|
|
792
|
-
message(STATUS "
|
|
812
|
+
message(STATUS "ccache found, compilation results will be cached. Disable with LLAMA_CCACHE=OFF.")
|
|
793
813
|
else()
|
|
794
|
-
message(STATUS "Warning: ccache not found - consider installing it or
|
|
814
|
+
message(STATUS "Warning: ccache not found - consider installing it for faster compilation or disable this warning with LLAMA_CCACHE=OFF")
|
|
795
815
|
endif ()
|
|
796
816
|
endif()
|
|
797
817
|
|