llama-cpp-python 0.2.14__tar.gz → 0.2.16__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- llama_cpp_python-0.2.16/.git/FETCH_HEAD +1 -0
- llama_cpp_python-0.2.16/.git/HEAD +1 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/config +1 -1
- llama_cpp_python-0.2.16/.git/index +0 -0
- llama_cpp_python-0.2.16/.git/logs/HEAD +1 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/HEAD +1 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/config +1 -1
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.idx +0 -0
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.pack → llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.pack +0 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.rev +0 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/packed-refs +2 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
- llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/shallow +1 -0
- llama_cpp_python-0.2.16/.git/objects/23/c7e86cace58018b34f1dae1b548df9981eebf9 +0 -0
- llama_cpp_python-0.2.16/.git/objects/25/26bcbf5a89773bf179fd631c782274635da9e1 +0 -0
- llama_cpp_python-0.2.16/.git/objects/2a/6aed81cf0cc6d59972fe184a57666f281dbe8f +0 -0
- llama_cpp_python-0.2.16/.git/objects/2e/18b47a0261b4e81255fc71811a7c2405e4e19f +0 -0
- llama_cpp_python-0.2.14/.git/objects/b7/ea27646d138e37efaad41d5a659d3da6537b6f → llama_cpp_python-0.2.16/.git/objects/36/90f40c28d3d9821712c70f68a25f5671bfcaa8 +0 -0
- llama_cpp_python-0.2.16/.git/objects/45/a1513dde96b5d7f0e3b3a49fc3d7bcda8f7c6f +0 -0
- llama_cpp_python-0.2.16/.git/objects/4d/c32b015468696f721ddb37a53d09cf5f9c7612 +0 -0
- llama_cpp_python-0.2.16/.git/objects/54/3365d8d631f36da2f57381801edabbc3ca4769 +0 -0
- llama_cpp_python-0.2.16/.git/objects/5b/51e98ce432974ff031367f8937babe755e3d73 +0 -0
- llama_cpp_python-0.2.16/.git/objects/61/027ef99725c50b0891fdbf0bf263a33abe648f +0 -0
- llama_cpp_python-0.2.16/.git/objects/6c/3a6e594fab3a61940f00840cb717f53ea1e8b7 +0 -0
- llama_cpp_python-0.2.16/.git/objects/72/f6a1211b53960672f7af628800bc86a7c5c547 +0 -0
- llama_cpp_python-0.2.16/.git/objects/7b/01670640a150525c7671a7a3c1ae652a2d7b3d +0 -0
- llama_cpp_python-0.2.16/.git/objects/81/d58f627258591fc76e28e8378d0f9c3d49c9e5 +0 -0
- llama_cpp_python-0.2.16/.git/objects/8d/063708d0b17c59a8637d2d35ec39e7e27b8171 +0 -0
- llama_cpp_python-0.2.14/.git/objects/18/41560fc0a62ec24c46e99ddace261786ce07b0 → llama_cpp_python-0.2.16/.git/objects/8e/841233c07f9d6be8b4bf1e25231789a84781c0 +0 -0
- llama_cpp_python-0.2.16/.git/objects/a0/b7d5b55cf67870c3efc3e5c42b96196d1f707c +0 -0
- llama_cpp_python-0.2.16/.git/objects/a2/4e55042fd63aeb7e9873fff7474cc9141f4474 +0 -0
- llama_cpp_python-0.2.16/.git/objects/b7/e60b66f47950e385980a1329af9dfb14da6906 +4 -0
- llama_cpp_python-0.2.16/.git/objects/e0/b98f7ec76339ad83913015531541a7de9d8e1e +0 -0
- llama_cpp_python-0.2.16/.git/objects/e2/1e0bd82d6cacf620ea2f2dd7e8e7e2ee34b42a +0 -0
- llama_cpp_python-0.2.16/.git/objects/e6/f024107b7e75246ba7a7b083b2aafaada82697 +0 -0
- llama_cpp_python-0.2.14/.git/objects/b3/164f85806ec28003f217bd108671c4143298d7 → llama_cpp_python-0.2.16/.git/objects/f1/76c95ddb207e422703d8a73dd0d12a984a838f +0 -0
- llama_cpp_python-0.2.16/.git/objects/f1/b8e9d154231932c4b7b9b59611626764e68632 +0 -0
- llama_cpp_python-0.2.16/.git/objects/f7/2b9b39ef1e5d433ac15638f1090b96c582eb5b +0 -0
- llama_cpp_python-0.2.16/.git/refs/tags/v0.2.16 +1 -0
- llama_cpp_python-0.2.16/.git/shallow +1 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/build-and-release.yaml +3 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/CHANGELOG.md +23 -2
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/CMakeLists.txt +19 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/PKG-INFO +1 -1
- llama_cpp_python-0.2.16/docs/server.md +121 -0
- llama_cpp_python-0.2.16/examples/notebooks/Functions.ipynb +400 -0
- llama_cpp_python-0.2.16/examples/notebooks/Multimodal.ipynb +81 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/__init__.py +1 -1
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama.py +80 -35
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_chat_format.py +400 -73
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_grammar.py +25 -11
- llama_cpp_python-0.2.16/llama_cpp/llama_types.py +292 -0
- llama_cpp_python-0.2.16/llama_cpp/llava_cpp.py +232 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/app.py +41 -14
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/tests/test_llama.py +16 -12
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.gitignore +1 -1
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/Makefile +5 -2
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/CMakeLists.txt +1 -0
- llama_cpp_python-0.2.16/vendor/llama.cpp/common/base64.hpp +392 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/build-info.cpp +1 -1
- llama_cpp_python-0.2.16/vendor/llama.cpp/convert-hf-to-gguf.py +890 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert.py +2 -2
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/finetune.cpp +1 -1
- llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/CMakeLists.txt +36 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/README.md +3 -4
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/clip.cpp +53 -33
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/clip.h +31 -10
- llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava-cli.cpp +313 -0
- llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava.cpp +156 -0
- llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava.h +50 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/CMakeLists.txt +1 -1
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/README.md +2 -0
- llama_cpp_python-0.2.16/vendor/llama.cpp/examples/server/index.html.hpp +2693 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/index.html +2 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/server.cpp +2 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-alloc.c +12 -9
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-cuda.cu +16 -1
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-cuda.h +5 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml.c +78 -252
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml.h +5 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/gguf.py +53 -29
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/pyproject.toml +1 -1
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/llama.cpp +105 -74
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/mypy.ini +1 -0
- llama_cpp_python-0.2.14/.git/FETCH_HEAD +0 -1
- llama_cpp_python-0.2.14/.git/HEAD +0 -1
- llama_cpp_python-0.2.14/.git/index +0 -0
- llama_cpp_python-0.2.14/.git/logs/HEAD +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/HEAD +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/index +0 -0
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.idx +0 -0
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.rev +0 -0
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/packed-refs +0 -2
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/refs/tags/b1492 +0 -1
- llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/shallow +0 -1
- llama_cpp_python-0.2.14/.git/objects/09/96e07d6e6f540436b8bc96e3be3d7eac233287 +0 -0
- llama_cpp_python-0.2.14/.git/objects/13/56d3755566a5e042d839c322ec0792e20c7c34 +0 -0
- llama_cpp_python-0.2.14/.git/objects/29/431d957feeaf2b06286bd907531b9dee4a684c +0 -0
- llama_cpp_python-0.2.14/.git/objects/42/c01fe549a5ce2e41ac9743cebaeb971973dfb4 +0 -0
- llama_cpp_python-0.2.14/.git/objects/4d/27bb00b5c86698291f231596f8bd2cb3fc6103 +0 -0
- llama_cpp_python-0.2.14/.git/objects/54/48743818ecc40b31daf66fb4b03f69c6e75f2f +0 -0
- llama_cpp_python-0.2.14/.git/objects/56/171cf7bfe224c9ef951d47cfc76fe1424ecdd1 +0 -5
- llama_cpp_python-0.2.14/.git/objects/58/659745f0bb9e72b901e5e0856fdb484fe2ab14 +0 -0
- llama_cpp_python-0.2.14/.git/objects/6d/c113ac97de73fa5caac40fb26d0d54dd2052ab +0 -0
- llama_cpp_python-0.2.14/.git/objects/75/0f9d3b7571b82685146780a10401475f795de7 +0 -0
- llama_cpp_python-0.2.14/.git/objects/85/1b09feb053b3e752530d2ee171ca5d1f458bff +0 -0
- llama_cpp_python-0.2.14/.git/objects/88/8f38dbbb6e5e0e4db95c5c1fc2b0124ceaa814 +0 -0
- llama_cpp_python-0.2.14/.git/objects/90/3a8c9089b0b6b51803c48911d168e1ef5bf145 +0 -0
- llama_cpp_python-0.2.14/.git/objects/93/afc3ee9d99b67bfcd0a79801be4a10981779b2 +0 -0
- llama_cpp_python-0.2.14/.git/objects/95/a820e82ed6b6ac5777d4f09e5a0492d39e66a5 +0 -0
- llama_cpp_python-0.2.14/.git/objects/a6/4033ea04e4e63c3a6eacef1a1d2f9788d2d6f0 +0 -0
- llama_cpp_python-0.2.14/.git/objects/a9/43b4ad0f7b2596ccf18d582ae8baf624862f01 +0 -0
- llama_cpp_python-0.2.14/.git/objects/c6/33c0797f8d3c6e0e238793cece0fee5df49d76 +0 -0
- llama_cpp_python-0.2.14/.git/objects/ce/d86f6fa2de2add170191515772e99fbd1c3388 +0 -0
- llama_cpp_python-0.2.14/.git/refs/tags/v0.2.14 +0 -1
- llama_cpp_python-0.2.14/.git/shallow +0 -1
- llama_cpp_python-0.2.14/examples/notebooks/Functions.ipynb +0 -225
- llama_cpp_python-0.2.14/llama_cpp/llama_types.py +0 -172
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-bloom-hf-to-gguf.py +0 -247
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-falcon-hf-to-gguf.py +0 -253
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-gptneox-hf-to-gguf.py +0 -221
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-mpt-hf-to-gguf.py +0 -227
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-refact-hf-to-gguf.py +0 -272
- llama_cpp_python-0.2.14/vendor/llama.cpp/convert-starcoder-hf-to-gguf.py +0 -210
- llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -14
- llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/llava-utils.h +0 -147
- llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/llava.cpp +0 -164
- llama_cpp_python-0.2.14/vendor/llama.cpp/examples/server/index.html.hpp +0 -2679
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.dockerignore +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/description +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/info/exclude +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/description +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/04/5856ea2ffe697ec33db1c1c989bd45cde5bb3d +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/04/7bc14424303575f73af90611fec827334f54e8 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/11/2a0f7872fa9244bf38729a2722dc5c08dec20c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/11/b6d5c26e3f7157658952b8ec353e985d522fac +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/12/90cad4931d6fc9b80e00baadecda4d45b1f005 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/13/c5b6b0df5f67e80cbe584909b83777901265a1 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/19/9bd4ffbf88c68c98b52c05f388dfa92716f6b7 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/1b/61eec690c380fe7d97e6bd30310f49d4ed0fa6 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/23/e37d4d40e5ec0bfd85b5e928834d58e2cf0da6 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/24/04228325d88c59b819acaedb20b15635f75df9 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/27/2e4767b47397d1529e6a2d01298144d9d746ba +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/29/03e0146d304bcacbfabfe71f171a2edc03043e +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/33/197007d97015ba62fb8fe835bf6eabe5bebd86 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/3a/1d7180d508818fe957923e00dcd8950938632d +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/3a/6457dcdfd47e764654bacae0ba8347976b645a +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/41/cc68ea2402cf682807649d841e7c0f4175db01 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/44/b6d4a35d3caf0c65aef0a1c77ff0ab4077d405 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/47/4503fdfc554d8caabee4f321a80427f8c7d696 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/4b/3189dd1a54be3bc416786ddf184dd047dc4b20 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/4b/38dbacb6208ed2496e517018b0670beb21be65 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/51/f357200f8b998031f4be924e11ed2ae4bf3fea +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/55/d08db5f514fb6847938e3d6489b99f737ba6e3 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/5d/f12aaf53a0e85f55e1aa0e5167bc831ab32783 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/60/bc7aef42aac0409cfdca666ad2ff6f516d7b5b +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/67/50769eef1992c7eaa624b9e602109a0ea77118 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/68/7316b327ca038d26a338b3070a7d4698322515 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/6c/10225819e88df6faf38ed409b00e6ae9a4d139 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/74/7c6130e3cb1479d20e2013b1dd3db3379c2266 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/76/e26fbd106895fba52861f8ac1e11cc6ee2a307 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7d/6c970483161eaf43cfa9d50010c071d4953053 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/069b1903cc69a74e562a32ef8b0c1bd22d41d2 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/df0975dc12ccc95ad14de085f07efe6d65c620 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/e8f748eab47180cea09c0ad8e75c3b991b4af4 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/82/e5c4487e57d6d59c901a73bdd2a9bc172fee7c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/8b/d03f88a1895cbf3ef249e13df79ee0efda779d +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/91/abb11fdf507883caeeb2d2958e1c65fb6cbdc1 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/94/1a4eac8ffb4e7978bb8d6ef5108efdb06975bf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/99/32d6130f5552a9b85c8b15b4ac6bc26b1068ce +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/9c/eb1f3c9e1498b2fddc890b8cbf6e883dccc488 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/9d/0ec2f705618e591cfa8d6512cb9a96b3da75f1 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a2/94ebf8a4ed0b4dd705aaeaccd0df201e361c8b +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a4/d21004f628b4160ab02a0299960a55f7c516cb +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a9/e51cdc1672134ec9af66c9eccf09f6da4ceccd +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ae/e2d8a965593394373d618a49f4f392600d0072 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/b9/1632f5bc787c1404600c894a6a4126359747d8 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/bb/cbbe7d61558adde3cbfd0c7a63a67c27ed6d30 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/c8/5e73d2b657bb05ed99309615d67bac93d9f86e +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ca/ebbb67fdb02a0a8897d4e4826ea046a9931f6f +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/cc/6a3a7252ea6e698614f0629d4bc040ab6ca717 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/d3/329eec3bac6ce7e54c76b77ac9bf99fab0fe3f +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/d4/888b448a6895f87411f7c52dc23f1ad5f0d8f6 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e3/cff3251c7fb6410937ee586b94f7b84331da2f +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e4/1f375774e6945e445bfb179502b128fe22dda7 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e6/9de29bb2d1d6434b8b29ae775ad8c2e48c5391 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e9/30609ff5c479a1d5e12a8f3993582d421a6326 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e9/48f8deb150039c6853e14537a8dd0cc9002b72 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/eb/9a2cfa9167df02f136502af79738c71363abfd +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fc/25ff5160028dee3570249abc40cd57780bcca9 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fc/ef8cd800ee8a265b146748d178cb56b5632bf3 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fd/64c09b37947c97e58903ce570785c657d56722 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fe/b0ed68d94eac48b844fd587ddfb808649716a1 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ff/3e950cd1110fe552912cea4c268c4023d2b737 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/dependabot.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/build-docker.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/publish-to-test.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/publish.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/test-pypi.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/test.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.gitignore +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.gitmodules +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.readthedocs.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/LICENSE.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/Makefile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/cuda_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/build.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/hug_model.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/start.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/start_server.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/openblas_simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/simple/Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/simple/run.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/api-reference.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/changelog.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/index.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/install/macos.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/requirements.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/fastapi_server.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_embedding.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_inference.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_streaming.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/langchain_custom_llm.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/Chat.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/Miku.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/ReasonAct.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/common.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/quantize.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/util.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Batching.ipynb +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Clients.ipynb +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Guidance.ipynb +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/PerformanceTuning.ipynb +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/_utils.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_cpp.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/py.typed +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/__init__.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/__main__.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/mkdocs.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/pyproject.toml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.clang-tidy +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/tools.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.dockerignore +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.ecrc +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.editorconfig +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.flake8 +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.git +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/tidy-post.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/tidy-review.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/LICENSE +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/Package.swift +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/SHA256SUMS +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/build.zig +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ci/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ci/run.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/codecov.yml +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/common.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/common.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/console.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/grammar-parser.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/log.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/stb_image.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/train.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/train.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-baichuan-hf-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/docs/BLIS.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/Miku.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/alpaca.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/json-schema-to-grammar.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama.vim +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama2.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llm.vim +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/main.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/make-ggml.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/metal/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/metal/metal.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/reason-act.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/api_like_OAI.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/completion.js.hpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/deps.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/httplib.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/index.js.hpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/json-schema-to-grammar.mjs.hpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/json.hpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/index.js +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/flake.lock +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/flake.nix +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-alloc.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-backend.c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-backend.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-impl.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.m +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.metal +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-mpi.c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-mpi.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-opencl.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-quants.c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-quants.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/README.md +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/c.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/json.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/list.gbnf +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/llama.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama0-banner.png +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama0-logo.png +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama1-banner.png +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama1-logo.png +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/assistant.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/dan.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/requirements.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/run_with_preset.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/build-info.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/spm-headers/llama.h +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-llama.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-llama.py +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-1-llama.cpp +0 -0
- {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/unicode.h +0 -0
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b7e60b66f47950e385980a1329af9dfb14da6906 'b7e60b66f47950e385980a1329af9dfb14da6906' of https://github.com/abetlen/llama-cpp-python
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b7e60b66f47950e385980a1329af9dfb14da6906
|
|
@@ -9,7 +9,7 @@
|
|
|
9
9
|
[gc]
|
|
10
10
|
auto = 0
|
|
11
11
|
[http "https://github.com/"]
|
|
12
|
-
extraheader = AUTHORIZATION: basic
|
|
12
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzJBc3h5aUVKQkZ1Q3M5bjVaWU1ZTk9za3hoSzh0VDFMeVdwRw==
|
|
13
13
|
[submodule "vendor/llama.cpp"]
|
|
14
14
|
active = true
|
|
15
15
|
url = https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 b7e60b66f47950e385980a1329af9dfb14da6906 runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615337 +0000 checkout: moving from master to refs/tags/v0.2.16
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
a75fa576abba9d37f463580c379e4bbf1e1ad03c
|
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
[gc]
|
|
14
14
|
auto = 0
|
|
15
15
|
[http "https://github.com/"]
|
|
16
|
-
extraheader = AUTHORIZATION: basic
|
|
16
|
+
extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzJBc3h5aUVKQkZ1Q3M5bjVaWU1ZTk9za3hoSzh0VDFMeVdwRw==
|
|
17
17
|
[url "https://github.com/"]
|
|
18
18
|
insteadOf = git@github.com:
|
|
19
19
|
insteadOf = org-6826477@github.com:
|
|
Binary file
|
|
@@ -0,0 +1,2 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
2
|
+
a75fa576abba9d37f463580c379e4bbf1e1ad03c a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 checkout: moving from master to a75fa576abba9d37f463580c379e4bbf1e1ad03c
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
a75fa576abba9d37f463580c379e4bbf1e1ad03c
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
a75fa576abba9d37f463580c379e4bbf1e1ad03c
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b7e60b66f47950e385980a1329af9dfb14da6906
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
b7e60b66f47950e385980a1329af9dfb14da6906
|
|
@@ -7,9 +7,30 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
7
7
|
|
|
8
8
|
## [Unreleased]
|
|
9
9
|
|
|
10
|
+
## [0.2.16]
|
|
11
|
+
|
|
12
|
+
- Update llama.cpp to ggerganov/llama.cp@a75fa576abba9d37f463580c379e4bbf1e1ad03c
|
|
13
|
+
- Add `set_seed` to `Llama` class by @abetlen in fd41ed3a908761d286102a019a34c2938a15118d
|
|
14
|
+
- Fix server doc arguments by @kjunggithub in #892
|
|
15
|
+
- Fix response_format handler in llava chat handler by @abetlen in b62c44983921197ed10a7d29dc4ba920e9979380
|
|
16
|
+
- Fix default max_tokens, chat completion is now unlimited (to context length) and completion is 16 tokens to match OpenAI defaults by @abetlen in e7962d2c733cbbeec5a37392c81f64185a9a39e8
|
|
17
|
+
- Fix json_schema_to_gbnf helper so that it takes a json schema string as input instead by @abetlen in faeae181b1e868643c0dc28fcf039f077baf0829
|
|
18
|
+
- Add support for $ref and $def in json_schema_to_gbnf to handle more complex function schemas by @abetlen in 770df344369c0630df1be14be9f9e301e7c56d24
|
|
19
|
+
- Update functionary chat handler for new OpenAI api by abetlen in 1b376c62b775b401653facf25a519d116aafe99a
|
|
20
|
+
- Fix add default stop sequence to chatml chat format by @abetlen in b84d76a844149216d511cfd8cdb9827148a1853c
|
|
21
|
+
- Fix sampling bug when logits_all=False by @abetlen in 6f0b0b1b840af846938ed74d0e8170a91c40e617
|
|
22
|
+
|
|
23
|
+
## [0.2.15]
|
|
24
|
+
|
|
25
|
+
- Update llama.cpp to ggerganov/llama.cpp@0a7c980b6f94a049cb804573df2d8092a34df8e4
|
|
26
|
+
- Add support for Llava1.5 multimodal models by @damian0815 and @abetlen in #821
|
|
27
|
+
- Update OpenAI API compatibility to match dev day update by @abetlen in #821
|
|
28
|
+
- Add seed parameter to completion and chat_completion functions of Llama class by @abetlen in 86aeb9f3a14808575d2bb0076e6acb4a30907e6a
|
|
29
|
+
- Add JSON mode support to constrain chat completion to JSON objects by @abetlen in b30b9c338bf9af316d497ea501d39f5c246900db
|
|
30
|
+
|
|
10
31
|
## [0.2.14]
|
|
11
32
|
|
|
12
|
-
- Update llama.cpp to f0b30ef7dc1360922ccbea0a8cd3918ecf15eaa7
|
|
33
|
+
- Update llama.cpp to ggerganov/llama.cpp@f0b30ef7dc1360922ccbea0a8cd3918ecf15eaa7
|
|
13
34
|
- Add support for Huggingface Autotokenizer Chat Formats by @bioshazard and @abetlen in #790 and bbffdaebaa7bb04b543dbf683a07276087251f86
|
|
14
35
|
- Fix llama-2 chat format by @earonesty in #869
|
|
15
36
|
- Add support for functionary chat format by @abetlen in #784
|
|
@@ -17,7 +38,7 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
|
|
|
17
38
|
|
|
18
39
|
## [0.2.13]
|
|
19
40
|
|
|
20
|
-
- Update llama.cpp to 51b2fc11f7f605fff49725a4540e9a6ef7b51b70
|
|
41
|
+
- Update llama.cpp to ggerganov/llama.cpp@51b2fc11f7f605fff49725a4540e9a6ef7b51b70
|
|
21
42
|
- Fix name 'open' is not defined exception when deleting model by @abetlen in 011b95d7f34cbfc528af75a892757bd9a20838ab
|
|
22
43
|
- Fix tokenization of special characters by @antoine-lizee in #850
|
|
23
44
|
|
|
@@ -41,4 +41,23 @@ if (LLAMA_BUILD)
|
|
|
41
41
|
FILES $<TARGET_RUNTIME_DLLS:llama>
|
|
42
42
|
DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
43
43
|
)
|
|
44
|
+
add_subdirectory(vendor/llama.cpp/examples/llava)
|
|
45
|
+
set_target_properties(llava_shared PROPERTIES OUTPUT_NAME "llava")
|
|
46
|
+
install(
|
|
47
|
+
TARGETS llava_shared
|
|
48
|
+
LIBRARY DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
|
|
49
|
+
RUNTIME DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
|
|
50
|
+
ARCHIVE DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
|
|
51
|
+
FRAMEWORK DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
|
|
52
|
+
RESOURCE DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
|
|
53
|
+
)
|
|
54
|
+
# Temporary fix for https://github.com/scikit-build/scikit-build-core/issues/374
|
|
55
|
+
install(
|
|
56
|
+
TARGETS llava_shared
|
|
57
|
+
LIBRARY DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
58
|
+
RUNTIME DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
59
|
+
ARCHIVE DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
60
|
+
FRAMEWORK DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
61
|
+
RESOURCE DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
|
|
62
|
+
)
|
|
44
63
|
endif()
|
|
@@ -0,0 +1,121 @@
|
|
|
1
|
+
# OpenAI Compatible Server
|
|
2
|
+
|
|
3
|
+
`llama-cpp-python` offers an OpenAI API compatible web server.
|
|
4
|
+
|
|
5
|
+
This web server can be used to serve local models and easily connect them to existing clients.
|
|
6
|
+
|
|
7
|
+
## Setup
|
|
8
|
+
|
|
9
|
+
### Installation
|
|
10
|
+
|
|
11
|
+
The server can be installed by running the following command:
|
|
12
|
+
|
|
13
|
+
```bash
|
|
14
|
+
pip install llama-cpp-python[server]
|
|
15
|
+
```
|
|
16
|
+
|
|
17
|
+
### Running the server
|
|
18
|
+
|
|
19
|
+
The server can then be started by running the following command:
|
|
20
|
+
|
|
21
|
+
```bash
|
|
22
|
+
python3 -m llama_cpp.server --model <model_path>
|
|
23
|
+
```
|
|
24
|
+
|
|
25
|
+
### Server options
|
|
26
|
+
|
|
27
|
+
For a full list of options, run:
|
|
28
|
+
|
|
29
|
+
```bash
|
|
30
|
+
python3 -m llama_cpp.server --help
|
|
31
|
+
```
|
|
32
|
+
|
|
33
|
+
NOTE: All server options are also available as environment variables. For example, `--model` can be set by setting the `MODEL` environment variable.
|
|
34
|
+
|
|
35
|
+
## Guides
|
|
36
|
+
|
|
37
|
+
### Code Completion
|
|
38
|
+
|
|
39
|
+
`llama-cpp-python` supports code completion via GitHub Copilot.
|
|
40
|
+
|
|
41
|
+
*NOTE*: Without GPU acceleration this is unlikely to be fast enough to be usable.
|
|
42
|
+
|
|
43
|
+
You'll first need to download one of the available code completion models in GGUF format:
|
|
44
|
+
|
|
45
|
+
- [replit-code-v1_5-GGUF](https://huggingface.co/abetlen/replit-code-v1_5-3b-GGUF)
|
|
46
|
+
|
|
47
|
+
Then you'll need to run the OpenAI compatible web server with a increased context size substantially for GitHub Copilot requests:
|
|
48
|
+
|
|
49
|
+
```bash
|
|
50
|
+
python3 -m llama_cpp.server --model <model_path> --n_ctx 16192
|
|
51
|
+
```
|
|
52
|
+
|
|
53
|
+
Then just update your settings in `.vscode/settings.json` to point to your code completion server:
|
|
54
|
+
|
|
55
|
+
```json
|
|
56
|
+
{
|
|
57
|
+
// ...
|
|
58
|
+
"github.copilot.advanced": {
|
|
59
|
+
"debug.testOverrideProxyUrl": "http://<host>:<port>",
|
|
60
|
+
"debug.overrideProxyUrl": "http://<host>:<port>"
|
|
61
|
+
}
|
|
62
|
+
// ...
|
|
63
|
+
}
|
|
64
|
+
```
|
|
65
|
+
|
|
66
|
+
### Function Calling
|
|
67
|
+
|
|
68
|
+
`llama-cpp-python` supports structured function calling based on a JSON schema.
|
|
69
|
+
|
|
70
|
+
You'll first need to download one of the available function calling models in GGUF format:
|
|
71
|
+
|
|
72
|
+
- [functionary-7b-v1](https://huggingface.co/abetlen/functionary-7b-v1-GGUF)
|
|
73
|
+
|
|
74
|
+
Then when you run the server you'll need to also specify the `functionary-7b-v1` chat_format
|
|
75
|
+
|
|
76
|
+
```bash
|
|
77
|
+
python3 -m llama_cpp.server --model <model_path> --chat_format functionary
|
|
78
|
+
```
|
|
79
|
+
|
|
80
|
+
### Multimodal Models
|
|
81
|
+
|
|
82
|
+
`llama-cpp-python` supports the llava1.5 family of multi-modal models which allow the language model to
|
|
83
|
+
read information from both text and images.
|
|
84
|
+
|
|
85
|
+
You'll first need to download one of the available multi-modal models in GGUF format:
|
|
86
|
+
|
|
87
|
+
- [llava-v1.5-7b](https://huggingface.co/mys/ggml_llava-v1.5-7b)
|
|
88
|
+
- [llava-v1.5-13b](https://huggingface.co/mys/ggml_llava-v1.5-13b)
|
|
89
|
+
- [bakllava-1-7b](https://huggingface.co/mys/ggml_bakllava-1)
|
|
90
|
+
|
|
91
|
+
Then when you run the server you'll need to also specify the path to the clip model used for image embedding and the `llava-1-5` chat_format
|
|
92
|
+
|
|
93
|
+
```bash
|
|
94
|
+
python3 -m llama_cpp.server --model <model_path> --clip_model_path <clip_model_path> --chat_format llava-1-5
|
|
95
|
+
```
|
|
96
|
+
|
|
97
|
+
Then you can just use the OpenAI API as normal
|
|
98
|
+
|
|
99
|
+
```python3
|
|
100
|
+
from openai import OpenAI
|
|
101
|
+
|
|
102
|
+
client = OpenAI(base_url="http://<host>:<port>/v1", api_key="sk-xxx")
|
|
103
|
+
response = client.chat.completions.create(
|
|
104
|
+
model="gpt-4-vision-preview",
|
|
105
|
+
messages=[
|
|
106
|
+
{
|
|
107
|
+
"role": "user",
|
|
108
|
+
"content": [
|
|
109
|
+
{
|
|
110
|
+
"type": "image_url",
|
|
111
|
+
"image_url": {
|
|
112
|
+
"url": "<image_url>"
|
|
113
|
+
},
|
|
114
|
+
},
|
|
115
|
+
{"type": "text", "text": "What does the image say"},
|
|
116
|
+
],
|
|
117
|
+
}
|
|
118
|
+
],
|
|
119
|
+
)
|
|
120
|
+
print(response)
|
|
121
|
+
```
|