llama-cpp-python 0.2.14__tar.gz → 0.2.16__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (528) hide show
  1. llama_cpp_python-0.2.16/.git/FETCH_HEAD +1 -0
  2. llama_cpp_python-0.2.16/.git/HEAD +1 -0
  3. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/config +1 -1
  4. llama_cpp_python-0.2.16/.git/index +0 -0
  5. llama_cpp_python-0.2.16/.git/logs/HEAD +1 -0
  6. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/HEAD +1 -0
  7. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/config +1 -1
  8. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/index +0 -0
  9. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
  10. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
  11. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
  12. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.idx +0 -0
  13. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.pack → llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.pack +0 -0
  14. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/objects/pack/pack-e9e88c6e4829004ba3844e3ec02cda2d16322828.rev +0 -0
  15. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/packed-refs +2 -0
  16. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
  17. llama_cpp_python-0.2.16/.git/modules/vendor/llama.cpp/shallow +1 -0
  18. llama_cpp_python-0.2.16/.git/objects/23/c7e86cace58018b34f1dae1b548df9981eebf9 +0 -0
  19. llama_cpp_python-0.2.16/.git/objects/25/26bcbf5a89773bf179fd631c782274635da9e1 +0 -0
  20. llama_cpp_python-0.2.16/.git/objects/2a/6aed81cf0cc6d59972fe184a57666f281dbe8f +0 -0
  21. llama_cpp_python-0.2.16/.git/objects/2e/18b47a0261b4e81255fc71811a7c2405e4e19f +0 -0
  22. llama_cpp_python-0.2.14/.git/objects/b7/ea27646d138e37efaad41d5a659d3da6537b6f → llama_cpp_python-0.2.16/.git/objects/36/90f40c28d3d9821712c70f68a25f5671bfcaa8 +0 -0
  23. llama_cpp_python-0.2.16/.git/objects/45/a1513dde96b5d7f0e3b3a49fc3d7bcda8f7c6f +0 -0
  24. llama_cpp_python-0.2.16/.git/objects/4d/c32b015468696f721ddb37a53d09cf5f9c7612 +0 -0
  25. llama_cpp_python-0.2.16/.git/objects/54/3365d8d631f36da2f57381801edabbc3ca4769 +0 -0
  26. llama_cpp_python-0.2.16/.git/objects/5b/51e98ce432974ff031367f8937babe755e3d73 +0 -0
  27. llama_cpp_python-0.2.16/.git/objects/61/027ef99725c50b0891fdbf0bf263a33abe648f +0 -0
  28. llama_cpp_python-0.2.16/.git/objects/6c/3a6e594fab3a61940f00840cb717f53ea1e8b7 +0 -0
  29. llama_cpp_python-0.2.16/.git/objects/72/f6a1211b53960672f7af628800bc86a7c5c547 +0 -0
  30. llama_cpp_python-0.2.16/.git/objects/7b/01670640a150525c7671a7a3c1ae652a2d7b3d +0 -0
  31. llama_cpp_python-0.2.16/.git/objects/81/d58f627258591fc76e28e8378d0f9c3d49c9e5 +0 -0
  32. llama_cpp_python-0.2.16/.git/objects/8d/063708d0b17c59a8637d2d35ec39e7e27b8171 +0 -0
  33. llama_cpp_python-0.2.14/.git/objects/18/41560fc0a62ec24c46e99ddace261786ce07b0 → llama_cpp_python-0.2.16/.git/objects/8e/841233c07f9d6be8b4bf1e25231789a84781c0 +0 -0
  34. llama_cpp_python-0.2.16/.git/objects/a0/b7d5b55cf67870c3efc3e5c42b96196d1f707c +0 -0
  35. llama_cpp_python-0.2.16/.git/objects/a2/4e55042fd63aeb7e9873fff7474cc9141f4474 +0 -0
  36. llama_cpp_python-0.2.16/.git/objects/b7/e60b66f47950e385980a1329af9dfb14da6906 +4 -0
  37. llama_cpp_python-0.2.16/.git/objects/e0/b98f7ec76339ad83913015531541a7de9d8e1e +0 -0
  38. llama_cpp_python-0.2.16/.git/objects/e2/1e0bd82d6cacf620ea2f2dd7e8e7e2ee34b42a +0 -0
  39. llama_cpp_python-0.2.16/.git/objects/e6/f024107b7e75246ba7a7b083b2aafaada82697 +0 -0
  40. llama_cpp_python-0.2.14/.git/objects/b3/164f85806ec28003f217bd108671c4143298d7 → llama_cpp_python-0.2.16/.git/objects/f1/76c95ddb207e422703d8a73dd0d12a984a838f +0 -0
  41. llama_cpp_python-0.2.16/.git/objects/f1/b8e9d154231932c4b7b9b59611626764e68632 +0 -0
  42. llama_cpp_python-0.2.16/.git/objects/f7/2b9b39ef1e5d433ac15638f1090b96c582eb5b +0 -0
  43. llama_cpp_python-0.2.16/.git/refs/tags/v0.2.16 +1 -0
  44. llama_cpp_python-0.2.16/.git/shallow +1 -0
  45. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/build-and-release.yaml +3 -0
  46. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/CHANGELOG.md +23 -2
  47. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/CMakeLists.txt +19 -0
  48. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/PKG-INFO +1 -1
  49. llama_cpp_python-0.2.16/docs/server.md +121 -0
  50. llama_cpp_python-0.2.16/examples/notebooks/Functions.ipynb +400 -0
  51. llama_cpp_python-0.2.16/examples/notebooks/Multimodal.ipynb +81 -0
  52. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/__init__.py +1 -1
  53. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama.py +80 -35
  54. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_chat_format.py +400 -73
  55. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_grammar.py +25 -11
  56. llama_cpp_python-0.2.16/llama_cpp/llama_types.py +292 -0
  57. llama_cpp_python-0.2.16/llama_cpp/llava_cpp.py +232 -0
  58. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/app.py +41 -14
  59. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/tests/test_llama.py +16 -12
  60. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.gitignore +1 -1
  61. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/Makefile +5 -2
  62. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/CMakeLists.txt +1 -0
  63. llama_cpp_python-0.2.16/vendor/llama.cpp/common/base64.hpp +392 -0
  64. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/build-info.cpp +1 -1
  65. llama_cpp_python-0.2.16/vendor/llama.cpp/convert-hf-to-gguf.py +890 -0
  66. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert.py +2 -2
  67. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/finetune.cpp +1 -1
  68. llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/CMakeLists.txt +36 -0
  69. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/README.md +3 -4
  70. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/clip.cpp +53 -33
  71. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/clip.h +31 -10
  72. llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava-cli.cpp +313 -0
  73. llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava.cpp +156 -0
  74. llama_cpp_python-0.2.16/vendor/llama.cpp/examples/llava/llava.h +50 -0
  75. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/CMakeLists.txt +1 -1
  76. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/README.md +2 -0
  77. llama_cpp_python-0.2.16/vendor/llama.cpp/examples/server/index.html.hpp +2693 -0
  78. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/index.html +2 -0
  79. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/server.cpp +2 -0
  80. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-alloc.c +12 -9
  81. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-cuda.cu +16 -1
  82. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-cuda.h +5 -0
  83. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml.c +78 -252
  84. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml.h +5 -0
  85. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/gguf.py +53 -29
  86. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/pyproject.toml +1 -1
  87. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/llama.cpp +105 -74
  88. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/mypy.ini +1 -0
  89. llama_cpp_python-0.2.14/.git/FETCH_HEAD +0 -1
  90. llama_cpp_python-0.2.14/.git/HEAD +0 -1
  91. llama_cpp_python-0.2.14/.git/index +0 -0
  92. llama_cpp_python-0.2.14/.git/logs/HEAD +0 -1
  93. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/HEAD +0 -1
  94. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/index +0 -0
  95. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
  96. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
  97. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
  98. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.idx +0 -0
  99. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/objects/pack/pack-b61192bd8cad228f74cabbb6f8e9c7e3dbc55ee9.rev +0 -0
  100. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/packed-refs +0 -2
  101. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
  102. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/refs/tags/b1492 +0 -1
  103. llama_cpp_python-0.2.14/.git/modules/vendor/llama.cpp/shallow +0 -1
  104. llama_cpp_python-0.2.14/.git/objects/09/96e07d6e6f540436b8bc96e3be3d7eac233287 +0 -0
  105. llama_cpp_python-0.2.14/.git/objects/13/56d3755566a5e042d839c322ec0792e20c7c34 +0 -0
  106. llama_cpp_python-0.2.14/.git/objects/29/431d957feeaf2b06286bd907531b9dee4a684c +0 -0
  107. llama_cpp_python-0.2.14/.git/objects/42/c01fe549a5ce2e41ac9743cebaeb971973dfb4 +0 -0
  108. llama_cpp_python-0.2.14/.git/objects/4d/27bb00b5c86698291f231596f8bd2cb3fc6103 +0 -0
  109. llama_cpp_python-0.2.14/.git/objects/54/48743818ecc40b31daf66fb4b03f69c6e75f2f +0 -0
  110. llama_cpp_python-0.2.14/.git/objects/56/171cf7bfe224c9ef951d47cfc76fe1424ecdd1 +0 -5
  111. llama_cpp_python-0.2.14/.git/objects/58/659745f0bb9e72b901e5e0856fdb484fe2ab14 +0 -0
  112. llama_cpp_python-0.2.14/.git/objects/6d/c113ac97de73fa5caac40fb26d0d54dd2052ab +0 -0
  113. llama_cpp_python-0.2.14/.git/objects/75/0f9d3b7571b82685146780a10401475f795de7 +0 -0
  114. llama_cpp_python-0.2.14/.git/objects/85/1b09feb053b3e752530d2ee171ca5d1f458bff +0 -0
  115. llama_cpp_python-0.2.14/.git/objects/88/8f38dbbb6e5e0e4db95c5c1fc2b0124ceaa814 +0 -0
  116. llama_cpp_python-0.2.14/.git/objects/90/3a8c9089b0b6b51803c48911d168e1ef5bf145 +0 -0
  117. llama_cpp_python-0.2.14/.git/objects/93/afc3ee9d99b67bfcd0a79801be4a10981779b2 +0 -0
  118. llama_cpp_python-0.2.14/.git/objects/95/a820e82ed6b6ac5777d4f09e5a0492d39e66a5 +0 -0
  119. llama_cpp_python-0.2.14/.git/objects/a6/4033ea04e4e63c3a6eacef1a1d2f9788d2d6f0 +0 -0
  120. llama_cpp_python-0.2.14/.git/objects/a9/43b4ad0f7b2596ccf18d582ae8baf624862f01 +0 -0
  121. llama_cpp_python-0.2.14/.git/objects/c6/33c0797f8d3c6e0e238793cece0fee5df49d76 +0 -0
  122. llama_cpp_python-0.2.14/.git/objects/ce/d86f6fa2de2add170191515772e99fbd1c3388 +0 -0
  123. llama_cpp_python-0.2.14/.git/refs/tags/v0.2.14 +0 -1
  124. llama_cpp_python-0.2.14/.git/shallow +0 -1
  125. llama_cpp_python-0.2.14/examples/notebooks/Functions.ipynb +0 -225
  126. llama_cpp_python-0.2.14/llama_cpp/llama_types.py +0 -172
  127. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-bloom-hf-to-gguf.py +0 -247
  128. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-falcon-hf-to-gguf.py +0 -253
  129. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-gptneox-hf-to-gguf.py +0 -221
  130. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-mpt-hf-to-gguf.py +0 -227
  131. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-refact-hf-to-gguf.py +0 -272
  132. llama_cpp_python-0.2.14/vendor/llama.cpp/convert-starcoder-hf-to-gguf.py +0 -210
  133. llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -14
  134. llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/llava-utils.h +0 -147
  135. llama_cpp_python-0.2.14/vendor/llama.cpp/examples/llava/llava.cpp +0 -164
  136. llama_cpp_python-0.2.14/vendor/llama.cpp/examples/server/index.html.hpp +0 -2679
  137. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.dockerignore +0 -0
  138. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/description +0 -0
  139. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/applypatch-msg.sample +0 -0
  140. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/commit-msg.sample +0 -0
  141. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/fsmonitor-watchman.sample +0 -0
  142. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/post-update.sample +0 -0
  143. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-applypatch.sample +0 -0
  144. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-commit.sample +0 -0
  145. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-merge-commit.sample +0 -0
  146. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-push.sample +0 -0
  147. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-rebase.sample +0 -0
  148. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/pre-receive.sample +0 -0
  149. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/prepare-commit-msg.sample +0 -0
  150. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/push-to-checkout.sample +0 -0
  151. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/sendemail-validate.sample +0 -0
  152. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/hooks/update.sample +0 -0
  153. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/info/exclude +0 -0
  154. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/description +0 -0
  155. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
  156. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
  157. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
  158. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
  159. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
  160. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
  161. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
  162. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
  163. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
  164. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
  165. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
  166. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
  167. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
  168. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
  169. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
  170. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
  171. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/04/5856ea2ffe697ec33db1c1c989bd45cde5bb3d +0 -0
  172. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/04/7bc14424303575f73af90611fec827334f54e8 +0 -0
  173. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/11/2a0f7872fa9244bf38729a2722dc5c08dec20c +0 -0
  174. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/11/b6d5c26e3f7157658952b8ec353e985d522fac +0 -0
  175. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/12/90cad4931d6fc9b80e00baadecda4d45b1f005 +0 -0
  176. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/13/c5b6b0df5f67e80cbe584909b83777901265a1 +0 -0
  177. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/19/9bd4ffbf88c68c98b52c05f388dfa92716f6b7 +0 -0
  178. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/1b/61eec690c380fe7d97e6bd30310f49d4ed0fa6 +0 -0
  179. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/23/e37d4d40e5ec0bfd85b5e928834d58e2cf0da6 +0 -0
  180. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/24/04228325d88c59b819acaedb20b15635f75df9 +0 -0
  181. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/27/2e4767b47397d1529e6a2d01298144d9d746ba +0 -0
  182. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/29/03e0146d304bcacbfabfe71f171a2edc03043e +0 -0
  183. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/33/197007d97015ba62fb8fe835bf6eabe5bebd86 +0 -0
  184. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/3a/1d7180d508818fe957923e00dcd8950938632d +0 -0
  185. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/3a/6457dcdfd47e764654bacae0ba8347976b645a +0 -0
  186. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/41/cc68ea2402cf682807649d841e7c0f4175db01 +0 -0
  187. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/44/b6d4a35d3caf0c65aef0a1c77ff0ab4077d405 +0 -0
  188. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/47/4503fdfc554d8caabee4f321a80427f8c7d696 +0 -0
  189. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/4b/3189dd1a54be3bc416786ddf184dd047dc4b20 +0 -0
  190. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/4b/38dbacb6208ed2496e517018b0670beb21be65 +0 -0
  191. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/51/f357200f8b998031f4be924e11ed2ae4bf3fea +0 -0
  192. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/55/d08db5f514fb6847938e3d6489b99f737ba6e3 +0 -0
  193. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/5d/f12aaf53a0e85f55e1aa0e5167bc831ab32783 +0 -0
  194. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/60/bc7aef42aac0409cfdca666ad2ff6f516d7b5b +0 -0
  195. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/67/50769eef1992c7eaa624b9e602109a0ea77118 +0 -0
  196. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/68/7316b327ca038d26a338b3070a7d4698322515 +0 -0
  197. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/6c/10225819e88df6faf38ed409b00e6ae9a4d139 +0 -0
  198. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/74/7c6130e3cb1479d20e2013b1dd3db3379c2266 +0 -0
  199. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/76/e26fbd106895fba52861f8ac1e11cc6ee2a307 +0 -0
  200. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7d/6c970483161eaf43cfa9d50010c071d4953053 +0 -0
  201. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/069b1903cc69a74e562a32ef8b0c1bd22d41d2 +0 -0
  202. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/df0975dc12ccc95ad14de085f07efe6d65c620 +0 -0
  203. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/7e/e8f748eab47180cea09c0ad8e75c3b991b4af4 +0 -0
  204. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/82/e5c4487e57d6d59c901a73bdd2a9bc172fee7c +0 -0
  205. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/8b/d03f88a1895cbf3ef249e13df79ee0efda779d +0 -0
  206. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/91/abb11fdf507883caeeb2d2958e1c65fb6cbdc1 +0 -0
  207. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/94/1a4eac8ffb4e7978bb8d6ef5108efdb06975bf +0 -0
  208. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/99/32d6130f5552a9b85c8b15b4ac6bc26b1068ce +0 -0
  209. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/9c/eb1f3c9e1498b2fddc890b8cbf6e883dccc488 +0 -0
  210. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/9d/0ec2f705618e591cfa8d6512cb9a96b3da75f1 +0 -0
  211. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a2/94ebf8a4ed0b4dd705aaeaccd0df201e361c8b +0 -0
  212. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a4/d21004f628b4160ab02a0299960a55f7c516cb +0 -0
  213. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/a9/e51cdc1672134ec9af66c9eccf09f6da4ceccd +0 -0
  214. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ae/e2d8a965593394373d618a49f4f392600d0072 +0 -0
  215. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/b9/1632f5bc787c1404600c894a6a4126359747d8 +0 -0
  216. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/bb/cbbe7d61558adde3cbfd0c7a63a67c27ed6d30 +0 -0
  217. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/c8/5e73d2b657bb05ed99309615d67bac93d9f86e +0 -0
  218. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ca/ebbb67fdb02a0a8897d4e4826ea046a9931f6f +0 -0
  219. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/cc/6a3a7252ea6e698614f0629d4bc040ab6ca717 +0 -0
  220. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/d3/329eec3bac6ce7e54c76b77ac9bf99fab0fe3f +0 -0
  221. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/d4/888b448a6895f87411f7c52dc23f1ad5f0d8f6 +0 -0
  222. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e3/cff3251c7fb6410937ee586b94f7b84331da2f +0 -0
  223. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e4/1f375774e6945e445bfb179502b128fe22dda7 +0 -0
  224. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e6/9de29bb2d1d6434b8b29ae775ad8c2e48c5391 +0 -0
  225. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e9/30609ff5c479a1d5e12a8f3993582d421a6326 +0 -0
  226. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/e9/48f8deb150039c6853e14537a8dd0cc9002b72 +0 -0
  227. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/eb/9a2cfa9167df02f136502af79738c71363abfd +0 -0
  228. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fc/25ff5160028dee3570249abc40cd57780bcca9 +0 -0
  229. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fc/ef8cd800ee8a265b146748d178cb56b5632bf3 +0 -0
  230. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fd/64c09b37947c97e58903ce570785c657d56722 +0 -0
  231. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/fe/b0ed68d94eac48b844fd587ddfb808649716a1 +0 -0
  232. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.git/objects/ff/3e950cd1110fe552912cea4c268c4023d2b737 +0 -0
  233. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
  234. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
  235. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/dependabot.yml +0 -0
  236. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/build-docker.yaml +0 -0
  237. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/publish-to-test.yaml +0 -0
  238. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/publish.yaml +0 -0
  239. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/test-pypi.yaml +0 -0
  240. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.github/workflows/test.yaml +0 -0
  241. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.gitignore +0 -0
  242. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.gitmodules +0 -0
  243. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/.readthedocs.yaml +0 -0
  244. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/LICENSE.md +0 -0
  245. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/Makefile +0 -0
  246. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/README.md +0 -0
  247. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/README.md +0 -0
  248. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/cuda_simple/Dockerfile +0 -0
  249. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/Dockerfile +0 -0
  250. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/build.sh +0 -0
  251. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/hug_model.py +0 -0
  252. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/start.sh +0 -0
  253. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/open_llama/start_server.sh +0 -0
  254. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/openblas_simple/Dockerfile +0 -0
  255. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/simple/Dockerfile +0 -0
  256. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docker/simple/run.sh +0 -0
  257. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/api-reference.md +0 -0
  258. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/changelog.md +0 -0
  259. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/index.md +0 -0
  260. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/install/macos.md +0 -0
  261. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/docs/requirements.txt +0 -0
  262. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/fastapi_server.py +0 -0
  263. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_embedding.py +0 -0
  264. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_inference.py +0 -0
  265. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/high_level_api_streaming.py +0 -0
  266. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/high_level_api/langchain_custom_llm.py +0 -0
  267. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/Chat.py +0 -0
  268. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/Miku.py +0 -0
  269. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/ReasonAct.py +0 -0
  270. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/common.py +0 -0
  271. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
  272. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
  273. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/quantize.py +0 -0
  274. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/low_level_api/util.py +0 -0
  275. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Batching.ipynb +0 -0
  276. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Clients.ipynb +0 -0
  277. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/Guidance.ipynb +0 -0
  278. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/examples/notebooks/PerformanceTuning.ipynb +0 -0
  279. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/_utils.py +0 -0
  280. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/llama_cpp.py +0 -0
  281. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/py.typed +0 -0
  282. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/__init__.py +0 -0
  283. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/llama_cpp/server/__main__.py +0 -0
  284. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/mkdocs.yml +0 -0
  285. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/pyproject.toml +0 -0
  286. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.clang-tidy +0 -0
  287. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
  288. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
  289. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
  290. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
  291. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
  292. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
  293. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
  294. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.devops/tools.sh +0 -0
  295. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.dockerignore +0 -0
  296. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.ecrc +0 -0
  297. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.editorconfig +0 -0
  298. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.flake8 +0 -0
  299. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.git +0 -0
  300. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
  301. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
  302. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
  303. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
  304. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
  305. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
  306. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
  307. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/tidy-post.yml +0 -0
  308. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/tidy-review.yml +0 -0
  309. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
  310. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
  311. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/CMakeLists.txt +0 -0
  312. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/LICENSE +0 -0
  313. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/Package.swift +0 -0
  314. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/README.md +0 -0
  315. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/SHA256SUMS +0 -0
  316. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/build.zig +0 -0
  317. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ci/README.md +0 -0
  318. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ci/run.sh +0 -0
  319. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
  320. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/codecov.yml +0 -0
  321. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
  322. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/common.cpp +0 -0
  323. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/common.h +0 -0
  324. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/console.cpp +0 -0
  325. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/console.h +0 -0
  326. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
  327. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/grammar-parser.h +0 -0
  328. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/log.h +0 -0
  329. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/sampling.cpp +0 -0
  330. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/sampling.h +0 -0
  331. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/stb_image.h +0 -0
  332. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/train.cpp +0 -0
  333. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/common/train.h +0 -0
  334. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-baichuan-hf-to-gguf.py +0 -0
  335. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
  336. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
  337. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
  338. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/docs/BLIS.md +0 -0
  339. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
  340. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
  341. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/Miku.sh +0 -0
  342. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/alpaca.sh +0 -0
  343. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
  344. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
  345. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
  346. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/README.md +0 -0
  347. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
  348. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
  349. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
  350. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +0 -0
  351. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
  352. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
  353. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
  354. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
  355. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
  356. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
  357. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
  358. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
  359. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
  360. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
  361. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
  362. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
  363. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
  364. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/chat.sh +0 -0
  365. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
  366. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
  367. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
  368. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
  369. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/README.md +0 -0
  370. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
  371. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
  372. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
  373. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
  374. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
  375. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/README.md +0 -0
  376. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
  377. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
  378. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
  379. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
  380. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
  381. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
  382. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/README.md +0 -0
  383. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
  384. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
  385. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
  386. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
  387. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
  388. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
  389. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/json-schema-to-grammar.py +0 -0
  390. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
  391. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/README.md +0 -0
  392. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +0 -0
  393. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama.vim +0 -0
  394. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
  395. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llama2.sh +0 -0
  396. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
  397. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
  398. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/llm.vim +0 -0
  399. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
  400. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/README.md +0 -0
  401. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main/main.cpp +0 -0
  402. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
  403. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
  404. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
  405. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/make-ggml.py +0 -0
  406. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/metal/CMakeLists.txt +0 -0
  407. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/metal/metal.cpp +0 -0
  408. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
  409. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/README.md +0 -0
  410. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
  411. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
  412. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
  413. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +0 -0
  414. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
  415. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/README.md +0 -0
  416. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
  417. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
  418. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
  419. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/reason-act.sh +0 -0
  420. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
  421. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
  422. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/api_like_OAI.py +0 -0
  423. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
  424. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
  425. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/chat.sh +0 -0
  426. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/completion.js.hpp +0 -0
  427. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/deps.sh +0 -0
  428. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/httplib.h +0 -0
  429. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/index.js.hpp +0 -0
  430. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/json-schema-to-grammar.mjs.hpp +0 -0
  431. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/json.hpp +0 -0
  432. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
  433. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/index.js +0 -0
  434. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
  435. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
  436. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
  437. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/README.md +0 -0
  438. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
  439. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
  440. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
  441. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
  442. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
  443. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
  444. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
  445. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/flake.lock +0 -0
  446. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/flake.nix +0 -0
  447. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-alloc.h +0 -0
  448. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-backend.c +0 -0
  449. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-backend.h +0 -0
  450. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-impl.h +0 -0
  451. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.h +0 -0
  452. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.m +0 -0
  453. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-metal.metal +0 -0
  454. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-mpi.c +0 -0
  455. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-mpi.h +0 -0
  456. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
  457. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-opencl.h +0 -0
  458. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-quants.c +0 -0
  459. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/ggml-quants.h +0 -0
  460. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
  461. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/README.md +0 -0
  462. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
  463. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
  464. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
  465. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/README.md +0 -0
  466. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
  467. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/c.gbnf +0 -0
  468. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
  469. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
  470. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/json.gbnf +0 -0
  471. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
  472. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/grammars/list.gbnf +0 -0
  473. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/llama.h +0 -0
  474. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
  475. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama0-banner.png +0 -0
  476. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama0-logo.png +0 -0
  477. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama1-banner.png +0 -0
  478. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/media/llama1-logo.png +0 -0
  479. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
  480. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
  481. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
  482. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
  483. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
  484. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
  485. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/assistant.txt +0 -0
  486. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
  487. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
  488. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
  489. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
  490. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/chat.txt +0 -0
  491. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
  492. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/dan.txt +0 -0
  493. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
  494. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
  495. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
  496. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/requirements.txt +0 -0
  497. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/run_with_preset.py +0 -0
  498. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
  499. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
  500. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/build-info.sh +0 -0
  501. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
  502. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
  503. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
  504. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
  505. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
  506. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
  507. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
  508. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
  509. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
  510. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/spm-headers/llama.h +0 -0
  511. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
  512. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-c.c +0 -0
  513. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
  514. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
  515. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
  516. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
  517. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
  518. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
  519. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
  520. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
  521. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
  522. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.cpp +0 -0
  523. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-falcon.py +0 -0
  524. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-llama.cpp +0 -0
  525. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-0-llama.py +0 -0
  526. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
  527. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/tests/test-tokenizer-1-llama.cpp +0 -0
  528. {llama_cpp_python-0.2.14 → llama_cpp_python-0.2.16}/vendor/llama.cpp/unicode.h +0 -0
@@ -0,0 +1 @@
1
+ b7e60b66f47950e385980a1329af9dfb14da6906 'b7e60b66f47950e385980a1329af9dfb14da6906' of https://github.com/abetlen/llama-cpp-python
@@ -0,0 +1 @@
1
+ b7e60b66f47950e385980a1329af9dfb14da6906
@@ -9,7 +9,7 @@
9
9
  [gc]
10
10
  auto = 0
11
11
  [http "https://github.com/"]
12
- extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JoYkh4YlZ0cmp6anh3ajNkZ3pBOEFZREFmTVZQWjFsOFZnMQ==
12
+ extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzJBc3h5aUVKQkZ1Q3M5bjVaWU1ZTk9za3hoSzh0VDFMeVdwRw==
13
13
  [submodule "vendor/llama.cpp"]
14
14
  active = true
15
15
  url = https://github.com/ggerganov/llama.cpp.git
Binary file
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 b7e60b66f47950e385980a1329af9dfb14da6906 runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615337 +0000 checkout: moving from master to refs/tags/v0.2.16
@@ -0,0 +1 @@
1
+ a75fa576abba9d37f463580c379e4bbf1e1ad03c
@@ -13,7 +13,7 @@
13
13
  [gc]
14
14
  auto = 0
15
15
  [http "https://github.com/"]
16
- extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JoYkh4YlZ0cmp6anh3ajNkZ3pBOEFZREFmTVZQWjFsOFZnMQ==
16
+ extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzXzJBc3h5aUVKQkZ1Q3M5bjVaWU1ZTk9za3hoSzh0VDFMeVdwRw==
17
17
  [url "https://github.com/"]
18
18
  insteadOf = git@github.com:
19
19
  insteadOf = org-6826477@github.com:
@@ -0,0 +1,2 @@
1
+ 0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
2
+ a75fa576abba9d37f463580c379e4bbf1e1ad03c a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 checkout: moving from master to a75fa576abba9d37f463580c379e4bbf1e1ad03c
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 a75fa576abba9d37f463580c379e4bbf1e1ad03c runner <runner@fv-az711-229.kxtiaivj4gxuxgxjt4etq45iac.phxx.internal.cloudapp.net> 1699615338 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
@@ -0,0 +1,2 @@
1
+ # pack-refs with: peeled fully-peeled sorted
2
+ a75fa576abba9d37f463580c379e4bbf1e1ad03c refs/remotes/origin/master
@@ -0,0 +1 @@
1
+ a75fa576abba9d37f463580c379e4bbf1e1ad03c
@@ -0,0 +1 @@
1
+ a75fa576abba9d37f463580c379e4bbf1e1ad03c
@@ -0,0 +1,4 @@
1
+ x��Q�0��)��miwKb�r��,JB����%���If�Қ�T�9>բ
2
+ ܣ%F�(6`p!1��&YQ
3
+ N��}3�M�.ƞ}3R��� �%�\�t$��&!
4
+ ����x,C� :��.p��7��,�|Ik����h=�1 ����%�n�|���u1_1�FW
@@ -0,0 +1 @@
1
+ b7e60b66f47950e385980a1329af9dfb14da6906
@@ -0,0 +1 @@
1
+ b7e60b66f47950e385980a1329af9dfb14da6906
@@ -33,6 +33,9 @@ jobs:
33
33
 
34
34
  - name: Build wheels
35
35
  run: python -m cibuildwheel --output-dir wheelhouse
36
+ env:
37
+ # disable repair
38
+ CIBW_REPAIR_WHEEL_COMMAND: ""
36
39
 
37
40
  - uses: actions/upload-artifact@v3
38
41
  with:
@@ -7,9 +7,30 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
7
7
 
8
8
  ## [Unreleased]
9
9
 
10
+ ## [0.2.16]
11
+
12
+ - Update llama.cpp to ggerganov/llama.cp@a75fa576abba9d37f463580c379e4bbf1e1ad03c
13
+ - Add `set_seed` to `Llama` class by @abetlen in fd41ed3a908761d286102a019a34c2938a15118d
14
+ - Fix server doc arguments by @kjunggithub in #892
15
+ - Fix response_format handler in llava chat handler by @abetlen in b62c44983921197ed10a7d29dc4ba920e9979380
16
+ - Fix default max_tokens, chat completion is now unlimited (to context length) and completion is 16 tokens to match OpenAI defaults by @abetlen in e7962d2c733cbbeec5a37392c81f64185a9a39e8
17
+ - Fix json_schema_to_gbnf helper so that it takes a json schema string as input instead by @abetlen in faeae181b1e868643c0dc28fcf039f077baf0829
18
+ - Add support for $ref and $def in json_schema_to_gbnf to handle more complex function schemas by @abetlen in 770df344369c0630df1be14be9f9e301e7c56d24
19
+ - Update functionary chat handler for new OpenAI api by abetlen in 1b376c62b775b401653facf25a519d116aafe99a
20
+ - Fix add default stop sequence to chatml chat format by @abetlen in b84d76a844149216d511cfd8cdb9827148a1853c
21
+ - Fix sampling bug when logits_all=False by @abetlen in 6f0b0b1b840af846938ed74d0e8170a91c40e617
22
+
23
+ ## [0.2.15]
24
+
25
+ - Update llama.cpp to ggerganov/llama.cpp@0a7c980b6f94a049cb804573df2d8092a34df8e4
26
+ - Add support for Llava1.5 multimodal models by @damian0815 and @abetlen in #821
27
+ - Update OpenAI API compatibility to match dev day update by @abetlen in #821
28
+ - Add seed parameter to completion and chat_completion functions of Llama class by @abetlen in 86aeb9f3a14808575d2bb0076e6acb4a30907e6a
29
+ - Add JSON mode support to constrain chat completion to JSON objects by @abetlen in b30b9c338bf9af316d497ea501d39f5c246900db
30
+
10
31
  ## [0.2.14]
11
32
 
12
- - Update llama.cpp to f0b30ef7dc1360922ccbea0a8cd3918ecf15eaa7
33
+ - Update llama.cpp to ggerganov/llama.cpp@f0b30ef7dc1360922ccbea0a8cd3918ecf15eaa7
13
34
  - Add support for Huggingface Autotokenizer Chat Formats by @bioshazard and @abetlen in #790 and bbffdaebaa7bb04b543dbf683a07276087251f86
14
35
  - Fix llama-2 chat format by @earonesty in #869
15
36
  - Add support for functionary chat format by @abetlen in #784
@@ -17,7 +38,7 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
17
38
 
18
39
  ## [0.2.13]
19
40
 
20
- - Update llama.cpp to 51b2fc11f7f605fff49725a4540e9a6ef7b51b70
41
+ - Update llama.cpp to ggerganov/llama.cpp@51b2fc11f7f605fff49725a4540e9a6ef7b51b70
21
42
  - Fix name 'open' is not defined exception when deleting model by @abetlen in 011b95d7f34cbfc528af75a892757bd9a20838ab
22
43
  - Fix tokenization of special characters by @antoine-lizee in #850
23
44
 
@@ -41,4 +41,23 @@ if (LLAMA_BUILD)
41
41
  FILES $<TARGET_RUNTIME_DLLS:llama>
42
42
  DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
43
43
  )
44
+ add_subdirectory(vendor/llama.cpp/examples/llava)
45
+ set_target_properties(llava_shared PROPERTIES OUTPUT_NAME "llava")
46
+ install(
47
+ TARGETS llava_shared
48
+ LIBRARY DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
49
+ RUNTIME DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
50
+ ARCHIVE DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
51
+ FRAMEWORK DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
52
+ RESOURCE DESTINATION ${SKBUILD_PLATLIB_DIR}/llama_cpp
53
+ )
54
+ # Temporary fix for https://github.com/scikit-build/scikit-build-core/issues/374
55
+ install(
56
+ TARGETS llava_shared
57
+ LIBRARY DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
58
+ RUNTIME DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
59
+ ARCHIVE DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
60
+ FRAMEWORK DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
61
+ RESOURCE DESTINATION ${CMAKE_CURRENT_SOURCE_DIR}/llama_cpp
62
+ )
44
63
  endif()
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: llama_cpp_python
3
- Version: 0.2.14
3
+ Version: 0.2.16
4
4
  Summary: Python bindings for the llama.cpp library
5
5
  Author-Email: Andrei Betlen <abetlen@gmail.com>
6
6
  License: MIT
@@ -0,0 +1,121 @@
1
+ # OpenAI Compatible Server
2
+
3
+ `llama-cpp-python` offers an OpenAI API compatible web server.
4
+
5
+ This web server can be used to serve local models and easily connect them to existing clients.
6
+
7
+ ## Setup
8
+
9
+ ### Installation
10
+
11
+ The server can be installed by running the following command:
12
+
13
+ ```bash
14
+ pip install llama-cpp-python[server]
15
+ ```
16
+
17
+ ### Running the server
18
+
19
+ The server can then be started by running the following command:
20
+
21
+ ```bash
22
+ python3 -m llama_cpp.server --model <model_path>
23
+ ```
24
+
25
+ ### Server options
26
+
27
+ For a full list of options, run:
28
+
29
+ ```bash
30
+ python3 -m llama_cpp.server --help
31
+ ```
32
+
33
+ NOTE: All server options are also available as environment variables. For example, `--model` can be set by setting the `MODEL` environment variable.
34
+
35
+ ## Guides
36
+
37
+ ### Code Completion
38
+
39
+ `llama-cpp-python` supports code completion via GitHub Copilot.
40
+
41
+ *NOTE*: Without GPU acceleration this is unlikely to be fast enough to be usable.
42
+
43
+ You'll first need to download one of the available code completion models in GGUF format:
44
+
45
+ - [replit-code-v1_5-GGUF](https://huggingface.co/abetlen/replit-code-v1_5-3b-GGUF)
46
+
47
+ Then you'll need to run the OpenAI compatible web server with a increased context size substantially for GitHub Copilot requests:
48
+
49
+ ```bash
50
+ python3 -m llama_cpp.server --model <model_path> --n_ctx 16192
51
+ ```
52
+
53
+ Then just update your settings in `.vscode/settings.json` to point to your code completion server:
54
+
55
+ ```json
56
+ {
57
+ // ...
58
+ "github.copilot.advanced": {
59
+ "debug.testOverrideProxyUrl": "http://<host>:<port>",
60
+ "debug.overrideProxyUrl": "http://<host>:<port>"
61
+ }
62
+ // ...
63
+ }
64
+ ```
65
+
66
+ ### Function Calling
67
+
68
+ `llama-cpp-python` supports structured function calling based on a JSON schema.
69
+
70
+ You'll first need to download one of the available function calling models in GGUF format:
71
+
72
+ - [functionary-7b-v1](https://huggingface.co/abetlen/functionary-7b-v1-GGUF)
73
+
74
+ Then when you run the server you'll need to also specify the `functionary-7b-v1` chat_format
75
+
76
+ ```bash
77
+ python3 -m llama_cpp.server --model <model_path> --chat_format functionary
78
+ ```
79
+
80
+ ### Multimodal Models
81
+
82
+ `llama-cpp-python` supports the llava1.5 family of multi-modal models which allow the language model to
83
+ read information from both text and images.
84
+
85
+ You'll first need to download one of the available multi-modal models in GGUF format:
86
+
87
+ - [llava-v1.5-7b](https://huggingface.co/mys/ggml_llava-v1.5-7b)
88
+ - [llava-v1.5-13b](https://huggingface.co/mys/ggml_llava-v1.5-13b)
89
+ - [bakllava-1-7b](https://huggingface.co/mys/ggml_bakllava-1)
90
+
91
+ Then when you run the server you'll need to also specify the path to the clip model used for image embedding and the `llava-1-5` chat_format
92
+
93
+ ```bash
94
+ python3 -m llama_cpp.server --model <model_path> --clip_model_path <clip_model_path> --chat_format llava-1-5
95
+ ```
96
+
97
+ Then you can just use the OpenAI API as normal
98
+
99
+ ```python3
100
+ from openai import OpenAI
101
+
102
+ client = OpenAI(base_url="http://<host>:<port>/v1", api_key="sk-xxx")
103
+ response = client.chat.completions.create(
104
+ model="gpt-4-vision-preview",
105
+ messages=[
106
+ {
107
+ "role": "user",
108
+ "content": [
109
+ {
110
+ "type": "image_url",
111
+ "image_url": {
112
+ "url": "<image_url>"
113
+ },
114
+ },
115
+ {"type": "text", "text": "What does the image say"},
116
+ ],
117
+ }
118
+ ],
119
+ )
120
+ print(response)
121
+ ```