llama-cpp-python 0.2.67__tar.gz → 0.2.68__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (1081) hide show
  1. llama_cpp_python-0.2.68/.git/FETCH_HEAD +1 -0
  2. llama_cpp_python-0.2.68/.git/HEAD +1 -0
  3. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/config +1 -1
  4. llama_cpp_python-0.2.68/.git/index +0 -0
  5. llama_cpp_python-0.2.68/.git/logs/HEAD +1 -0
  6. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/HEAD +1 -0
  7. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/config +1 -1
  8. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/index +0 -0
  9. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/HEAD +2 -0
  10. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/heads/master +1 -0
  11. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +1 -0
  12. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/config +1 -1
  13. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
  14. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +2 -0
  15. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +1 -0
  16. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +1 -0
  17. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.idx → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.idx +0 -0
  18. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.pack → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.pack +0 -0
  19. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-dfe06cade21d4a3c314f514ca2e7bec04aebe5ea.rev → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/modules/kompute/objects/pack/pack-aea54470ccfced130dc113c076f9a5f9e05cddbf.rev +0 -0
  20. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.idx +0 -0
  21. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.pack → llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.pack +0 -0
  22. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/objects/pack/pack-80678416707e3403714c6fedf67fc0629e198f4c.rev +0 -0
  23. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/packed-refs +2 -0
  24. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/refs/heads/master +1 -0
  25. llama_cpp_python-0.2.68/.git/modules/vendor/llama.cpp/shallow +1 -0
  26. llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.idx +0 -0
  27. llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.pack → llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.pack +0 -0
  28. llama_cpp_python-0.2.68/.git/objects/pack/pack-d80e9c2842087fe2b118d96efa116f60e3086b09.rev +0 -0
  29. llama_cpp_python-0.2.68/.git/refs/tags/v0.2.68 +1 -0
  30. llama_cpp_python-0.2.68/.git/shallow +1 -0
  31. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-and-release.yaml +3 -8
  32. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/CHANGELOG.md +6 -0
  33. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/PKG-INFO +3 -2
  34. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/README.md +2 -1
  35. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/__init__.py +1 -1
  36. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama.py +4 -0
  37. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_cpp.py +7 -3
  38. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/settings.py +3 -0
  39. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ci/run.sh +6 -2
  40. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/build-info.cpp +1 -1
  41. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/common.cpp +7 -0
  42. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/common.h +1 -0
  43. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-hf-to-gguf-update.py +10 -6
  44. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-hf-to-gguf.py +8 -4
  45. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/batched-bench.cpp +17 -11
  46. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/llama-bench.cpp +27 -3
  47. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/bench.py +1 -0
  48. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/server.cpp +3 -0
  49. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/common.cuh +26 -14
  50. llama_cpp_python-0.2.68/vendor/llama.cpp/ggml-cuda/fattn.cu +944 -0
  51. llama_cpp_python-0.2.68/vendor/llama.cpp/ggml-cuda/fattn.cuh +3 -0
  52. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/softmax.cu +36 -10
  53. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda.cu +6 -0
  54. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-kompute.cpp +7 -0
  55. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.m +410 -176
  56. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.metal +654 -18
  57. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-sycl.cpp +5 -1
  58. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan.cpp +5 -0
  59. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml.c +360 -15
  60. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml.h +20 -0
  61. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/llama.cpp +367 -197
  62. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/llama.h +3 -2
  63. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-backend-ops.cpp +48 -4
  64. llama_cpp_python-0.2.67/.git/FETCH_HEAD +0 -1
  65. llama_cpp_python-0.2.67/.git/HEAD +0 -1
  66. llama_cpp_python-0.2.67/.git/index +0 -0
  67. llama_cpp_python-0.2.67/.git/logs/HEAD +0 -1
  68. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/HEAD +0 -1
  69. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/index +0 -0
  70. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/HEAD +0 -2
  71. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/refs/heads/master +0 -1
  72. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/logs/refs/remotes/origin/HEAD +0 -1
  73. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/index +0 -0
  74. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/HEAD +0 -2
  75. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/heads/master +0 -1
  76. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/modules/kompute/logs/refs/remotes/origin/HEAD +0 -1
  77. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.idx +0 -0
  78. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/objects/pack/pack-b2ae82d9afbb0ac8787798ddae3e8dbf0bc0b0bf.rev +0 -0
  79. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/packed-refs +0 -2
  80. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/refs/heads/master +0 -1
  81. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/refs/tags/b2769 +0 -1
  82. llama_cpp_python-0.2.67/.git/modules/vendor/llama.cpp/shallow +0 -1
  83. llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.idx +0 -0
  84. llama_cpp_python-0.2.67/.git/objects/pack/pack-4d004f221f5b5a3d64e532ac150c9f2f741e1616.rev +0 -0
  85. llama_cpp_python-0.2.67/.git/refs/tags/v0.2.67 +0 -1
  86. llama_cpp_python-0.2.67/.git/shallow +0 -1
  87. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.dockerignore +0 -0
  88. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/config.worktree +0 -0
  89. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/description +0 -0
  90. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/applypatch-msg.sample +0 -0
  91. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/commit-msg.sample +0 -0
  92. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/fsmonitor-watchman.sample +0 -0
  93. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/post-update.sample +0 -0
  94. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-applypatch.sample +0 -0
  95. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-commit.sample +0 -0
  96. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-merge-commit.sample +0 -0
  97. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-push.sample +0 -0
  98. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-rebase.sample +0 -0
  99. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/pre-receive.sample +0 -0
  100. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/prepare-commit-msg.sample +0 -0
  101. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/push-to-checkout.sample +0 -0
  102. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/sendemail-validate.sample +0 -0
  103. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/hooks/update.sample +0 -0
  104. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/info/exclude +0 -0
  105. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/description +0 -0
  106. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/applypatch-msg.sample +0 -0
  107. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/commit-msg.sample +0 -0
  108. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/fsmonitor-watchman.sample +0 -0
  109. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/post-update.sample +0 -0
  110. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-applypatch.sample +0 -0
  111. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-commit.sample +0 -0
  112. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-merge-commit.sample +0 -0
  113. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-push.sample +0 -0
  114. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-rebase.sample +0 -0
  115. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/pre-receive.sample +0 -0
  116. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/prepare-commit-msg.sample +0 -0
  117. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/push-to-checkout.sample +0 -0
  118. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/sendemail-validate.sample +0 -0
  119. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/hooks/update.sample +0 -0
  120. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/info/exclude +0 -0
  121. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/FETCH_HEAD +0 -0
  122. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/HEAD +0 -0
  123. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/description +0 -0
  124. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/applypatch-msg.sample +0 -0
  125. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/commit-msg.sample +0 -0
  126. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/fsmonitor-watchman.sample +0 -0
  127. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/post-update.sample +0 -0
  128. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-applypatch.sample +0 -0
  129. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-commit.sample +0 -0
  130. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-merge-commit.sample +0 -0
  131. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-push.sample +0 -0
  132. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-rebase.sample +0 -0
  133. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/pre-receive.sample +0 -0
  134. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/prepare-commit-msg.sample +0 -0
  135. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/push-to-checkout.sample +0 -0
  136. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/sendemail-validate.sample +0 -0
  137. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/hooks/update.sample +0 -0
  138. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/info/exclude +0 -0
  139. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/0c/588e19be7b9726e5ae8dae3569dea0fd990af1 +0 -0
  140. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/19/17e497d955de87fc0a472e21cf8fbf31112adf +0 -0
  141. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/30/3b5ceb11c6e3878c575cd53d863e5edcbc4550 +0 -0
  142. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/objects/45/65194ed7c32d1d2efa32ceab4d3c6cae006306 +0 -0
  143. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/packed-refs +0 -0
  144. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/refs/heads/master +0 -0
  145. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/refs/remotes/origin/HEAD +0 -0
  146. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/modules/kompute/shallow +0 -0
  147. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.git/modules/vendor/llama.cpp/refs/remotes/origin/HEAD +0 -0
  148. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/ISSUE_TEMPLATE/bug_report.md +0 -0
  149. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/ISSUE_TEMPLATE/feature_request.md +0 -0
  150. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/dependabot.yml +0 -0
  151. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-docker.yaml +0 -0
  152. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-wheels-cuda.yaml +0 -0
  153. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/build-wheels-metal.yaml +0 -0
  154. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/generate-index-from-release.yaml +0 -0
  155. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/publish-to-test.yaml +0 -0
  156. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/publish.yaml +0 -0
  157. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/test-pypi.yaml +0 -0
  158. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.github/workflows/test.yaml +0 -0
  159. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.gitignore +0 -0
  160. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.gitmodules +0 -0
  161. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/.readthedocs.yaml +0 -0
  162. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/CMakeLists.txt +0 -0
  163. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/LICENSE.md +0 -0
  164. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/Makefile +0 -0
  165. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/README.md +0 -0
  166. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/cuda_simple/Dockerfile +0 -0
  167. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/Dockerfile +0 -0
  168. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/build.sh +0 -0
  169. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/hug_model.py +0 -0
  170. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/start.sh +0 -0
  171. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/open_llama/start_server.sh +0 -0
  172. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/openblas_simple/Dockerfile +0 -0
  173. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/simple/Dockerfile +0 -0
  174. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docker/simple/run.sh +0 -0
  175. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/api-reference.md +0 -0
  176. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/changelog.md +0 -0
  177. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/index.md +0 -0
  178. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/install/macos.md +0 -0
  179. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/requirements.txt +0 -0
  180. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/docs/server.md +0 -0
  181. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/batch-processing/server.py +0 -0
  182. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/gradio_chat/local.py +0 -0
  183. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/gradio_chat/server.py +0 -0
  184. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/hf_pull/main.py +0 -0
  185. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/fastapi_server.py +0 -0
  186. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_embedding.py +0 -0
  187. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_inference.py +0 -0
  188. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/high_level_api_streaming.py +0 -0
  189. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/high_level_api/langchain_custom_llm.py +0 -0
  190. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/Chat.py +0 -0
  191. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/Miku.py +0 -0
  192. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/ReasonAct.py +0 -0
  193. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/common.py +0 -0
  194. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/low_level_api_chat_cpp.py +0 -0
  195. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/low_level_api_llama_cpp.py +0 -0
  196. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/quantize.py +0 -0
  197. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/readme/low_level_api_llama_cpp.md +0 -0
  198. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/low_level_api/util.py +0 -0
  199. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Batching.ipynb +0 -0
  200. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Clients.ipynb +0 -0
  201. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Functions.ipynb +0 -0
  202. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Guidance.ipynb +0 -0
  203. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/Multimodal.ipynb +0 -0
  204. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/OpenHermesFunctionCalling.ipynb +0 -0
  205. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/examples/notebooks/PerformanceTuning.ipynb +0 -0
  206. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_internals.py +0 -0
  207. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_logger.py +0 -0
  208. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/_utils.py +0 -0
  209. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_cache.py +0 -0
  210. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_chat_format.py +0 -0
  211. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_grammar.py +0 -0
  212. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_speculative.py +0 -0
  213. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_tokenizer.py +0 -0
  214. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llama_types.py +0 -0
  215. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/llava_cpp.py +0 -0
  216. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/py.typed +0 -0
  217. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/__init__.py +0 -0
  218. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/__main__.py +0 -0
  219. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/app.py +0 -0
  220. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/cli.py +0 -0
  221. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/errors.py +0 -0
  222. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/model.py +0 -0
  223. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/llama_cpp/server/types.py +0 -0
  224. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/mkdocs.yml +0 -0
  225. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/pyproject.toml +0 -0
  226. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/scripts/releases-to-pep-503.sh +0 -0
  227. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama.py +0 -0
  228. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_chat_format.py +0 -0
  229. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_grammar.py +0 -0
  230. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/tests/test_llama_speculative.py +0 -0
  231. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.clang-tidy +0 -0
  232. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/cloud-v-pipeline +0 -0
  233. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full-cuda.Dockerfile +0 -0
  234. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full-rocm.Dockerfile +0 -0
  235. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/full.Dockerfile +0 -0
  236. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-cuda.Dockerfile +0 -0
  237. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-intel.Dockerfile +0 -0
  238. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-rocm.Dockerfile +0 -0
  239. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main-vulkan.Dockerfile +0 -0
  240. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/main.Dockerfile +0 -0
  241. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/apps.nix +0 -0
  242. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/devshells.nix +0 -0
  243. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/docker.nix +0 -0
  244. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/jetson-support.nix +0 -0
  245. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/nixpkgs-instances.nix +0 -0
  246. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/package.nix +0 -0
  247. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/scope.nix +0 -0
  248. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/nix/sif.nix +0 -0
  249. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-cuda.Dockerfile +0 -0
  250. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-intel.Dockerfile +0 -0
  251. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-rocm.Dockerfile +0 -0
  252. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server-vulkan.Dockerfile +0 -0
  253. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/server.Dockerfile +0 -0
  254. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.devops/tools.sh +0 -0
  255. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.dockerignore +0 -0
  256. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.ecrc +0 -0
  257. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.editorconfig +0 -0
  258. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.flake8 +0 -0
  259. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.git +0 -0
  260. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/bug.md +0 -0
  261. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/ISSUE_TEMPLATE/enhancement.md +0 -0
  262. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/bench.yml +0 -0
  263. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/build.yml +0 -0
  264. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/close-issue.yml +0 -0
  265. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/code-coverage.yml +0 -0
  266. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/docker.yml +0 -0
  267. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/editorconfig.yml +0 -0
  268. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/gguf-publish.yml +0 -0
  269. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-ci-aarch64.yml +0 -0
  270. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-ci.yml +0 -0
  271. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-flake-update.yml +0 -0
  272. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/nix-publish-flake.yml +0 -0
  273. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/python-check-requirements.yml +0 -0
  274. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/python-lint.yml +0 -0
  275. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/server.yml +0 -0
  276. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.github/workflows/zig-build.yml +0 -0
  277. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.gitignore +0 -0
  278. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.gitmodules +0 -0
  279. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/.pre-commit-config.yaml +0 -0
  280. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/AUTHORS +0 -0
  281. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/CMakeLists.txt +0 -0
  282. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/LICENSE +0 -0
  283. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/Makefile +0 -0
  284. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/Package.swift +0 -0
  285. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/README-sycl.md +0 -0
  286. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/README.md +0 -0
  287. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/SECURITY.md +0 -0
  288. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/build.zig +0 -0
  289. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ci/README.md +0 -0
  290. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/cmake/FindSIMD.cmake +0 -0
  291. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/codecov.yml +0 -0
  292. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/CMakeLists.txt +0 -0
  293. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/base64.hpp +0 -0
  294. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/build-info.cpp.in +0 -0
  295. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/console.cpp +0 -0
  296. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/console.h +0 -0
  297. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/grammar-parser.cpp +0 -0
  298. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/grammar-parser.h +0 -0
  299. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
  300. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json-schema-to-grammar.h +0 -0
  301. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/json.hpp +0 -0
  302. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/log.h +0 -0
  303. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/ngram-cache.cpp +0 -0
  304. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/ngram-cache.h +0 -0
  305. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/sampling.cpp +0 -0
  306. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/sampling.h +0 -0
  307. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/stb_image.h +0 -0
  308. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/train.cpp +0 -0
  309. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/common/train.h +0 -0
  310. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-llama-ggml-to-gguf.py +0 -0
  311. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-lora-to-ggml.py +0 -0
  312. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert-persimmon-to-gguf.py +0 -0
  313. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/convert.py +0 -0
  314. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/BLIS.md +0 -0
  315. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/HOWTO-add-model.md +0 -0
  316. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/llama-star/idea-arch.key +0 -0
  317. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/llama-star/idea-arch.pdf +0 -0
  318. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/docs/token_generation_performance_tips.md +0 -0
  319. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/CMakeLists.txt +0 -0
  320. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/Miku.sh +0 -0
  321. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/alpaca.sh +0 -0
  322. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/baby-llama/CMakeLists.txt +0 -0
  323. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/baby-llama/baby-llama.cpp +0 -0
  324. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/base-translate.sh +0 -0
  325. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/CMakeLists.txt +0 -0
  326. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/README.md +0 -0
  327. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched/batched.cpp +0 -0
  328. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/CMakeLists.txt +0 -0
  329. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched-bench/README.md +0 -0
  330. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/.gitignore +0 -0
  331. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Makefile +0 -0
  332. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Package.swift +0 -0
  333. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/README.md +0 -0
  334. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/batched.swift/Sources/main.swift +0 -0
  335. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/beam-search/CMakeLists.txt +0 -0
  336. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/beam-search/beam-search.cpp +0 -0
  337. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/benchmark/CMakeLists.txt +0 -0
  338. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/benchmark/benchmark-matmult.cpp +0 -0
  339. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-13B.bat +0 -0
  340. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-13B.sh +0 -0
  341. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-persistent.sh +0 -0
  342. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat-vicuna.sh +0 -0
  343. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/chat.sh +0 -0
  344. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
  345. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/README.md +0 -0
  346. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
  347. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
  348. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/README.md +0 -0
  349. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/embedding/embedding.cpp +0 -0
  350. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
  351. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/README.md +0 -0
  352. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
  353. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/CMakeLists.txt +0 -0
  354. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/README.md +0 -0
  355. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/export-lora/export-lora.cpp +0 -0
  356. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/CMakeLists.txt +0 -0
  357. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/README.md +0 -0
  358. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/convert-finetune-checkpoint-to-gguf.py +0 -0
  359. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/finetune.cpp +0 -0
  360. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/finetune/finetune.sh +0 -0
  361. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gbnf-validator/CMakeLists.txt +0 -0
  362. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gbnf-validator/gbnf-validator.cpp +0 -0
  363. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
  364. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf/gguf.cpp +0 -0
  365. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/CMakeLists.txt +0 -0
  366. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/README.md +0 -0
  367. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/gguf-split.cpp +0 -0
  368. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gguf-split/tests.sh +0 -0
  369. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gpt4all.sh +0 -0
  370. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/CMakeLists.txt +0 -0
  371. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/README.md +0 -0
  372. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/gritlm/gritlm.cpp +0 -0
  373. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/CMakeLists.txt +0 -0
  374. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/README.md +0 -0
  375. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/imatrix/imatrix.cpp +0 -0
  376. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/CMakeLists.txt +0 -0
  377. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/README.md +0 -0
  378. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/infill/infill.cpp +0 -0
  379. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/README.md +0 -0
  380. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/graph.py +0 -0
  381. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/jeopardy.sh +0 -0
  382. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/qasheet.csv +0 -0
  383. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/jeopardy/questions.txt +0 -0
  384. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/json-schema-pydantic-example.py +0 -0
  385. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/json_schema_to_grammar.py +0 -0
  386. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/CMakeLists.txt +0 -0
  387. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama-bench/README.md +0 -0
  388. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/.gitignore +0 -0
  389. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/README.md +0 -0
  390. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/.gitignore +0 -0
  391. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/build.gradle.kts +0 -0
  392. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/proguard-rules.pro +0 -0
  393. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/AndroidManifest.xml +0 -0
  394. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/CMakeLists.txt +0 -0
  395. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/cpp/llama-android.cpp +0 -0
  396. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Downloadable.kt +0 -0
  397. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/Llm.kt +0 -0
  398. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainActivity.kt +0 -0
  399. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/MainViewModel.kt +0 -0
  400. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Color.kt +0 -0
  401. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Theme.kt +0 -0
  402. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/java/com/example/llama/ui/theme/Type.kt +0 -0
  403. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_background.xml +0 -0
  404. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/drawable/ic_launcher_foreground.xml +0 -0
  405. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher.xml +0 -0
  406. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-anydpi/ic_launcher_round.xml +0 -0
  407. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher.webp +0 -0
  408. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-hdpi/ic_launcher_round.webp +0 -0
  409. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher.webp +0 -0
  410. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-mdpi/ic_launcher_round.webp +0 -0
  411. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher.webp +0 -0
  412. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xhdpi/ic_launcher_round.webp +0 -0
  413. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher.webp +0 -0
  414. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxhdpi/ic_launcher_round.webp +0 -0
  415. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher.webp +0 -0
  416. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/mipmap-xxxhdpi/ic_launcher_round.webp +0 -0
  417. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/colors.xml +0 -0
  418. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/strings.xml +0 -0
  419. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/values/themes.xml +0 -0
  420. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/backup_rules.xml +0 -0
  421. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/app/src/main/res/xml/data_extraction_rules.xml +0 -0
  422. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/build.gradle.kts +0 -0
  423. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.jar +0 -0
  424. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle/wrapper/gradle-wrapper.properties +0 -0
  425. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradle.properties +0 -0
  426. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/gradlew +0 -0
  427. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.android/settings.gradle.kts +0 -0
  428. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/.gitignore +0 -0
  429. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/README.md +0 -0
  430. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift +0 -0
  431. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/AppIcon.appiconset/Contents.json +0 -0
  432. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Assets.xcassets/Contents.json +0 -0
  433. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/Models/LlamaState.swift +0 -0
  434. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/ContentView.swift +0 -0
  435. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/DownloadButton.swift +0 -0
  436. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/InputButton.swift +0 -0
  437. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/UI/LoadCustomButton.swift +0 -0
  438. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui/llama_swiftuiApp.swift +0 -0
  439. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.pbxproj +0 -0
  440. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/contents.xcworkspacedata +0 -0
  441. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.swiftui/llama.swiftui.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +0 -0
  442. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama.vim +0 -0
  443. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama2-13b.sh +0 -0
  444. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llama2.sh +0 -0
  445. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/CMakeLists.txt +0 -0
  446. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/MobileVLM-README.md +0 -0
  447. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/README.md +0 -0
  448. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/android/adb_run.sh +0 -0
  449. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/android/build_64.sh +0 -0
  450. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/clip.cpp +0 -0
  451. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/clip.h +0 -0
  452. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/convert-image-encoder-to-gguf.py +0 -0
  453. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-cli.cpp +0 -0
  454. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-surgery-v2.py +0 -0
  455. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava-surgery.py +0 -0
  456. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava.cpp +0 -0
  457. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/llava.h +0 -0
  458. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llava/requirements.txt +0 -0
  459. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/llm.vim +0 -0
  460. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
  461. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/README.md +0 -0
  462. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
  463. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
  464. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/README.md +0 -0
  465. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
  466. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
  467. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
  468. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/lookup/lookup.cpp +0 -0
  469. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/CMakeLists.txt +0 -0
  470. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/README.md +0 -0
  471. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main/main.cpp +0 -0
  472. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/.gitignore +0 -0
  473. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/CMakeLists.txt +0 -0
  474. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/main-cmake-pkg/README.md +0 -0
  475. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/make-ggml.py +0 -0
  476. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
  477. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/README.md +0 -0
  478. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/parallel/parallel.cpp +0 -0
  479. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
  480. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/README.md +0 -0
  481. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/passkey/passkey.cpp +0 -0
  482. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/CMakeLists.txt +0 -0
  483. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/README.md +0 -0
  484. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/perplexity/perplexity.cpp +0 -0
  485. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/pydantic-models-to-grammar-examples.py +0 -0
  486. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/pydantic_models_to_grammar.py +0 -0
  487. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/CMakeLists.txt +0 -0
  488. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/README.md +0 -0
  489. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/quantize.cpp +0 -0
  490. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize/tests.sh +0 -0
  491. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize-stats/CMakeLists.txt +0 -0
  492. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/quantize-stats/quantize-stats.cpp +0 -0
  493. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/reason-act.sh +0 -0
  494. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/regex-to-grammar.py +0 -0
  495. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
  496. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/README.md +0 -0
  497. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
  498. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/save-load-state/CMakeLists.txt +0 -0
  499. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/save-load-state/save-load-state.cpp +0 -0
  500. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/CMakeLists.txt +0 -0
  501. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/README.md +0 -0
  502. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/README.md +0 -0
  503. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/prometheus.yml +0 -0
  504. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/requirements.txt +0 -0
  505. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/bench/script.js +0 -0
  506. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat-llama2.sh +0 -0
  507. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat.mjs +0 -0
  508. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/chat.sh +0 -0
  509. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/deps.sh +0 -0
  510. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/httplib.h +0 -0
  511. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/completion.js +0 -0
  512. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/index.html +0 -0
  513. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/index.js +0 -0
  514. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/public/json-schema-to-grammar.mjs +0 -0
  515. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/README.md +0 -0
  516. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/embeddings.feature +0 -0
  517. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/environment.py +0 -0
  518. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/issues.feature +0 -0
  519. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/parallel.feature +0 -0
  520. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/passkey.feature +0 -0
  521. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/results.feature +0 -0
  522. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/security.feature +0 -0
  523. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/server.feature +0 -0
  524. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/slotsave.feature +0 -0
  525. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/steps/steps.py +0 -0
  526. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/features/wrong_usages.feature +0 -0
  527. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/requirements.txt +0 -0
  528. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/tests/tests.sh +0 -0
  529. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server/utils.hpp +0 -0
  530. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server-embd.py +0 -0
  531. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/server-llama2-13B.sh +0 -0
  532. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/CMakeLists.txt +0 -0
  533. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/README.md +0 -0
  534. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/simple/simple.cpp +0 -0
  535. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
  536. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/README.md +0 -0
  537. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/speculative/speculative.cpp +0 -0
  538. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
  539. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/README.md +0 -0
  540. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/build.sh +0 -0
  541. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
  542. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/run-llama2.sh +0 -0
  543. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/win-build-sycl.bat +0 -0
  544. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/sycl/win-run-llama2.bat +0 -0
  545. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/tokenize/CMakeLists.txt +0 -0
  546. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/tokenize/tokenize.cpp +0 -0
  547. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/CMakeLists.txt +0 -0
  548. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/README.md +0 -0
  549. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/convert-train-checkpoint-to-gguf.py +0 -0
  550. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/train-text-from-scratch/train-text-from-scratch.cpp +0 -0
  551. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/examples/ts-type-to-grammar.sh +0 -0
  552. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/flake.lock +0 -0
  553. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/flake.nix +0 -0
  554. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-alloc.c +0 -0
  555. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-alloc.h +0 -0
  556. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend-impl.h +0 -0
  557. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend.c +0 -0
  558. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-backend.h +0 -0
  559. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-common.h +0 -0
  560. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/acc.cu +0 -0
  561. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/acc.cuh +0 -0
  562. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/alibi.cu +0 -0
  563. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/alibi.cuh +0 -0
  564. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/arange.cu +0 -0
  565. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/arange.cuh +0 -0
  566. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/argsort.cu +0 -0
  567. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/argsort.cuh +0 -0
  568. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/binbcast.cu +0 -0
  569. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/binbcast.cuh +0 -0
  570. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/clamp.cu +0 -0
  571. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/clamp.cuh +0 -0
  572. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/concat.cu +0 -0
  573. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/concat.cuh +0 -0
  574. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/convert.cu +0 -0
  575. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/convert.cuh +0 -0
  576. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/cpy.cu +0 -0
  577. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/cpy.cuh +0 -0
  578. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dequantize.cuh +0 -0
  579. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/diagmask.cu +0 -0
  580. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/diagmask.cuh +0 -0
  581. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dmmv.cu +0 -0
  582. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/dmmv.cuh +0 -0
  583. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/getrows.cu +0 -0
  584. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/getrows.cuh +0 -0
  585. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/im2col.cu +0 -0
  586. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/im2col.cuh +0 -0
  587. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmq.cu +0 -0
  588. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmq.cuh +0 -0
  589. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmvq.cu +0 -0
  590. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/mmvq.cuh +0 -0
  591. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/norm.cu +0 -0
  592. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/norm.cuh +0 -0
  593. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pad.cu +0 -0
  594. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pad.cuh +0 -0
  595. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pool2d.cu +0 -0
  596. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/pool2d.cuh +0 -0
  597. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/quantize.cu +0 -0
  598. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/quantize.cuh +0 -0
  599. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/rope.cu +0 -0
  600. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/rope.cuh +0 -0
  601. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/scale.cu +0 -0
  602. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/scale.cuh +0 -0
  603. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/softmax.cuh +0 -0
  604. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/sumrows.cu +0 -0
  605. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/sumrows.cuh +0 -0
  606. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/tsembd.cu +0 -0
  607. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/tsembd.cuh +0 -0
  608. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/unary.cu +0 -0
  609. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/unary.cuh +0 -0
  610. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/upscale.cu +0 -0
  611. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/upscale.cuh +0 -0
  612. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda/vecdotq.cuh +0 -0
  613. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-cuda.h +0 -0
  614. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-impl.h +0 -0
  615. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-kompute.h +0 -0
  616. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-metal.h +0 -0
  617. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-mpi.c +0 -0
  618. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-mpi.h +0 -0
  619. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-opencl.cpp +0 -0
  620. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-opencl.h +0 -0
  621. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-quants.c +0 -0
  622. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-quants.h +0 -0
  623. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-sycl.h +0 -0
  624. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan-shaders.hpp +0 -0
  625. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml-vulkan.h +0 -0
  626. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/ggml_vk_generate_shaders.py +0 -0
  627. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/LICENSE +0 -0
  628. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/README.md +0 -0
  629. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/examples/reader.py +0 -0
  630. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/examples/writer.py +0 -0
  631. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/__init__.py +0 -0
  632. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/constants.py +0 -0
  633. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf.py +0 -0
  634. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf_reader.py +0 -0
  635. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/gguf_writer.py +0 -0
  636. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/py.typed +0 -0
  637. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/tensor_mapping.py +0 -0
  638. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/gguf/vocab.py +0 -0
  639. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/pyproject.toml +0 -0
  640. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/__init__.py +0 -0
  641. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-convert-endian.py +0 -0
  642. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-dump.py +0 -0
  643. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-new-metadata.py +0 -0
  644. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/scripts/gguf-set-metadata.py +0 -0
  645. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/gguf-py/tests/test_gguf.py +0 -0
  646. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/README.md +0 -0
  647. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/arithmetic.gbnf +0 -0
  648. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/c.gbnf +0 -0
  649. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/chess.gbnf +0 -0
  650. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/japanese.gbnf +0 -0
  651. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/json.gbnf +0 -0
  652. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/json_arr.gbnf +0 -0
  653. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/grammars/list.gbnf +0 -0
  654. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.ccls +0 -0
  655. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.clang-format +0 -0
  656. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.dockerignore +0 -0
  657. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.git +0 -0
  658. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/cpp_examples.yml +0 -0
  659. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/cpp_tests.yml +0 -0
  660. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.github/workflows/python_tests.yml +0 -0
  661. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/.gitignore +0 -0
  662. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CHANGELOG.md +0 -0
  663. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CMakeLists.txt +0 -0
  664. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CNAME +0 -0
  665. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CODE_OF_CONDUCT.md +0 -0
  666. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/CONTRIBUTING.md +0 -0
  667. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/Dockerfile +0 -0
  668. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/GOVERNANCE.md +0 -0
  669. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/LICENSE +0 -0
  670. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/MANIFEST.in +0 -0
  671. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/Makefile +0 -0
  672. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/README.md +0 -0
  673. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/SECURITY.md +0 -0
  674. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/VERSION +0 -0
  675. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/bin2h.cmake +0 -0
  676. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/bin_file_to_header.cmake +0 -0
  677. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/check_vulkan_version.cmake +0 -0
  678. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/code_coverage.cmake +0 -0
  679. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/deprecation_warnings.cmake +0 -0
  680. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/komputeConfig.cmake.in +0 -0
  681. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/cmake/vulkan_shader_compiler.cmake +0 -0
  682. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/config/FindSphinx.cmake +0 -0
  683. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/KomputeBuilder.Dockerfile +0 -0
  684. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/Makefile +0 -0
  685. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/Swiftshader.Dockerfile +0 -0
  686. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docker-builders/VulkanSDK.Dockerfile +0 -0
  687. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/CMakeLists.txt +0 -0
  688. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/Doxyfile.in +0 -0
  689. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/Makefile +0 -0
  690. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/assets/custom.css +0 -0
  691. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/assets/gcov.css +0 -0
  692. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/conf.py +0 -0
  693. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/genindex.rst +0 -0
  694. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/android-editor.jpg +0 -0
  695. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/android-kompute.jpg +0 -0
  696. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/binder-cpp.jpg +0 -0
  697. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/binder-python.jpg +0 -0
  698. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-architecture.jpg +0 -0
  699. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-cpp-video.png +0 -0
  700. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-python-video.png +0 -0
  701. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-algorithm.jpg +0 -0
  702. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-manager.jpg +0 -0
  703. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opcreatetensor.jpg +0 -0
  704. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-operations.jpg +0 -0
  705. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-opmult.jpg +0 -0
  706. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-sequence.jpg +0 -0
  707. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture-tensor.jpg +0 -0
  708. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute-vulkan-architecture.jpg +0 -0
  709. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/kompute.jpg +0 -0
  710. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-2.gif +0 -0
  711. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-godot-4.gif +0 -0
  712. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/komputer-logos.gif +0 -0
  713. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/logistic-regression.jpg +0 -0
  714. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/queue-allocation.jpg +0 -0
  715. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/images/suspicious.jfif +0 -0
  716. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/index.rst +0 -0
  717. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/make.bat +0 -0
  718. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/advanced-examples.rst +0 -0
  719. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/async-parallel.rst +0 -0
  720. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/build-system.rst +0 -0
  721. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/ci-tests.rst +0 -0
  722. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/community.rst +0 -0
  723. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/convolutional-net.rst +0 -0
  724. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/custom-operations.rst +0 -0
  725. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/game-engine-godot.rst +0 -0
  726. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/matmul-benchmark.rst +0 -0
  727. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/memory-management.rst +0 -0
  728. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/mobile-android.rst +0 -0
  729. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-examples.rst +0 -0
  730. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-package.rst +0 -0
  731. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/python-reference.rst +0 -0
  732. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/raspberry-pi.rst +0 -0
  733. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/reference.rst +0 -0
  734. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/shaders-to-headers.rst +0 -0
  735. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/docs/overview/variable-types.rst +0 -0
  736. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/.gitignore +0 -0
  737. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/README.md +0 -0
  738. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/build.gradle +0 -0
  739. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/proguard-rules.pro +0 -0
  740. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/AndroidManifest.xml +0 -0
  741. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/kompute.jpg +0 -0
  742. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/assets/komputer-2.gif +0 -0
  743. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/CMakeLists.txt +0 -0
  744. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeJniNative.cpp +0 -0
  745. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.cpp +0 -0
  746. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/KomputeModelML.hpp +0 -0
  747. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/CMakeLists.txt +0 -0
  748. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/cpp/shader/my_shader.comp +0 -0
  749. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/java/com/ethicalml/kompute/KomputeJni.kt +0 -0
  750. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/layout/activity_kompute_jni.xml +0 -0
  751. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-anydpi-v26/kompute_icon.xml +0 -0
  752. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-hdpi/ic_launcher.png +0 -0
  753. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-mdpi/ic_launcher.png +0 -0
  754. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/ic_launcher.png +0 -0
  755. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon.png +0 -0
  756. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xhdpi/kompute_icon_foreground.png +0 -0
  757. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxhdpi/ic_launcher.png +0 -0
  758. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/mipmap-xxxhdpi/ic_launcher.png +0 -0
  759. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/colors.xml +0 -0
  760. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/dimens.xml +0 -0
  761. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/kompute_icon_background.xml +0 -0
  762. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/strings.xml +0 -0
  763. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values/styles.xml +0 -0
  764. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/app/src/main/res/values-w820dp/dimens.xml +0 -0
  765. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/build.gradle +0 -0
  766. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle/wrapper/gradle-wrapper.properties +0 -0
  767. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradle.properties +0 -0
  768. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew +0 -0
  769. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/gradlew.bat +0 -0
  770. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/android/android-simple/settings.gradle +0 -0
  771. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/CMakeLists.txt +0 -0
  772. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/README.md +0 -0
  773. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/CMakeLists.txt +0 -0
  774. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/shader/my_shader.comp +0 -0
  775. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/src/CMakeLists.txt +0 -0
  776. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/array_multiplication/src/main.cpp +0 -0
  777. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/.gitignore +0 -0
  778. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/README.md +0 -0
  779. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gdignore +0 -0
  780. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/.gitignore +0 -0
  781. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/README.md +0 -0
  782. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.cpp +0 -0
  783. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/KomputeSummatorNode.h +0 -0
  784. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/SCsub +0 -0
  785. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/config.py +0 -0
  786. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/include/.gitignore +0 -0
  787. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.cpp +0 -0
  788. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/custom_module/kompute_summator/register_types.h +0 -0
  789. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gdignore +0 -0
  790. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/.gitignore +0 -0
  791. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/CMakeLists.txt +0 -0
  792. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/README.md +0 -0
  793. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/.gdignore +0 -0
  794. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeGdNative.cpp +0 -0
  795. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.cpp +0 -0
  796. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/gdnative_shared/src/KomputeSummator.hpp +0 -0
  797. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_engine/.gdignore +0 -0
  798. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
  799. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/DynamicExampleScene.tscn +0 -0
  800. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/default_env.tres +0 -0
  801. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png +0 -0
  802. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/assets/icon.png.import +0 -0
  803. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
  804. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/DynamicExampleScript.gd +0 -0
  805. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
  806. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
  807. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_examples/project.godot +0 -0
  808. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/.gitignore +0 -0
  809. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/README.md +0 -0
  810. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gdignore +0 -0
  811. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/.gitignore +0 -0
  812. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/README.md +0 -0
  813. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.cpp +0 -0
  814. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/KomputeModelMLNode.h +0 -0
  815. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/SCsub +0 -0
  816. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/config.py +0 -0
  817. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/include/.gitignore +0 -0
  818. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.cpp +0 -0
  819. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/custom_module/kompute_model_ml/register_types.h +0 -0
  820. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gdignore +0 -0
  821. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/.gitignore +0 -0
  822. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/CMakeLists.txt +0 -0
  823. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/README.md +0 -0
  824. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/.gdignore +0 -0
  825. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeGdNative.cpp +0 -0
  826. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.cpp +0 -0
  827. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/gdnative_shared/src/KomputeModelML.hpp +0 -0
  828. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_engine/.gdignore +0 -0
  829. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/CustomModuleExampleScene.tscn +0 -0
  830. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/DynamicExampleScene.tscn +0 -0
  831. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/TextFormat.theme +0 -0
  832. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/default_env.tres +0 -0
  833. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png +0 -0
  834. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/icon.png.import +0 -0
  835. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/assets/roboto.ttf +0 -0
  836. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/CustomModuleExampleScene.gd +0 -0
  837. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/DynamicExampleScript.gd +0 -0
  838. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeClass.gdns +0 -0
  839. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/godot_resources/scripts/KomputeNativeLibrary.gdnlib +0 -0
  840. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/godot_logistic_regression/project.godot +0 -0
  841. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/CMakeLists.txt +0 -0
  842. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/README.md +0 -0
  843. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/CMakeLists.txt +0 -0
  844. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/shader/my_shader.comp +0 -0
  845. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/src/CMakeLists.txt +0 -0
  846. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/logistic_regression/src/main.cpp +0 -0
  847. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/.gitignore +0 -0
  848. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/README.md +0 -0
  849. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/import_vgg7.py +0 -0
  850. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/out.png +0 -0
  851. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/run_vgg7.py +0 -0
  852. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_common.py +0 -0
  853. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/sh_conv.py +0 -0
  854. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/neural_network_vgg7/w2wbinit.png +0 -0
  855. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/pi4_mesa_build/README.md +0 -0
  856. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/README.md +0 -0
  857. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/benchmark.py +0 -0
  858. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/first_example.py +0 -0
  859. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp1_naive.py +0 -0
  860. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp2_tiled.py +0 -0
  861. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/imp3_better_tiling.py +0 -0
  862. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/examples/python_naive_matmul/matmul_plot.py +0 -0
  863. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/external/bin/xxd.c +0 -0
  864. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/kompute-config.cmake +0 -0
  865. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/pylintrc +0 -0
  866. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/CMakeLists.txt +0 -0
  867. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/README.md +0 -0
  868. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/docstrings.hpp +0 -0
  869. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/main.cpp +0 -0
  870. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/src/utils.hpp +0 -0
  871. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/__init__.py +0 -0
  872. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/requirements-dev.txt +0 -0
  873. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_array_multiplication.py +0 -0
  874. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_kompute.py +0 -0
  875. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_logistic_regression.py +0 -0
  876. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/test_tensor_types.py +0 -0
  877. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/python/test/utils.py +0 -0
  878. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/build_release_linux.sh +0 -0
  879. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/build_release_windows.sh +0 -0
  880. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/convert_shaders.py +0 -0
  881. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/push_folder_to_branch.sh +0 -0
  882. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/scripts/requirements.txt +0 -0
  883. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/setup.py +0 -0
  884. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Algorithm.cpp +0 -0
  885. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/CMakeLists.txt +0 -0
  886. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Core.cpp +0 -0
  887. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Manager.cpp +0 -0
  888. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpAlgoDispatch.cpp +0 -0
  889. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpBufferSyncDevice.cpp +0 -0
  890. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpBufferSyncLocal.cpp +0 -0
  891. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpMemoryBarrier.cpp +0 -0
  892. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorCopy.cpp +0 -0
  893. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorFill.cpp +0 -0
  894. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorSyncDevice.cpp +0 -0
  895. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/OpTensorSyncLocal.cpp +0 -0
  896. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Sequence.cpp +0 -0
  897. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/Tensor.cpp +0 -0
  898. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/CMakeLists.txt +0 -0
  899. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Algorithm.hpp +0 -0
  900. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Core.hpp +0 -0
  901. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Kompute.hpp +0 -0
  902. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Manager.hpp +0 -0
  903. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Sequence.hpp +0 -0
  904. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/Tensor.hpp +0 -0
  905. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/logger/Logger.hpp +0 -0
  906. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpAlgoDispatch.hpp +0 -0
  907. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBase.hpp +0 -0
  908. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncDevice.hpp +0 -0
  909. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpBufferSyncLocal.hpp +0 -0
  910. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMemoryBarrier.hpp +0 -0
  911. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpMult.hpp +0 -0
  912. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorCopy.hpp +0 -0
  913. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorFill.hpp +0 -0
  914. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncDevice.hpp +0 -0
  915. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/include/kompute/operations/OpTensorSyncLocal.hpp +0 -0
  916. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/logger/CMakeLists.txt +0 -0
  917. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/logger/Logger.cpp +0 -0
  918. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/CMakeLists.txt +0 -0
  919. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/CMakeLists.txt +0 -0
  920. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.comp +0 -0
  921. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderLogisticRegression.hpp.in +0 -0
  922. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.comp +0 -0
  923. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/glsl/ShaderOpMult.hpp.in +0 -0
  924. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/src/shaders/hlsl/computeheadless.comp +0 -0
  925. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/CMakeLists.txt +0 -0
  926. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestAsyncOperations.cpp +0 -0
  927. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestDestroy.cpp +0 -0
  928. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestLogisticRegression.cpp +0 -0
  929. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestManager.cpp +0 -0
  930. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestMultipleAlgoExecutions.cpp +0 -0
  931. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpShadersFromStringAndFile.cpp +0 -0
  932. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorCopy.cpp +0 -0
  933. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorCreate.cpp +0 -0
  934. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestOpTensorSync.cpp +0 -0
  935. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestPushConstant.cpp +0 -0
  936. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestSequence.cpp +0 -0
  937. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestSpecializationConstant.cpp +0 -0
  938. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestTensor.cpp +0 -0
  939. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/TestWorkgroup.cpp +0 -0
  940. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_logistic_regression.hpp +0 -0
  941. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_op_custom_shader.hpp +0 -0
  942. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/compiled_shaders_include/kompute_test/shaders/shadertest_workgroup.hpp +0 -0
  943. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/CMakeLists.txt +0 -0
  944. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/Utils.cpp +0 -0
  945. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/Utils.hpp +0 -0
  946. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/CMakeLists.txt +0 -0
  947. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_logistic_regression_shader.comp +0 -0
  948. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_op_custom_shader.comp +0 -0
  949. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_shader.comp +0 -0
  950. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/test/shaders/glsl/test_workgroup_shader.comp +0 -0
  951. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute/vcpkg.json.opt +0 -0
  952. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/common.comp +0 -0
  953. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_add.comp +0 -0
  954. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_addrow.comp +0 -0
  955. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f16.comp +0 -0
  956. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f16_f32.comp +0 -0
  957. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f16.comp +0 -0
  958. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_cpy_f32_f32.comp +0 -0
  959. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_diagmask.comp +0 -0
  960. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_gelu.comp +0 -0
  961. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows.comp +0 -0
  962. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_f16.comp +0 -0
  963. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_0.comp +0 -0
  964. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q4_1.comp +0 -0
  965. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_getrows_q6_k.comp +0 -0
  966. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul.comp +0 -0
  967. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_f16.comp +0 -0
  968. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_mat_f32.comp +0 -0
  969. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_0.comp +0 -0
  970. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q4_1.comp +0 -0
  971. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q6_k.comp +0 -0
  972. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mat_q8_0.comp +0 -0
  973. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n.comp +0 -0
  974. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_mul_mv_q_n_pre.comp +0 -0
  975. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_norm.comp +0 -0
  976. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_relu.comp +0 -0
  977. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rmsnorm.comp +0 -0
  978. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rope_f16.comp +0 -0
  979. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_rope_f32.comp +0 -0
  980. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_scale.comp +0 -0
  981. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_scale_8.comp +0 -0
  982. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_silu.comp +0 -0
  983. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/op_softmax.comp +0 -0
  984. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/kompute-shaders/rope_common.comp +0 -0
  985. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama-leader.jpeg +0 -0
  986. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama0-banner.png +0 -0
  987. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama0-logo.png +0 -0
  988. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama1-banner.png +0 -0
  989. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/llama1-logo.png +0 -0
  990. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/matmul.png +0 -0
  991. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/media/matmul.svg +0 -0
  992. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/mypy.ini +0 -0
  993. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/CMakeLists.txt +0 -0
  994. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
  995. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
  996. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/pocs/vdot/vdot.cpp +0 -0
  997. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/LLM-questions.txt +0 -0
  998. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/alpaca.txt +0 -0
  999. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/assistant.txt +0 -0
  1000. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-baichuan.txt +0 -0
  1001. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-bob.txt +0 -0
  1002. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-qwen.txt +0 -0
  1003. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-vicuna-v0.txt +0 -0
  1004. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat-with-vicuna-v1.txt +0 -0
  1005. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/chat.txt +0 -0
  1006. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/dan-modified.txt +0 -0
  1007. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/dan.txt +0 -0
  1008. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/mnemonics.txt +0 -0
  1009. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/parallel-questions.txt +0 -0
  1010. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/prompts/reason-act.txt +0 -0
  1011. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf-update.txt +0 -0
  1012. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-hf-to-gguf.txt +0 -0
  1013. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-llama-ggml-to-gguf.txt +0 -0
  1014. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-lora-to-ggml.txt +0 -0
  1015. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert-persimmon-to-gguf.txt +0 -0
  1016. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements/requirements-convert.txt +0 -0
  1017. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/requirements.txt +0 -0
  1018. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/LlamaConfig.cmake.in +0 -0
  1019. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/build-info.cmake +0 -0
  1020. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/build-info.sh +0 -0
  1021. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/check-requirements.sh +0 -0
  1022. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/ci-run.sh +0 -0
  1023. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/compare-commits.sh +0 -0
  1024. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/compare-llama-bench.py +0 -0
  1025. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/convert-gg.sh +0 -0
  1026. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/gen-authors.sh +0 -0
  1027. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/gen-build-info-cpp.cmake +0 -0
  1028. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-flags.mk +0 -0
  1029. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-hellaswag.sh +0 -0
  1030. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-pg.sh +0 -0
  1031. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-wikitext-103.sh +0 -0
  1032. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-wikitext-2.sh +0 -0
  1033. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/get-winogrande.sh +0 -0
  1034. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/hf.sh +0 -0
  1035. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/install-oneapi.bat +0 -0
  1036. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/pod-llama.sh +0 -0
  1037. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/qnt-all.sh +0 -0
  1038. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-all-perf.sh +0 -0
  1039. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-all-ppl.sh +0 -0
  1040. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/run-with-preset.py +0 -0
  1041. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/server-llm.sh +0 -0
  1042. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml-am.sh +0 -0
  1043. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml.last +0 -0
  1044. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/sync-ggml.sh +0 -0
  1045. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/verify-checksum-models.py +0 -0
  1046. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/scripts/xxd.cmake +0 -0
  1047. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/sgemm.cpp +0 -0
  1048. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/sgemm.h +0 -0
  1049. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml-alloc.h +0 -0
  1050. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml-backend.h +0 -0
  1051. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/ggml.h +0 -0
  1052. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/spm-headers/llama.h +0 -0
  1053. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/.gitignore +0 -0
  1054. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/CMakeLists.txt +0 -0
  1055. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/get-model.cpp +0 -0
  1056. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/get-model.h +0 -0
  1057. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/run-json-schema-to-grammar.mjs +0 -0
  1058. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-autorelease.cpp +0 -0
  1059. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-c.c +0 -0
  1060. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-chat-template.cpp +0 -0
  1061. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-double-float.cpp +0 -0
  1062. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grad0.cpp +0 -0
  1063. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grammar-integration.cpp +0 -0
  1064. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-grammar-parser.cpp +0 -0
  1065. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
  1066. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-llama-grammar.cpp +0 -0
  1067. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
  1068. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-opt.cpp +0 -0
  1069. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-quantize-fns.cpp +0 -0
  1070. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-quantize-perf.cpp +0 -0
  1071. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-rope.cpp +0 -0
  1072. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-sampling.cpp +0 -0
  1073. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0-bpe.py +0 -0
  1074. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0-spm.py +0 -0
  1075. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
  1076. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
  1077. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
  1078. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode-data.cpp +0 -0
  1079. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode-data.h +0 -0
  1080. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode.cpp +0 -0
  1081. {llama_cpp_python-0.2.67 → llama_cpp_python-0.2.68}/vendor/llama.cpp/unicode.h +0 -0
@@ -0,0 +1 @@
1
+ b14dd98922c7f18468ae202eadbaf58fe17f5320 'b14dd98922c7f18468ae202eadbaf58fe17f5320' of https://github.com/abetlen/llama-cpp-python
@@ -0,0 +1 @@
1
+ b14dd98922c7f18468ae202eadbaf58fe17f5320
@@ -9,7 +9,7 @@
9
9
  [gc]
10
10
  auto = 0
11
11
  [http "https://github.com/"]
12
- extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1Z3cnF2cFBtMHRHQmp6b0tWNHNLd1ZOYXVFdDYyYzF3amxueQ==
12
+ extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
13
13
  [submodule "vendor/llama.cpp"]
14
14
  active = true
15
15
  url = https://github.com/ggerganov/llama.cpp.git
Binary file
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 b14dd98922c7f18468ae202eadbaf58fe17f5320 runner <runner@fv-az847-33.(none)> 1714484689 +0000 checkout: moving from master to refs/tags/v0.2.68
@@ -0,0 +1 @@
1
+ 77e15bec6217a39be59b9cc83d6b9afb6b0d8167
@@ -16,7 +16,7 @@
16
16
  [gc]
17
17
  auto = 0
18
18
  [http "https://github.com/"]
19
- extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1Z3cnF2cFBtMHRHQmp6b0tWNHNLd1ZOYXVFdDYyYzF3amxueQ==
19
+ extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
20
20
  [url "https://github.com/"]
21
21
  insteadOf = git@github.com:
22
22
  insteadOf = org-6826477@github.com:
@@ -0,0 +1,2 @@
1
+ 0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
2
+ 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484691 +0000 checkout: moving from master to 77e15bec6217a39be59b9cc83d6b9afb6b0d8167
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 runner <runner@fv-az847-33.(none)> 1714484690 +0000 clone: from https://github.com/ggerganov/llama.cpp.git
@@ -13,7 +13,7 @@
13
13
  [gc]
14
14
  auto = 0
15
15
  [http "https://github.com/"]
16
- extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX1Z3cnF2cFBtMHRHQmp6b0tWNHNLd1ZOYXVFdDYyYzF3amxueQ==
16
+ extraheader = AUTHORIZATION: basic eC1hY2Nlc3MtdG9rZW46Z2hzX0JDY0xlczRzUW4zRThuS0x6TEpwOFJRcjhPNDlpdTNwNFdKUg==
17
17
  [url "https://github.com/"]
18
18
  insteadOf = git@github.com:
19
19
  insteadOf = org-6826477@github.com:
@@ -0,0 +1,2 @@
1
+ 0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
2
+ d1e3b0953cf66acc94b2e29693e221427b2c1f3f 4565194ed7c32d1d2efa32ceab4d3c6cae006306 runner <runner@fv-az847-33.(none)> 1714484692 +0000 checkout: moving from master to 4565194ed7c32d1d2efa32ceab4d3c6cae006306
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
@@ -0,0 +1 @@
1
+ 0000000000000000000000000000000000000000 d1e3b0953cf66acc94b2e29693e221427b2c1f3f runner <runner@fv-az847-33.(none)> 1714484691 +0000 clone: from https://github.com/nomic-ai/kompute.git
@@ -0,0 +1,2 @@
1
+ # pack-refs with: peeled fully-peeled sorted
2
+ 77e15bec6217a39be59b9cc83d6b9afb6b0d8167 refs/remotes/origin/master
@@ -0,0 +1 @@
1
+ 77e15bec6217a39be59b9cc83d6b9afb6b0d8167
@@ -0,0 +1 @@
1
+ 77e15bec6217a39be59b9cc83d6b9afb6b0d8167
@@ -0,0 +1 @@
1
+ b14dd98922c7f18468ae202eadbaf58fe17f5320
@@ -0,0 +1 @@
1
+ b14dd98922c7f18468ae202eadbaf58fe17f5320
@@ -39,7 +39,7 @@ jobs:
39
39
 
40
40
  - uses: actions/upload-artifact@v4
41
41
  with:
42
- name: wheels
42
+ name: wheels-${{ matrix.os }}
43
43
  path: ./wheelhouse/*.whl
44
44
 
45
45
  build_wheels_arm64:
@@ -100,14 +100,9 @@ jobs:
100
100
  runs-on: ubuntu-latest
101
101
 
102
102
  steps:
103
- - name: Merge Artifacts
104
- uses: actions/upload-artifact/merge@v4
103
+ - uses: actions/download-artifact@v4
105
104
  with:
106
- name: release
107
-
108
- - uses: actions/download-artifact@v3
109
- with:
110
- name: release
105
+ merge-multiple: true
111
106
  path: dist
112
107
 
113
108
  - uses: softprops/action-gh-release@v2
@@ -7,6 +7,12 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
7
7
 
8
8
  ## [Unreleased]
9
9
 
10
+ ## [0.2.68]
11
+
12
+ - feat: Update llama.cpp to ggerganov/llama.cpp@
13
+ - feat: Add option to enable flash_attn to Lllama params and ModelSettings by @abetlen in 22d77eefd2edaf0148f53374d0cac74d0e25d06e
14
+ - fix(ci): Fix build-and-release.yaml by @Smartappli in #1413
15
+
10
16
  ## [0.2.67]
11
17
 
12
18
  - fix: Ensure image renders before text in chat formats regardless of message content order by @abetlen in 3489ef09d3775f4a87fb7114f619e8ba9cb6b656
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: llama_cpp_python
3
- Version: 0.2.67
3
+ Version: 0.2.68
4
4
  Summary: Python bindings for the llama.cpp library
5
5
  Author-Email: Andrei Betlen <abetlen@gmail.com>
6
6
  License: MIT
@@ -165,7 +165,7 @@ CMAKE_ARGS="-DLLAMA_CUDA=on" pip install llama-cpp-python
165
165
 
166
166
  It is also possible to install a pre-built wheel with CUDA support. As long as your system meets some requirements:
167
167
 
168
- - CUDA Version is 12.1, 12.2 or 12.3
168
+ - CUDA Version is 12.1, 12.2, 12.3, or 12.4
169
169
  - Python Version is 3.10, 3.11 or 3.12
170
170
 
171
171
  ```bash
@@ -177,6 +177,7 @@ Where `<cuda-version>` is one of the following:
177
177
  - `cu121`: CUDA 12.1
178
178
  - `cu122`: CUDA 12.2
179
179
  - `cu123`: CUDA 12.3
180
+ - `cu124`: CUDA 12.4
180
181
 
181
182
  For example, to install the CUDA 12.1 wheel:
182
183
 
@@ -121,7 +121,7 @@ CMAKE_ARGS="-DLLAMA_CUDA=on" pip install llama-cpp-python
121
121
 
122
122
  It is also possible to install a pre-built wheel with CUDA support. As long as your system meets some requirements:
123
123
 
124
- - CUDA Version is 12.1, 12.2 or 12.3
124
+ - CUDA Version is 12.1, 12.2, 12.3, or 12.4
125
125
  - Python Version is 3.10, 3.11 or 3.12
126
126
 
127
127
  ```bash
@@ -133,6 +133,7 @@ Where `<cuda-version>` is one of the following:
133
133
  - `cu121`: CUDA 12.1
134
134
  - `cu122`: CUDA 12.2
135
135
  - `cu123`: CUDA 12.3
136
+ - `cu124`: CUDA 12.4
136
137
 
137
138
  For example, to install the CUDA 12.1 wheel:
138
139
 
@@ -1,4 +1,4 @@
1
1
  from .llama_cpp import *
2
2
  from .llama import *
3
3
 
4
- __version__ = "0.2.67"
4
+ __version__ = "0.2.68"
@@ -92,6 +92,7 @@ class Llama:
92
92
  logits_all: bool = False,
93
93
  embedding: bool = False,
94
94
  offload_kqv: bool = True,
95
+ flash_attn: bool = False,
95
96
  # Sampling Params
96
97
  last_n_tokens_size: int = 64,
97
98
  # LoRA Params
@@ -168,6 +169,7 @@ class Llama:
168
169
  logits_all: Return logits for all tokens, not just the last token. Must be True for completion to return logprobs.
169
170
  embedding: Embedding mode only.
170
171
  offload_kqv: Offload K, Q, V to GPU.
172
+ flash_attn: Use flash attention.
171
173
  last_n_tokens_size: Maximum number of tokens to keep in the last_n_tokens deque.
172
174
  lora_base: Optional path to base model, useful if using a quantized base model and you want to apply LoRA to an f16 model.
173
175
  lora_path: Path to a LoRA file to apply to the model.
@@ -310,6 +312,7 @@ class Llama:
310
312
  ) # Must be set to True for speculative decoding
311
313
  self.context_params.embeddings = embedding # TODO: Rename to embeddings
312
314
  self.context_params.offload_kqv = offload_kqv
315
+ self.context_params.flash_attn = flash_attn
313
316
  # KV cache quantization
314
317
  if type_k is not None:
315
318
  self.context_params.type_k = type_k
@@ -1774,6 +1777,7 @@ class Llama:
1774
1777
  logits_all=self.context_params.logits_all,
1775
1778
  embedding=self.context_params.embeddings,
1776
1779
  offload_kqv=self.context_params.offload_kqv,
1780
+ flash_attn=self.context_params.flash_attn,
1777
1781
  # Sampling Params
1778
1782
  last_n_tokens_size=self.last_n_tokens_size,
1779
1783
  # LoRA Params
@@ -242,8 +242,8 @@ LLAMA_FILE_MAGIC_GGSQ = 0x67677371
242
242
 
243
243
  # define LLAMA_SESSION_MAGIC LLAMA_FILE_MAGIC_GGSN
244
244
  LLAMA_SESSION_MAGIC = LLAMA_FILE_MAGIC_GGSN
245
- # define LLAMA_SESSION_VERSION 5
246
- LLAMA_SESSION_VERSION = 5
245
+ # define LLAMA_SESSION_VERSION 6
246
+ LLAMA_SESSION_VERSION = 6
247
247
 
248
248
  # define LLAMA_STATE_SEQ_MAGIC LLAMA_FILE_MAGIC_GGSQ
249
249
  LLAMA_STATE_SEQ_MAGIC = LLAMA_FILE_MAGIC_GGSQ
@@ -730,6 +730,7 @@ class llama_model_params(ctypes.Structure):
730
730
  # bool logits_all; // the llama_decode() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
731
731
  # bool embeddings; // if true, extract embeddings (together with logits)
732
732
  # bool offload_kqv; // whether to offload the KQV ops (including the KV cache) to GPU
733
+ # bool flash_attn; // whether to use flash attention
733
734
 
734
735
 
735
736
  # // Abort callback
@@ -766,6 +767,7 @@ class llama_context_params(ctypes.Structure):
766
767
  logits_all (bool): the llama_eval() call computes all logits, not just the last one (DEPRECATED - set llama_batch.logits instead)
767
768
  embeddings (bool): if true, extract embeddings (together with logits)
768
769
  offload_kqv (bool): whether to offload the KQV ops (including the KV cache) to GPU
770
+ flash_attn (bool): whether to use flash attention
769
771
  abort_callback (ggml_abort_callback): abort callback if it returns true, execution of llama_decode() will be aborted
770
772
  abort_callback_data (ctypes.ctypes.c_void_p): data for abort_callback
771
773
  """
@@ -795,6 +797,7 @@ class llama_context_params(ctypes.Structure):
795
797
  logits_all: bool
796
798
  embeddings: bool
797
799
  offload_kqv: bool
800
+ flash_attn: bool
798
801
  abort_callback: Callable[[ctypes.c_void_p], bool]
799
802
  abort_callback_data: ctypes.c_void_p
800
803
 
@@ -823,6 +826,7 @@ class llama_context_params(ctypes.Structure):
823
826
  ("logits_all", ctypes.c_bool),
824
827
  ("embeddings", ctypes.c_bool),
825
828
  ("offload_kqv", ctypes.c_bool),
829
+ ("flash_attn", ctypes.c_bool),
826
830
  ("abort_callback", ggml_abort_callback),
827
831
  ("abort_callback_data", ctypes.c_void_p),
828
832
  ]
@@ -1615,7 +1619,7 @@ def llama_get_kv_cache_used_cells(ctx: llama_context_p, /) -> int:
1615
1619
  ...
1616
1620
 
1617
1621
 
1618
- # // Clear the KV cache
1622
+ # // Clear the KV cache - both cell info is erased and KV data is zeroed
1619
1623
  # LLAMA_API void llama_kv_cache_clear(
1620
1624
  # struct llama_context * ctx);
1621
1625
  @ctypes_function("llama_kv_cache_clear", [llama_context_p_ctypes], None)
@@ -96,6 +96,9 @@ class ModelSettings(BaseSettings):
96
96
  offload_kqv: bool = Field(
97
97
  default=True, description="Whether to offload kqv to the GPU."
98
98
  )
99
+ flash_attn: bool = Field(
100
+ default=False, description="Whether to use flash attention."
101
+ )
99
102
  # Sampling Params
100
103
  last_n_tokens_size: int = Field(
101
104
  default=64,
@@ -336,7 +336,8 @@ function gg_run_open_llama_3b_v2 {
336
336
 
337
337
  (time ./bin/imatrix --model ${model_f16} -f ${wiki_test_60} -c 128 -b 128 --chunks 1 ) 2>&1 | tee -a $OUT/${ci}-imatrix.log
338
338
 
339
- (time ./bin/save-load-state --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
339
+ (time ./bin/save-load-state --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
340
+ (time ./bin/save-load-state -fa --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
340
341
 
341
342
  function check_ppl {
342
343
  qnt="$1"
@@ -517,7 +518,10 @@ function gg_run_open_llama_7b_v2 {
517
518
 
518
519
  (time ./bin/imatrix --model ${model_f16} -f ${wiki_test} -t 1 -ngl 999 -c 2048 -b 512 --chunks 4 ) 2>&1 | tee -a $OUT/${ci}-imatrix.log
519
520
 
520
- (time ./bin/save-load-state --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
521
+ (time ./bin/save-load-state -ngl 10 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
522
+ (time ./bin/save-load-state -fa -ngl 10 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
523
+ (time ./bin/save-load-state -ngl 99 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
524
+ (time ./bin/save-load-state -fa -ngl 99 --model ${model_q4_0} ) 2>&1 | tee -a $OUT/${ci}-save-load-state.log
521
525
 
522
526
  function check_ppl {
523
527
  qnt="$1"
@@ -1,4 +1,4 @@
1
1
  int LLAMA_BUILD_NUMBER = 1;
2
- char const *LLAMA_COMMIT = "8843a98";
2
+ char const *LLAMA_COMMIT = "77e15be";
3
3
  char const *LLAMA_COMPILER = "cc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0";
4
4
  char const *LLAMA_BUILD_TARGET = "x86_64-linux-gnu";
@@ -947,6 +947,10 @@ bool gpt_params_find_arg(int argc, char ** argv, const std::string & arg, gpt_pa
947
947
  params.cont_batching = true;
948
948
  return true;
949
949
  }
950
+ if (arg == "-fa" || arg == "--flash-attn") {
951
+ params.flash_attn = true;
952
+ return true;
953
+ }
950
954
  if (arg == "--color") {
951
955
  params.use_color = true;
952
956
  return true;
@@ -1513,6 +1517,7 @@ void gpt_print_usage(int /*argc*/, char ** argv, const gpt_params & params) {
1513
1517
  printf(" -ns N, --sequences N number of sequences to decode (default: %d)\n", params.n_sequences);
1514
1518
  printf(" -ps N, --p-split N speculative decoding split probability (default: %.1f)\n", (double)params.p_split);
1515
1519
  printf(" -cb, --cont-batching enable continuous batching (a.k.a dynamic batching) (default: disabled)\n");
1520
+ printf(" -fa, --flash-attn enable Flash Attention (default: %s)\n", params.flash_attn ? "enabled" : "disabled");
1516
1521
  printf(" --mmproj MMPROJ_FILE path to a multimodal projector file for LLaVA. see examples/llava/README.md\n");
1517
1522
  printf(" --image IMAGE_FILE path to an image file. use with multimodal models. Specify multiple times for batching\n");
1518
1523
  if (llama_supports_mlock()) {
@@ -1885,6 +1890,7 @@ struct llama_context_params llama_context_params_from_gpt_params(const gpt_param
1885
1890
  cparams.cb_eval = params.cb_eval;
1886
1891
  cparams.cb_eval_user_data = params.cb_eval_user_data;
1887
1892
  cparams.offload_kqv = !params.no_kv_offload;
1893
+ cparams.flash_attn = params.flash_attn;
1888
1894
 
1889
1895
  cparams.type_k = kv_cache_type_from_str(params.cache_type_k);
1890
1896
  cparams.type_v = kv_cache_type_from_str(params.cache_type_v);
@@ -2707,6 +2713,7 @@ void dump_non_result_info_yaml(FILE * stream, const gpt_params & params, const l
2707
2713
  fprintf(stream, "seed: %u # default: -1 (random seed)\n", params.seed);
2708
2714
  fprintf(stream, "simple_io: %s # default: false\n", params.simple_io ? "true" : "false");
2709
2715
  fprintf(stream, "cont_batching: %s # default: false\n", params.cont_batching ? "true" : "false");
2716
+ fprintf(stream, "flash_attn: %s # default: false\n", params.flash_attn ? "true" : "false");
2710
2717
  fprintf(stream, "temp: %f # default: 0.8\n", sparams.temp);
2711
2718
 
2712
2719
  const std::vector<float> tensor_split_vector(params.tensor_split, params.tensor_split + llama_max_devices());
@@ -150,6 +150,7 @@ struct gpt_params {
150
150
  bool multiline_input = false; // reverse the usage of `\`
151
151
  bool simple_io = false; // improves compatibility with subprocesses and limited consoles
152
152
  bool cont_batching = true; // insert new sequences for decoding on-the-fly
153
+ bool flash_attn = false; // flash attention
153
154
 
154
155
  bool input_prefix_bos = false; // prefix BOS to user inputs, preceding input_prefix
155
156
  bool ignore_eos = false; // ignore generated EOS tokens
@@ -128,7 +128,7 @@ for model in models:
128
128
  print(f"chkhsh: {chkhsh}")
129
129
 
130
130
  # print the "pre_tokenizer" content from the tokenizer.json
131
- with open(f"models/tokenizers/{name}/tokenizer.json", "r") as f:
131
+ with open(f"models/tokenizers/{name}/tokenizer.json", "r", encoding="utf-8") as f:
132
132
  cfg = json.load(f)
133
133
  pre_tokenizer = cfg["pre_tokenizer"]
134
134
  print("pre_tokenizer: " + json.dumps(pre_tokenizer, indent=4))
@@ -156,15 +156,19 @@ src_func += " print(f\"chkhsh: {chkhsh}\")\n"
156
156
  src_func += "\n"
157
157
  src_func += " res = None\n"
158
158
  src_func += "\n"
159
- src_func += " # NOTE: if you get an error here, you need to add the model to the if-elif chain below\n"
160
- src_func += " # don't do this manually - use the convert-hf-to-gguf-update.py script!\n"
159
+ src_func += " # NOTE: if you get an error here, you need to update the convert-hf-to-gguf-update.py script\n"
160
+ src_func += " # or pull the latest version of the model from Huggingface\n"
161
+ src_func += " # don't edit the hashes manually!\n"
161
162
  src_func += f"{src_ifs}\n"
162
163
  src_func += " if res is None:\n"
163
164
  src_func += " print(\"\\n\")\n"
164
165
  src_func += " print(\"**************************************************************************************\")\n"
165
166
  src_func += " print(\"** WARNING: The BPE pre-tokenizer was not recognized!\")\n"
166
- src_func += " print(\"** This means that it was not added yet or you are using an older version.\")\n"
167
- src_func += " print(\"** Check convert-hf-to-gguf-update.py and update it accordingly.\")\n"
167
+ src_func += " print(\"** There are 2 possible reasons for this:\")\n"
168
+ src_func += " print(\"** - the model has not been added to convert-hf-to-gguf-update.py yet\")\n"
169
+ src_func += " print(\"** - the pre-tokenization config has changed upstream\")\n"
170
+ src_func += " print(\"** Check your model files and convert-hf-to-gguf-update.py and update them accordingly.\")\n"
171
+ src_func += " print(\"** ref: https://github.com/ggerganov/llama.cpp/pull/6920\")\n"
168
172
  src_func += " print(\"**\")\n"
169
173
  src_func += " print(f\"** chkhsh: {chkhsh}\")\n"
170
174
  src_func += " print(\"**************************************************************************************\")\n"
@@ -249,7 +253,7 @@ for model in models:
249
253
  from transformers import AutoTokenizer
250
254
  tokenizer = AutoTokenizer.from_pretrained(f"models/tokenizers/{name}")
251
255
 
252
- with open(f"models/ggml-vocab-{name}.gguf.inp", "w") as f:
256
+ with open(f"models/ggml-vocab-{name}.gguf.inp", "w", encoding="utf-8") as f:
253
257
  for text in tests:
254
258
  f.write(f"{text}")
255
259
  f.write("\n__ggml_vocab_test__\n")
@@ -279,8 +279,9 @@ class Model(ABC):
279
279
 
280
280
  res = None
281
281
 
282
- # NOTE: if you get an error here, you need to add the model to the if-elif chain below
283
- # don't do this manually - use the convert-hf-to-gguf-update.py script!
282
+ # NOTE: if you get an error here, you need to update the convert-hf-to-gguf-update.py script
283
+ # or pull the latest version of the model from Huggingface
284
+ # don't edit the hashes manually!
284
285
  if chkhsh == "0ef9807a4087ebef797fc749390439009c3b9eda9ad1a097abbe738f486c01e5":
285
286
  # ref: https://huggingface.co/meta-llama/Meta-Llama-3-8B
286
287
  res = "llama-bpe"
@@ -310,8 +311,11 @@ class Model(ABC):
310
311
  print("\n")
311
312
  print("**************************************************************************************")
312
313
  print("** WARNING: The BPE pre-tokenizer was not recognized!")
313
- print("** This means that it was not added yet or you are using an older version.")
314
- print("** Check convert-hf-to-gguf-update.py and update it accordingly.")
314
+ print("** There are 2 possible reasons for this:")
315
+ print("** - the model has not been added to convert-hf-to-gguf-update.py yet")
316
+ print("** - the pre-tokenization config has changed upstream")
317
+ print("** Check your model files and convert-hf-to-gguf-update.py and update them accordingly.")
318
+ print("** ref: https://github.com/ggerganov/llama.cpp/pull/6920")
315
319
  print("**")
316
320
  print(f"** chkhsh: {chkhsh}")
317
321
  print("**************************************************************************************")
@@ -32,7 +32,7 @@ int main(int argc, char ** argv) {
32
32
  gpt_params params;
33
33
 
34
34
  if (argc == 1 || argv[1][0] == '-') {
35
- printf("usage: %s MODEL_PATH [N_KV_MAX] [N_BATCH] [N_UBATCH] [IS_PP_SHARED] [NGL] <PP> <TG> <PL>\n" , argv[0]);
35
+ printf("usage: %s MODEL_PATH [N_KV_MAX] [N_BATCH] [N_UBATCH] [FATTN] [IS_PP_SHARED] [NGL] <PP> <TG> <PL>\n" , argv[0]);
36
36
  printf(" <PP>, <TG> and PL are comma-separated lists of numbers without spaces\n\n");
37
37
  printf(" example: %s ggml-model-f16.gguf 2048 2048 512 0 999 128,256,512 128,256 1,2,4,8,16,32\n\n", argv[0]);
38
38
  return 1 ;
@@ -41,6 +41,7 @@ int main(int argc, char ** argv) {
41
41
  int n_kv_max = 2048;
42
42
  int n_batch = 2048;
43
43
  int n_ubatch = 512;
44
+ bool flash_attn = false;
44
45
  int is_pp_shared = 0;
45
46
  int n_gpu_layers = 0;
46
47
 
@@ -66,23 +67,27 @@ int main(int argc, char ** argv) {
66
67
  }
67
68
 
68
69
  if (argc >= 6) {
69
- is_pp_shared = std::atoi(argv[5]);
70
+ flash_attn = std::atoi(argv[5]);
70
71
  }
71
72
 
72
73
  if (argc >= 7) {
73
- n_gpu_layers = std::atoi(argv[6]);
74
+ is_pp_shared = std::atoi(argv[6]);
74
75
  }
75
76
 
76
77
  if (argc >= 8) {
77
- n_pp = parse_list(argv[7]);
78
+ n_gpu_layers = std::atoi(argv[7]);
78
79
  }
79
80
 
80
81
  if (argc >= 9) {
81
- n_tg = parse_list(argv[8]);
82
+ n_pp = parse_list(argv[8]);
82
83
  }
83
84
 
84
85
  if (argc >= 10) {
85
- n_pl = parse_list(argv[9]);
86
+ n_tg = parse_list(argv[9]);
87
+ }
88
+
89
+ if (argc >= 11) {
90
+ n_pl = parse_list(argv[10]);
86
91
  }
87
92
 
88
93
  // init LLM
@@ -108,10 +113,11 @@ int main(int argc, char ** argv) {
108
113
 
109
114
  llama_context_params ctx_params = llama_context_default_params();
110
115
 
111
- ctx_params.seed = 1234;
112
- ctx_params.n_ctx = n_kv_max;
113
- ctx_params.n_batch = n_batch;
114
- ctx_params.n_ubatch = n_ubatch;
116
+ ctx_params.seed = 1234;
117
+ ctx_params.n_ctx = n_kv_max;
118
+ ctx_params.n_batch = n_batch;
119
+ ctx_params.n_ubatch = n_ubatch;
120
+ ctx_params.flash_attn = flash_attn;
115
121
 
116
122
  ctx_params.n_threads = params.n_threads;
117
123
  ctx_params.n_threads_batch = params.n_threads_batch == -1 ? params.n_threads : params.n_threads_batch;
@@ -169,7 +175,7 @@ int main(int argc, char ** argv) {
169
175
  }
170
176
 
171
177
  LOG_TEE("\n");
172
- LOG_TEE("%s: n_kv_max = %d, n_batch = %d, n_ubatch = %d, is_pp_shared = %d, n_gpu_layers = %d, n_threads = %u, n_threads_batch = %u\n", __func__, n_kv_max, n_batch, n_ubatch, is_pp_shared, n_gpu_layers, ctx_params.n_threads, ctx_params.n_threads_batch);
178
+ LOG_TEE("%s: n_kv_max = %d, n_batch = %d, n_ubatch = %d, flash_attn = %d, is_pp_shared = %d, n_gpu_layers = %d, n_threads = %u, n_threads_batch = %u\n", __func__, n_kv_max, n_batch, n_ubatch, flash_attn, is_pp_shared, n_gpu_layers, ctx_params.n_threads, ctx_params.n_threads_batch);
173
179
  LOG_TEE("\n");
174
180
 
175
181
  LOG_TEE("|%6s | %6s | %4s | %6s | %8s | %8s | %8s | %8s | %8s | %8s |\n", "PP", "TG", "B", "N_KV", "T_PP s", "S_PP t/s", "T_TG s", "S_TG t/s", "T s", "S t/s");