llama-cpp-bin 9672.0.0__tar.gz → 9692.0.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (1069) hide show
  1. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/PKG-INFO +1 -1
  2. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/download.cpp +84 -0
  3. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/download.h +7 -0
  4. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/hf-cache.cpp +15 -0
  5. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/hf-cache.h +3 -0
  6. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/log.cpp +81 -75
  7. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/CMakeLists.txt +8 -1
  8. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt +1 -1
  9. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.cpp +20 -3
  10. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h +1 -0
  11. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp +2 -1
  12. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.metal +27 -12
  13. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp +52 -6
  14. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/CMakeLists.txt +2 -4
  15. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +1651 -0
  16. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.h +76 -23
  17. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.cpp +57 -3
  18. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.h +29 -8
  19. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino.cpp +303 -59
  20. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.cpp +66 -0
  21. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.h +10 -4
  22. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +114 -0
  23. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.h +1 -1
  24. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.h +4 -4
  25. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +169 -0
  26. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/add_id.cpp +62 -0
  27. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/argsort.cpp +47 -0
  28. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/clamp.cpp +33 -0
  29. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/concat.cpp +48 -0
  30. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +40 -0
  31. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +34 -0
  32. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/div.cpp +146 -0
  33. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +177 -0
  34. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/gated_delta_net.cpp +282 -0
  35. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/gated_delta_net.hpp +65 -0
  36. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/get_rows.cpp +2 -9
  37. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_geglu.cpp +21 -7
  38. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_swiglu.cpp +10 -7
  39. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/im2col.cpp +120 -0
  40. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/l2_norm.cpp +44 -0
  41. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/mul_mat_id.cpp +108 -0
  42. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/mulmat.cpp +19 -9
  43. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/norm.cpp +58 -0
  44. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/pad.cpp +95 -0
  45. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/permute.cpp +58 -13
  46. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/repeat.cpp +74 -0
  47. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/reshape.cpp +13 -6
  48. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rms_norm.cpp +1 -1
  49. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +245 -0
  50. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/set_rows.cpp +3 -3
  51. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +106 -0
  52. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/ssm_conv.cpp +59 -0
  53. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/sum_rows.cpp +27 -0
  54. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +54 -0
  55. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_silu.cpp +1 -1
  56. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_softplus.cpp +38 -0
  57. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +118 -0
  58. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +64 -0
  59. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.h +17 -5
  60. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.cpp +43 -40
  61. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.h +5 -4
  62. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +802 -0
  63. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +88 -0
  64. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.cpp +383 -94
  65. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.h +11 -8
  66. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/backend.hpp +1 -0
  67. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/common.hpp +14 -0
  68. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-sycl/conv3d.cpp +218 -0
  69. llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-sycl/conv3d.hpp +8 -0
  70. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp +15 -7
  71. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp +122 -50
  72. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp +1 -1
  73. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp +6 -1
  74. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-context.cpp +1 -1
  75. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-hparams.cpp +4 -0
  76. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-hparams.h +7 -0
  77. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama.cpp +1 -1
  78. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/eagle3.cpp +4 -4
  79. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-image.cpp +21 -0
  80. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-image.h +6 -0
  81. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd.cpp +6 -25
  82. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-http.cpp +17 -0
  83. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-http.h +1 -0
  84. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-models.cpp +397 -34
  85. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-models.h +62 -27
  86. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-queue.cpp +11 -0
  87. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-queue.h +5 -1
  88. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-task.h +12 -0
  89. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server.cpp +8 -0
  90. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/_version.py +3 -3
  91. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/PKG-INFO +1 -1
  92. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/SOURCES.txt +18 -1
  93. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +0 -985
  94. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +0 -74
  95. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +0 -112
  96. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +0 -48
  97. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +0 -21
  98. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +0 -90
  99. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +0 -149
  100. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +0 -89
  101. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +0 -23
  102. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_gelu.cpp +0 -25
  103. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +0 -53
  104. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +0 -47
  105. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +0 -257
  106. llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +0 -86
  107. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/scripts/generate-pep503-index.py +0 -0
  108. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-everything.yml +0 -0
  109. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-cpu.yml +0 -0
  110. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-cuda.yml +0 -0
  111. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-macos.yml +0 -0
  112. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-rocm.yml +0 -0
  113. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-vulkan.yml +0 -0
  114. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/check-upstream.yml +0 -0
  115. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/update-index.yml +0 -0
  116. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.gitignore +0 -0
  117. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.gitmodules +0 -0
  118. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/LICENSE +0 -0
  119. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/MANIFEST.in +0 -0
  120. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/README.md +0 -0
  121. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/CMakeLists.txt +0 -0
  122. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/app/CMakeLists.txt +0 -0
  123. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/app/llama.cpp +0 -0
  124. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-apple-clang.cmake +0 -0
  125. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-linux-clang.cmake +0 -0
  126. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-windows-llvm.cmake +0 -0
  127. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/build-info.cmake +0 -0
  128. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/common.cmake +0 -0
  129. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/download-models.cmake +0 -0
  130. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/git-vars.cmake +0 -0
  131. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/license.cmake +0 -0
  132. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/llama-config.cmake.in +0 -0
  133. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/llama.pc.in +0 -0
  134. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/riscv64-spacemit-linux-gnu-gcc.cmake +0 -0
  135. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/x64-windows-llvm.cmake +0 -0
  136. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/CMakeLists.txt +0 -0
  137. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/arg.cpp +0 -0
  138. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/arg.h +0 -0
  139. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/base64.hpp +0 -0
  140. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/build-info.cpp.in +0 -0
  141. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/build-info.h +0 -0
  142. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-generator.cpp +0 -0
  143. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-helpers.cpp +0 -0
  144. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-helpers.h +0 -0
  145. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser.h +0 -0
  146. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-diff-analyzer.cpp +0 -0
  147. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-peg-parser.cpp +0 -0
  148. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-peg-parser.h +0 -0
  149. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat.cpp +0 -0
  150. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat.h +0 -0
  151. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/common.cpp +0 -0
  152. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/common.h +0 -0
  153. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/console.cpp +0 -0
  154. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/console.h +0 -0
  155. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/debug.cpp +0 -0
  156. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/debug.h +0 -0
  157. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/fit.cpp +0 -0
  158. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/fit.h +0 -0
  159. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/http.h +0 -0
  160. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/imatrix-loader.cpp +0 -0
  161. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/imatrix-loader.h +0 -0
  162. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/caps.cpp +0 -0
  163. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/caps.h +0 -0
  164. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/lexer.cpp +0 -0
  165. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/lexer.h +0 -0
  166. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/parser.cpp +0 -0
  167. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/parser.h +0 -0
  168. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/runtime.cpp +0 -0
  169. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/runtime.h +0 -0
  170. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/string.cpp +0 -0
  171. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/string.h +0 -0
  172. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/utils.h +0 -0
  173. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/value.cpp +0 -0
  174. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/value.h +0 -0
  175. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-partial.cpp +0 -0
  176. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-partial.h +0 -0
  177. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
  178. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-schema-to-grammar.h +0 -0
  179. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/llguidance.cpp +0 -0
  180. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/log.h +0 -0
  181. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-cache.cpp +0 -0
  182. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-cache.h +0 -0
  183. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-map.cpp +0 -0
  184. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-map.h +0 -0
  185. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-mod.cpp +0 -0
  186. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-mod.h +0 -0
  187. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/peg-parser.cpp +0 -0
  188. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/peg-parser.h +0 -0
  189. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/preset.cpp +0 -0
  190. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/preset.h +0 -0
  191. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/reasoning-budget.cpp +0 -0
  192. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/reasoning-budget.h +0 -0
  193. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/regex-partial.cpp +0 -0
  194. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/regex-partial.h +0 -0
  195. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/sampling.cpp +0 -0
  196. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/sampling.h +0 -0
  197. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/speculative.cpp +0 -0
  198. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/speculative.h +0 -0
  199. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/unicode.cpp +0 -0
  200. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/unicode.h +0 -0
  201. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/CMakeLists.txt +0 -0
  202. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/batched/CMakeLists.txt +0 -0
  203. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/batched/batched.cpp +0 -0
  204. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
  205. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
  206. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/debug/CMakeLists.txt +0 -0
  207. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/debug/debug.cpp +0 -0
  208. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/deprecation-warning/deprecation-warning.cpp +0 -0
  209. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/CMakeLists.txt +0 -0
  210. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion-cli.cpp +0 -0
  211. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion.cpp +0 -0
  212. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion.h +0 -0
  213. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
  214. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/embedding/embedding.cpp +0 -0
  215. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
  216. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
  217. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gen-docs/CMakeLists.txt +0 -0
  218. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gen-docs/gen-docs.cpp +0 -0
  219. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
  220. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf/gguf.cpp +0 -0
  221. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/CMakeLists.txt +0 -0
  222. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h +0 -0
  223. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.c +0 -0
  224. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.h +0 -0
  225. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.c +0 -0
  226. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.h +0 -0
  227. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c +0 -0
  228. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h +0 -0
  229. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/gguf-hash.cpp +0 -0
  230. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/idle/CMakeLists.txt +0 -0
  231. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/idle/idle.cpp +0 -0
  232. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/CMakeLists.txt +0 -0
  233. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/ai_chat.cpp +0 -0
  234. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/logging.h +0 -0
  235. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
  236. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
  237. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
  238. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
  239. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
  240. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
  241. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup.cpp +0 -0
  242. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/model-conversion/requirements.txt +0 -0
  243. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
  244. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/parallel/parallel.cpp +0 -0
  245. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
  246. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/passkey/passkey.cpp +0 -0
  247. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
  248. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
  249. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple/CMakeLists.txt +0 -0
  250. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple/simple.cpp +0 -0
  251. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-chat/CMakeLists.txt +0 -0
  252. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-chat/simple-chat.cpp +0 -0
  253. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt +0 -0
  254. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
  255. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative/speculative.cpp +0 -0
  256. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative-simple/CMakeLists.txt +0 -0
  257. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative-simple/speculative-simple.cpp +0 -0
  258. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
  259. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
  260. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/training/CMakeLists.txt +0 -0
  261. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/training/finetune.cpp +0 -0
  262. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/CMakeLists.txt +0 -0
  263. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/FindNCCL.cmake +0 -0
  264. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/GitVars.cmake +0 -0
  265. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/common.cmake +0 -0
  266. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/ggml-config.cmake.in +0 -0
  267. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-alloc.h +0 -0
  268. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-backend.h +0 -0
  269. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-blas.h +0 -0
  270. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cann.h +0 -0
  271. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cpp.h +0 -0
  272. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cpu.h +0 -0
  273. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cuda.h +0 -0
  274. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-hexagon.h +0 -0
  275. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-metal.h +0 -0
  276. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-opencl.h +0 -0
  277. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-openvino.h +0 -0
  278. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-opt.h +0 -0
  279. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-rpc.h +0 -0
  280. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-sycl.h +0 -0
  281. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-virtgpu.h +0 -0
  282. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-vulkan.h +0 -0
  283. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-webgpu.h +0 -0
  284. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-zdnn.h +0 -0
  285. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-zendnn.h +0 -0
  286. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml.h +0 -0
  287. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/gguf.h +0 -0
  288. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-alloc.c +0 -0
  289. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-dl.cpp +0 -0
  290. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-dl.h +0 -0
  291. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-impl.h +0 -0
  292. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-meta.cpp +0 -0
  293. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-reg.cpp +0 -0
  294. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend.cpp +0 -0
  295. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-blas/CMakeLists.txt +0 -0
  296. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp +0 -0
  297. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/CMakeLists.txt +0 -0
  298. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp +0 -0
  299. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.h +0 -0
  300. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp +0 -0
  301. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.h +0 -0
  302. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/common.h +0 -0
  303. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp +0 -0
  304. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-common.h +0 -0
  305. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.cpp +0 -0
  306. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.h +0 -0
  307. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/common.h +0 -0
  308. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.cpp +0 -0
  309. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.h +0 -0
  310. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/cpu-feats.cpp +0 -0
  311. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c +0 -0
  312. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/repack.cpp +0 -0
  313. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/loongarch/quants.c +0 -0
  314. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/cpu-feats.cpp +0 -0
  315. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/quants.c +0 -0
  316. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/cpu-feats.cpp +0 -0
  317. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/quants.c +0 -0
  318. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/repack.cpp +0 -0
  319. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/cpu-feats.cpp +0 -0
  320. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/quants.c +0 -0
  321. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/wasm/quants.c +0 -0
  322. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/cpu-feats.cpp +0 -0
  323. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/quants.c +0 -0
  324. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/repack.cpp +0 -0
  325. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch-fallback.h +0 -0
  326. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp +0 -0
  327. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.h +0 -0
  328. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake +0 -0
  329. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSMTIME.cmake +0 -0
  330. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/common.h +0 -0
  331. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu-impl.h +0 -0
  332. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c +0 -0
  333. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.cpp +0 -0
  334. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.cpp +0 -0
  335. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.h +0 -0
  336. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.cpp +0 -0
  337. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.h +0 -0
  338. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.cpp +0 -0
  339. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.h +0 -0
  340. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.cpp +0 -0
  341. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.h +0 -0
  342. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.cpp +0 -0
  343. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.h +0 -0
  344. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.c +0 -0
  345. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.h +0 -0
  346. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.cpp +0 -0
  347. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.h +0 -0
  348. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-gemm.h +0 -0
  349. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h +0 -0
  350. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.cpp +0 -0
  351. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.h +0 -0
  352. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime1_kernels.cpp +0 -0
  353. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime2_kernels.cpp +0 -0
  354. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.cpp +0 -0
  355. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.h +0 -0
  356. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_kernels.h +0 -0
  357. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.cpp +0 -0
  358. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.h +0 -0
  359. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.cpp +0 -0
  360. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.h +0 -0
  361. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_barrier.h +0 -0
  362. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.cpp +0 -0
  363. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.h +0 -0
  364. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_tcm.h +0 -0
  365. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.cpp +0 -0
  366. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.h +0 -0
  367. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.cpp +0 -0
  368. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.h +0 -0
  369. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.cpp +0 -0
  370. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.h +0 -0
  371. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt +0 -0
  372. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h +0 -0
  373. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/hip.h +0 -0
  374. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/musa.h +0 -0
  375. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/CMakeLists.txt +0 -0
  376. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp +0 -0
  377. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/CMakeLists.txt +0 -0
  378. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/act-ops.c +0 -0
  379. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/argsort-ops.c +0 -0
  380. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/binary-ops.c +0 -0
  381. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cmake-toolchain.cmake +0 -0
  382. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/concat-ops.c +0 -0
  383. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cpy-ops.c +0 -0
  384. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cumsum-ops.c +0 -0
  385. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/diag-ops.c +0 -0
  386. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/fill-ops.c +0 -0
  387. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/flash-attn-ops.c +0 -0
  388. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/gated-delta-net-ops.c +0 -0
  389. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/get-rows-ops.c +0 -0
  390. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.c +0 -0
  391. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.h +0 -0
  392. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dump.h +0 -0
  393. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-fastdiv.h +0 -0
  394. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-utils.h +0 -0
  395. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-flash-attn-ops.c +0 -0
  396. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c +0 -0
  397. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.c +0 -0
  398. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.h +0 -0
  399. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-profile.h +0 -0
  400. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.c +0 -0
  401. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.h +0 -0
  402. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-utils.h +0 -0
  403. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ctx.h +0 -0
  404. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ops.h +0 -0
  405. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-arith.h +0 -0
  406. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-base.h +0 -0
  407. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-copy.h +0 -0
  408. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-div.h +0 -0
  409. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-dump.h +0 -0
  410. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-exp.h +0 -0
  411. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-flash-attn.h +0 -0
  412. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-floor.h +0 -0
  413. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-inverse.h +0 -0
  414. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-log.h +0 -0
  415. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-pow.h +0 -0
  416. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-reduce.h +0 -0
  417. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-repl.h +0 -0
  418. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-scale.h +0 -0
  419. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sigmoid.h +0 -0
  420. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sin-cos.h +0 -0
  421. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sqrt.h +0 -0
  422. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-types.h +0 -0
  423. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-utils.h +0 -0
  424. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/main.c +0 -0
  425. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/matmul-ops.c +0 -0
  426. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/pad-ops.c +0 -0
  427. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/repeat-ops.c +0 -0
  428. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/rope-ops.c +0 -0
  429. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/set-rows-ops.c +0 -0
  430. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/softmax-ops.c +0 -0
  431. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/solve-tri-ops.c +0 -0
  432. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/ssm-conv.c +0 -0
  433. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/sum-rows-ops.c +0 -0
  434. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/unary-ops.c +0 -0
  435. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/vtcm-utils.h +0 -0
  436. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.c +0 -0
  437. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.h +0 -0
  438. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.cpp +0 -0
  439. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.h +0 -0
  440. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-opnode.h +0 -0
  441. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/libdl.h +0 -0
  442. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hip/CMakeLists.txt +0 -0
  443. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-impl.h +0 -0
  444. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/CMakeLists.txt +0 -0
  445. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.cpp +0 -0
  446. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.h +0 -0
  447. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-context.h +0 -0
  448. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h +0 -0
  449. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.h +0 -0
  450. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.cpp +0 -0
  451. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-musa/CMakeLists.txt +0 -0
  452. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt +0 -0
  453. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.cpp +0 -0
  454. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.cpp +0 -0
  455. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/scale.cpp +0 -0
  456. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.cpp +0 -0
  457. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.h +0 -0
  458. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/mark_decompression_convert_constant_folding.h +1 -1
  459. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.cpp +0 -0
  460. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.h +0 -0
  461. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/rt_info/weightless_caching_attributes.hpp +0 -0
  462. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opt.cpp +0 -0
  463. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-quants.c +0 -0
  464. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-quants.h +0 -0
  465. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt +0 -0
  466. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp +0 -0
  467. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.cpp +0 -0
  468. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.h +0 -0
  469. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt +0 -0
  470. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.cpp +0 -0
  471. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.hpp +0 -0
  472. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.cpp +0 -0
  473. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.hpp +0 -0
  474. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/common.cpp +0 -0
  475. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.cpp +0 -0
  476. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.hpp +0 -0
  477. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.cpp +0 -0
  478. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.hpp +0 -0
  479. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.cpp +0 -0
  480. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.hpp +0 -0
  481. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.cpp +0 -0
  482. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.hpp +0 -0
  483. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.cpp +0 -0
  484. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.hpp +0 -0
  485. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.cpp +0 -0
  486. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.hpp +0 -0
  487. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dequantize.hpp +0 -0
  488. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.cpp +0 -0
  489. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.hpp +0 -0
  490. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.cpp +0 -0
  491. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.hpp +0 -0
  492. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp +0 -0
  493. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp +0 -0
  494. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.cpp +0 -0
  495. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.hpp +0 -0
  496. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-common.hpp +0 -0
  497. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.cpp +0 -0
  498. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.hpp +0 -0
  499. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-vec.hpp +0 -0
  500. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.cpp +0 -0
  501. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.hpp +0 -0
  502. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.cpp +0 -0
  503. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.hpp +0 -0
  504. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.cpp +0 -0
  505. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.hpp +0 -0
  506. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gemm.hpp +0 -0
  507. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.cpp +0 -0
  508. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.hpp +0 -0
  509. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.cpp +0 -0
  510. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.hpp +0 -0
  511. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.cpp +0 -0
  512. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.hpp +0 -0
  513. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.cpp +0 -0
  514. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.hpp +0 -0
  515. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.cpp +0 -0
  516. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.hpp +0 -0
  517. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.cpp +0 -0
  518. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.hpp +0 -0
  519. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.cpp +0 -0
  520. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.hpp +0 -0
  521. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.cpp +0 -0
  522. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.hpp +0 -0
  523. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.cpp +0 -0
  524. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.hpp +0 -0
  525. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.cpp +0 -0
  526. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.hpp +0 -0
  527. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/presets.hpp +0 -0
  528. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/quantize.hpp +0 -0
  529. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/quants.hpp +0 -0
  530. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.cpp +0 -0
  531. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.hpp +0 -0
  532. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.cpp +0 -0
  533. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.hpp +0 -0
  534. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.cpp +0 -0
  535. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.hpp +0 -0
  536. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set.cpp +0 -0
  537. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set.hpp +0 -0
  538. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.cpp +0 -0
  539. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.hpp +0 -0
  540. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.cpp +0 -0
  541. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.hpp +0 -0
  542. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.cpp +0 -0
  543. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.hpp +0 -0
  544. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.cpp +0 -0
  545. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.hpp +0 -0
  546. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.cpp +0 -0
  547. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.hpp +0 -0
  548. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp +0 -0
  549. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp +0 -0
  550. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq112-dv112.cpp +0 -0
  551. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq128-dv128.cpp +0 -0
  552. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq256-dv256.cpp +0 -0
  553. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq40-dv40.cpp +0 -0
  554. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq512-dv512.cpp +0 -0
  555. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq576-dv512.cpp +0 -0
  556. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq64-dv64.cpp +0 -0
  557. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq72-dv72.cpp +0 -0
  558. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq80-dv80.cpp +0 -0
  559. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq96-dv96.cpp +0 -0
  560. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-f16.cpp +0 -0
  561. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_0.cpp +0 -0
  562. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_1.cpp +0 -0
  563. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_0.cpp +0 -0
  564. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_1.cpp +0 -0
  565. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q8_0.cpp +0 -0
  566. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-f16.cpp +0 -0
  567. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_0.cpp +0 -0
  568. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_1.cpp +0 -0
  569. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_0.cpp +0 -0
  570. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_1.cpp +0 -0
  571. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q8_0.cpp +0 -0
  572. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-f16.cpp +0 -0
  573. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_0.cpp +0 -0
  574. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_1.cpp +0 -0
  575. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_0.cpp +0 -0
  576. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_1.cpp +0 -0
  577. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q8_0.cpp +0 -0
  578. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-f16.cpp +0 -0
  579. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_0.cpp +0 -0
  580. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_1.cpp +0 -0
  581. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_0.cpp +0 -0
  582. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_1.cpp +0 -0
  583. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q8_0.cpp +0 -0
  584. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-f16.cpp +0 -0
  585. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_0.cpp +0 -0
  586. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_1.cpp +0 -0
  587. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_0.cpp +0 -0
  588. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_1.cpp +0 -0
  589. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q8_0.cpp +0 -0
  590. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-f16.cpp +0 -0
  591. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_0.cpp +0 -0
  592. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_1.cpp +0 -0
  593. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_0.cpp +0 -0
  594. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_1.cpp +0 -0
  595. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q8_0.cpp +0 -0
  596. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.cpp +0 -0
  597. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.hpp +0 -0
  598. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/type.hpp +0 -0
  599. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.cpp +0 -0
  600. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.hpp +0 -0
  601. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp +0 -0
  602. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.cpp +0 -0
  603. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.hpp +0 -0
  604. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-threading.cpp +0 -0
  605. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-threading.h +0 -0
  606. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/CMakeLists.txt +0 -0
  607. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/apir_cs_ggml-rpc-front.cpp +0 -0
  608. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/CMakeLists.txt +0 -0
  609. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/apir_cs_ggml-rpc-back.cpp +0 -0
  610. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-convert.h +0 -0
  611. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp +0 -0
  612. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp +0 -0
  613. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp +0 -0
  614. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-device.cpp +0 -0
  615. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp +0 -0
  616. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h +0 -0
  617. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.h +0 -0
  618. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h +0 -0
  619. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend.cpp +0 -0
  620. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/api_remoting.h +0 -0
  621. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h +0 -0
  622. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.h +0 -0
  623. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs.h +0 -0
  624. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h +0 -0
  625. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h +0 -0
  626. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp +0 -0
  627. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer.cpp +0 -0
  628. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-device.cpp +0 -0
  629. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-reg.cpp +0 -0
  630. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend.cpp +0 -0
  631. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-remoting.h +0 -0
  632. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/include/apir_hw.h +0 -0
  633. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-apir.h +0 -0
  634. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp +0 -0
  635. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp +0 -0
  636. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp +0 -0
  637. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp +0 -0
  638. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-impl.h +0 -0
  639. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward.gen.h +0 -0
  640. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.cpp +0 -0
  641. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.h +0 -0
  642. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.cpp +0 -0
  643. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.h +0 -0
  644. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.cpp +0 -0
  645. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.h +0 -0
  646. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt +0 -0
  647. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/cmake/host-toolchain.cmake.in +0 -0
  648. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt +0 -0
  649. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/CMakeLists.txt +0 -0
  650. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp +0 -0
  651. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu.cpp +0 -0
  652. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/pre_wgsl.hpp +0 -0
  653. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/CMakeLists.txt +0 -0
  654. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/common.hpp +0 -0
  655. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/ggml-zdnn.cpp +0 -0
  656. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.cpp +0 -0
  657. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.hpp +0 -0
  658. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.cpp +0 -0
  659. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.hpp +0 -0
  660. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zendnn/CMakeLists.txt +0 -0
  661. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zendnn/ggml-zendnn.cpp +0 -0
  662. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml.c +0 -0
  663. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml.cpp +0 -0
  664. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/gguf.cpp +0 -0
  665. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/include/llama-cpp.h +0 -0
  666. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/include/llama.h +0 -0
  667. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/CMakeLists.txt +0 -0
  668. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
  669. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
  670. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/vdot.cpp +0 -0
  671. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-all.txt +0 -0
  672. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-compare-llama-bench.txt +0 -0
  673. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf.txt +0 -0
  674. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt +0 -0
  675. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_legacy_llama.txt +0 -0
  676. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt +0 -0
  677. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_lora_to_gguf.txt +0 -0
  678. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-gguf_editor_gui.txt +0 -0
  679. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-pydantic.txt +0 -0
  680. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-server-bench.txt +0 -0
  681. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-test-tokenizer-random.txt +0 -0
  682. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-tool_bench.txt +0 -0
  683. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements.txt +0 -0
  684. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/jinja/requirements.txt +0 -0
  685. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/snapdragon/qdc/requirements.txt +0 -0
  686. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/ui-assets.cmake +0 -0
  687. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/CMakeLists.txt +0 -0
  688. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-adapter.cpp +0 -0
  689. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-adapter.h +0 -0
  690. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-arch.cpp +0 -0
  691. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-arch.h +0 -0
  692. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-batch.cpp +0 -0
  693. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-batch.h +0 -0
  694. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-chat.cpp +0 -0
  695. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-chat.h +0 -0
  696. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-context.h +0 -0
  697. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-cparams.cpp +0 -0
  698. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-cparams.h +0 -0
  699. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-ext.h +0 -0
  700. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-grammar.cpp +0 -0
  701. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-grammar.h +0 -0
  702. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-graph.cpp +0 -0
  703. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-graph.h +0 -0
  704. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-impl.cpp +0 -0
  705. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-impl.h +0 -0
  706. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-io.cpp +0 -0
  707. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-io.h +0 -0
  708. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-dsa.cpp +0 -0
  709. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-dsa.h +0 -0
  710. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-iswa.cpp +0 -0
  711. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-iswa.h +0 -0
  712. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache.cpp +0 -0
  713. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache.h +0 -0
  714. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cells.h +0 -0
  715. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.cpp +0 -0
  716. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.h +0 -0
  717. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid.cpp +0 -0
  718. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid.h +0 -0
  719. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-recurrent.cpp +0 -0
  720. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-recurrent.h +0 -0
  721. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory.cpp +0 -0
  722. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory.h +0 -0
  723. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-mmap.cpp +0 -0
  724. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-mmap.h +0 -0
  725. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-loader.cpp +0 -0
  726. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-loader.h +0 -0
  727. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-saver.cpp +0 -0
  728. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-saver.h +0 -0
  729. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model.cpp +0 -0
  730. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model.h +0 -0
  731. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-quant.cpp +0 -0
  732. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-quant.h +0 -0
  733. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-sampler.cpp +0 -0
  734. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-sampler.h +0 -0
  735. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-vocab.cpp +0 -0
  736. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-vocab.h +0 -0
  737. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/afmoe.cpp +0 -0
  738. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/apertus.cpp +0 -0
  739. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arcee.cpp +0 -0
  740. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arctic.cpp +0 -0
  741. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arwkv7.cpp +0 -0
  742. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/baichuan.cpp +0 -0
  743. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bailingmoe.cpp +0 -0
  744. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bailingmoe2.cpp +0 -0
  745. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bert.cpp +0 -0
  746. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bitnet.cpp +0 -0
  747. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bloom.cpp +0 -0
  748. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/chameleon.cpp +0 -0
  749. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/chatglm.cpp +0 -0
  750. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/codeshell.cpp +0 -0
  751. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cogvlm.cpp +0 -0
  752. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cohere2.cpp +0 -0
  753. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cohere2moe.cpp +0 -0
  754. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/command-r.cpp +0 -0
  755. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dbrx.cpp +0 -0
  756. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deci.cpp +0 -0
  757. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek.cpp +0 -0
  758. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek2.cpp +0 -0
  759. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek2ocr.cpp +0 -0
  760. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek32.cpp +0 -0
  761. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/delta-net-base.cpp +0 -0
  762. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dots1.cpp +0 -0
  763. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dream.cpp +0 -0
  764. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/ernie4-5-moe.cpp +0 -0
  765. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/ernie4-5.cpp +0 -0
  766. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/eurobert.cpp +0 -0
  767. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone-moe.cpp +0 -0
  768. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone.cpp +0 -0
  769. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone4.cpp +0 -0
  770. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/falcon-h1.cpp +0 -0
  771. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/falcon.cpp +0 -0
  772. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma-embedding.cpp +0 -0
  773. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma.cpp +0 -0
  774. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma2.cpp +0 -0
  775. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma3.cpp +0 -0
  776. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma3n.cpp +0 -0
  777. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma4-assistant.cpp +0 -0
  778. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma4.cpp +0 -0
  779. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm-dsa.cpp +0 -0
  780. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm4-moe.cpp +0 -0
  781. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm4.cpp +0 -0
  782. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gpt2.cpp +0 -0
  783. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gptneox.cpp +0 -0
  784. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite-hybrid.cpp +0 -0
  785. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite-moe.cpp +0 -0
  786. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite.cpp +0 -0
  787. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/grok.cpp +0 -0
  788. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/grovemoe.cpp +0 -0
  789. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-dense.cpp +0 -0
  790. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-moe.cpp +0 -0
  791. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-vl.cpp +0 -0
  792. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/internlm2.cpp +0 -0
  793. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jais.cpp +0 -0
  794. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jais2.cpp +0 -0
  795. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jamba.cpp +0 -0
  796. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jina-bert-v2.cpp +0 -0
  797. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jina-bert-v3.cpp +0 -0
  798. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/kimi-linear.cpp +0 -0
  799. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/lfm2.cpp +0 -0
  800. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/lfm2moe.cpp +0 -0
  801. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llada-moe.cpp +0 -0
  802. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llada.cpp +0 -0
  803. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama-embed.cpp +0 -0
  804. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama.cpp +0 -0
  805. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama4.cpp +0 -0
  806. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/maincoder.cpp +0 -0
  807. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba-base.cpp +0 -0
  808. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba.cpp +0 -0
  809. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba2.cpp +0 -0
  810. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mellum.cpp +0 -0
  811. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mimo2.cpp +0 -0
  812. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minicpm.cpp +0 -0
  813. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minicpm3.cpp +0 -0
  814. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minimax-m2.cpp +0 -0
  815. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mistral3.cpp +0 -0
  816. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mistral4.cpp +0 -0
  817. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/models.h +0 -0
  818. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/modern-bert.cpp +0 -0
  819. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mpt.cpp +0 -0
  820. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron-h-moe.cpp +0 -0
  821. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron-h.cpp +0 -0
  822. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron.cpp +0 -0
  823. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/neo-bert.cpp +0 -0
  824. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nomic-bert-moe.cpp +0 -0
  825. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nomic-bert.cpp +0 -0
  826. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmo.cpp +0 -0
  827. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmo2.cpp +0 -0
  828. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmoe.cpp +0 -0
  829. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/openai-moe.cpp +0 -0
  830. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/openelm.cpp +0 -0
  831. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/orion.cpp +0 -0
  832. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/paddleocr.cpp +0 -0
  833. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/pangu-embed.cpp +0 -0
  834. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phi2.cpp +0 -0
  835. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phi3.cpp +0 -0
  836. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phimoe.cpp +0 -0
  837. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo.cpp +0 -0
  838. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo2.cpp +0 -0
  839. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo3.cpp +0 -0
  840. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plm.cpp +0 -0
  841. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen.cpp +0 -0
  842. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2.cpp +0 -0
  843. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2moe.cpp +0 -0
  844. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2vl.cpp +0 -0
  845. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3.cpp +0 -0
  846. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen35.cpp +0 -0
  847. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen35moe.cpp +0 -0
  848. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3moe.cpp +0 -0
  849. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3next.cpp +0 -0
  850. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3vl.cpp +0 -0
  851. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3vlmoe.cpp +0 -0
  852. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/refact.cpp +0 -0
  853. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rnd1.cpp +0 -0
  854. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6-base.cpp +0 -0
  855. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6.cpp +0 -0
  856. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6qwen2.cpp +0 -0
  857. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv7-base.cpp +0 -0
  858. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv7.cpp +0 -0
  859. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/seed-oss.cpp +0 -0
  860. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/smallthinker.cpp +0 -0
  861. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/smollm3.cpp +0 -0
  862. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/stablelm.cpp +0 -0
  863. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/starcoder.cpp +0 -0
  864. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/starcoder2.cpp +0 -0
  865. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/step35.cpp +0 -0
  866. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/t5.cpp +0 -0
  867. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/t5encoder.cpp +0 -0
  868. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/talkie.cpp +0 -0
  869. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/wavtokenizer-dec.cpp +0 -0
  870. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/xverse.cpp +0 -0
  871. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode-data.cpp +0 -0
  872. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode-data.h +0 -0
  873. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode.cpp +0 -0
  874. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode.h +0 -0
  875. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/CMakeLists.txt +0 -0
  876. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/export-graph-ops.cpp +0 -0
  877. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/get-model.cpp +0 -0
  878. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/get-model.h +0 -0
  879. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/gguf-model-data.cpp +0 -0
  880. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/gguf-model-data.h +0 -0
  881. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.cpp +0 -0
  882. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.h +0 -0
  883. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-basic.cpp +0 -0
  884. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-gbnf-generation.cpp +0 -0
  885. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-json-parser.cpp +0 -0
  886. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-json-serialization.cpp +0 -0
  887. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-python-dict-parser.cpp +0 -0
  888. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-unicode.cpp +0 -0
  889. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/tests.h +0 -0
  890. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-alloc.cpp +0 -0
  891. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-arg-parser.cpp +0 -0
  892. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-autorelease.cpp +0 -0
  893. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-backend-ops.cpp +0 -0
  894. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-backend-sampler.cpp +0 -0
  895. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-barrier.cpp +0 -0
  896. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-c.c +0 -0
  897. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-auto-parser.cpp +0 -0
  898. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-peg-parser.cpp +0 -0
  899. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-template.cpp +0 -0
  900. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat.cpp +0 -0
  901. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-col2im-1d.cpp +0 -0
  902. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-double-float.cpp +0 -0
  903. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gbnf-validator.cpp +0 -0
  904. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gguf-model-data.cpp +0 -0
  905. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gguf.cpp +0 -0
  906. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-integration.cpp +0 -0
  907. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-llguidance.cpp +0 -0
  908. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-parser.cpp +0 -0
  909. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-jinja.cpp +0 -0
  910. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-json-partial.cpp +0 -0
  911. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
  912. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-llama-archs.cpp +0 -0
  913. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-llama-grammar.cpp +0 -0
  914. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-log.cpp +0 -0
  915. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
  916. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-mtmd-c-api.c +0 -0
  917. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-opt.cpp +0 -0
  918. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-peg-parser.cpp +0 -0
  919. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quant-type-selection.cpp +0 -0
  920. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-fns.cpp +0 -0
  921. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-perf.cpp +0 -0
  922. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-stats.cpp +0 -0
  923. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-reasoning-budget.cpp +0 -0
  924. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-recurrent-state-rollback.cpp +0 -0
  925. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-regex-partial.cpp +0 -0
  926. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-rope.cpp +0 -0
  927. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-sampling.cpp +0 -0
  928. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-save-load-state.cpp +0 -0
  929. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-state-restore-fragmented.cpp +0 -0
  930. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-thread-safety.cpp +0 -0
  931. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
  932. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
  933. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
  934. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/testing.h +0 -0
  935. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/CMakeLists.txt +0 -0
  936. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/CMakeLists.txt +0 -0
  937. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/batched-bench.cpp +0 -0
  938. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/main.cpp +0 -0
  939. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/CMakeLists.txt +0 -0
  940. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/cli.cpp +0 -0
  941. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/main.cpp +0 -0
  942. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/CMakeLists.txt +0 -0
  943. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/completion.cpp +0 -0
  944. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/main.cpp +0 -0
  945. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/CMakeLists.txt +0 -0
  946. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/completions.txt +0 -0
  947. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/cvector-generator.cpp +0 -0
  948. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/mean.hpp +0 -0
  949. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/negative.txt +0 -0
  950. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/pca.hpp +0 -0
  951. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/positive.txt +0 -0
  952. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/export-lora/CMakeLists.txt +0 -0
  953. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/export-lora/export-lora.cpp +0 -0
  954. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/CMakeLists.txt +0 -0
  955. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/fit-params.cpp +0 -0
  956. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/main.cpp +0 -0
  957. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/gguf-split/CMakeLists.txt +0 -0
  958. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/gguf-split/gguf-split.cpp +0 -0
  959. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/imatrix/CMakeLists.txt +0 -0
  960. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/imatrix/imatrix.cpp +0 -0
  961. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/CMakeLists.txt +0 -0
  962. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/llama-bench.cpp +0 -0
  963. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/main.cpp +0 -0
  964. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/CMakeLists.txt +0 -0
  965. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-graph.h +0 -0
  966. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-impl.h +0 -0
  967. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-model.h +0 -0
  968. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip.cpp +0 -0
  969. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip.h +0 -0
  970. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.cpp +0 -0
  971. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.h +0 -0
  972. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/deprecation-warning.cpp +0 -0
  973. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/cogvlm.cpp +0 -0
  974. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/conformer.cpp +0 -0
  975. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/deepseekocr.cpp +0 -0
  976. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/deepseekocr2.cpp +0 -0
  977. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/dotsocr.cpp +0 -0
  978. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/exaone4_5.cpp +0 -0
  979. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4a.cpp +0 -0
  980. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4ua.cpp +0 -0
  981. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4uv.cpp +0 -0
  982. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4v.cpp +0 -0
  983. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/glm4v.cpp +0 -0
  984. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/granite-speech.cpp +0 -0
  985. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/granite4-vision.cpp +0 -0
  986. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/hunyuanvl.cpp +0 -0
  987. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/internvl.cpp +0 -0
  988. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/kimik25.cpp +0 -0
  989. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/kimivl.cpp +0 -0
  990. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/llama4.cpp +0 -0
  991. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/llava.cpp +0 -0
  992. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/mimovl.cpp +0 -0
  993. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/minicpmv.cpp +0 -0
  994. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/mobilenetv5.cpp +0 -0
  995. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/models.h +0 -0
  996. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/nemotron-v2-vl.cpp +0 -0
  997. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/paddleocr.cpp +0 -0
  998. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/pixtral.cpp +0 -0
  999. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen2vl.cpp +0 -0
  1000. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen3a.cpp +0 -0
  1001. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen3vl.cpp +0 -0
  1002. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/siglip.cpp +0 -0
  1003. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/step3vl.cpp +0 -0
  1004. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/whisper-enc.cpp +0 -0
  1005. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/yasa2.cpp +0 -0
  1006. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/youtuvl.cpp +0 -0
  1007. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-audio.cpp +0 -0
  1008. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-audio.h +0 -0
  1009. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-cli.cpp +0 -0
  1010. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-helper.cpp +0 -0
  1011. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-helper.h +0 -0
  1012. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd.h +0 -0
  1013. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/requirements.txt +0 -0
  1014. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/tests/test-1-ground-truth.txt +0 -0
  1015. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/tests/tests-requirements.txt +0 -0
  1016. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/CMakeLists.txt +0 -0
  1017. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/debug-template-parser.cpp +0 -0
  1018. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/template-analysis.cpp +0 -0
  1019. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/CMakeLists.txt +0 -0
  1020. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/main.cpp +0 -0
  1021. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/perplexity.cpp +0 -0
  1022. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/CMakeLists.txt +0 -0
  1023. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/main.cpp +0 -0
  1024. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/quantize.cpp +0 -0
  1025. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/results/CMakeLists.txt +0 -0
  1026. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/results/results.cpp +0 -0
  1027. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/rpc/CMakeLists.txt +0 -0
  1028. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/rpc/rpc-server.cpp +0 -0
  1029. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/CMakeLists.txt +0 -0
  1030. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/bench/requirements.txt +0 -0
  1031. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/bench/speed-bench/requirements.txt +0 -0
  1032. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/main.cpp +0 -0
  1033. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-chat.cpp +0 -0
  1034. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-chat.h +0 -0
  1035. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-common.cpp +0 -0
  1036. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-common.h +0 -0
  1037. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-context.cpp +0 -0
  1038. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-context.h +0 -0
  1039. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-cors-proxy.h +0 -0
  1040. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-task.cpp +0 -0
  1041. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-tools.cpp +0 -0
  1042. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-tools.h +0 -0
  1043. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/tests/requirements.txt +0 -0
  1044. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tokenize/CMakeLists.txt +0 -0
  1045. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tokenize/tokenize.cpp +0 -0
  1046. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tts/CMakeLists.txt +0 -0
  1047. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tts/tts.cpp +0 -0
  1048. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/CMakeLists.txt +0 -0
  1049. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/embed.cpp +0 -0
  1050. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/sources.cmake +0 -0
  1051. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/CMakeLists.txt +0 -0
  1052. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/httplib.cpp +0 -0
  1053. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/httplib.h +0 -0
  1054. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/miniaudio/miniaudio.h +0 -0
  1055. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/nlohmann/json.hpp +0 -0
  1056. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/nlohmann/json_fwd.hpp +0 -0
  1057. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/sheredom/subprocess.h +0 -0
  1058. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/stb/stb_image.h +0 -0
  1059. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/pyproject.toml +0 -0
  1060. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/setup.cfg +0 -0
  1061. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/setup.py +0 -0
  1062. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/__init__.py +0 -0
  1063. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/bin/.gitkeep +0 -0
  1064. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/cli.py +0 -0
  1065. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/core.py +0 -0
  1066. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/dependency_links.txt +0 -0
  1067. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/entry_points.txt +0 -0
  1068. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/requires.txt +0 -0
  1069. {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/top_level.txt +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: llama-cpp-bin
3
- Version: 9672.0.0
3
+ Version: 9692.0.0
4
4
  Summary: llama.cpp server binary built from source
5
5
  Author-email: Vladyslav Tkachenko <vladlearns@gmail.com>
6
6
  License: AGPL-3.0-or-later
@@ -997,3 +997,87 @@ std::vector<common_cached_model_info> common_list_cached_models() {
997
997
 
998
998
  return result;
999
999
  }
1000
+
1001
+ bool common_download_remove(const std::string & hf_repo_with_tag) {
1002
+ namespace fs = std::filesystem;
1003
+
1004
+ auto [repo_id, tag] = common_download_split_repo_tag(hf_repo_with_tag);
1005
+
1006
+ if (tag.empty()) {
1007
+ return hf_cache::remove_cached_repo(repo_id);
1008
+ }
1009
+
1010
+ std::string tag_upper = tag;
1011
+ for (char & c : tag_upper) {
1012
+ c = (char) std::toupper((unsigned char) c);
1013
+ }
1014
+
1015
+ auto files = hf_cache::get_cached_files(repo_id);
1016
+ if (files.empty()) {
1017
+ return false;
1018
+ }
1019
+
1020
+ // collect snapshot entries whose tag matches
1021
+ std::vector<fs::path> to_remove;
1022
+ for (const auto & f : files) {
1023
+ auto split = get_gguf_split_info(f.path);
1024
+ if (split.tag == tag_upper) {
1025
+ to_remove.emplace_back(f.local_path);
1026
+ }
1027
+ }
1028
+
1029
+ if (to_remove.empty()) {
1030
+ return false;
1031
+ }
1032
+
1033
+ // resolve blob paths from symlinks before deleting snapshot entries
1034
+ std::vector<fs::path> blobs_to_check;
1035
+ for (const auto & p : to_remove) {
1036
+ std::error_code ec;
1037
+ if (fs::is_symlink(p, ec)) {
1038
+ auto target = fs::read_symlink(p, ec);
1039
+ if (!ec) {
1040
+ blobs_to_check.push_back((p.parent_path() / target).lexically_normal());
1041
+ }
1042
+ }
1043
+ }
1044
+
1045
+ // remove snapshot entries
1046
+ for (const auto & p : to_remove) {
1047
+ std::error_code ec;
1048
+ fs::remove(p, ec);
1049
+ if (ec) {
1050
+ LOG_WRN("%s: failed to remove %s: %s\n", __func__, p.string().c_str(), ec.message().c_str());
1051
+ }
1052
+ }
1053
+
1054
+ if (blobs_to_check.empty()) {
1055
+ return true;
1056
+ }
1057
+
1058
+ // collect blobs still referenced by remaining snapshot entries
1059
+ std::unordered_set<std::string> still_referenced;
1060
+ for (const auto & f : hf_cache::get_cached_files(repo_id)) {
1061
+ fs::path p(f.local_path);
1062
+ std::error_code ec;
1063
+ if (fs::is_symlink(p, ec)) {
1064
+ auto target = fs::read_symlink(p, ec);
1065
+ if (!ec) {
1066
+ still_referenced.insert((p.parent_path() / target).lexically_normal().string());
1067
+ }
1068
+ }
1069
+ }
1070
+
1071
+ // remove orphaned blobs
1072
+ for (const auto & blob : blobs_to_check) {
1073
+ if (still_referenced.find(blob.string()) == still_referenced.end()) {
1074
+ std::error_code ec;
1075
+ fs::remove(blob, ec);
1076
+ if (ec) {
1077
+ LOG_WRN("%s: failed to remove blob %s: %s\n", __func__, blob.string().c_str(), ec.message().c_str());
1078
+ }
1079
+ }
1080
+ }
1081
+
1082
+ return true;
1083
+ }
@@ -115,3 +115,10 @@ int common_download_file_single(const std::string & url,
115
115
  // resolve and download model from Docker registry
116
116
  // return local path to downloaded model file
117
117
  std::string common_docker_resolve_model(const std::string & docker);
118
+
119
+ // Remove a cached model from disk
120
+ // input format: "user/model" or "user/model:tag"
121
+ // - if tag is omitted, removes the entire repo cache directory
122
+ // - if tag is present, removes only files matching that tag (and orphaned blobs)
123
+ // returns true if anything was removed
124
+ bool common_download_remove(const std::string & hf_repo_with_tag);
@@ -495,4 +495,19 @@ std::string finalize_file(const hf_file & file) {
495
495
  return file.final_path;
496
496
  }
497
497
 
498
+ bool remove_cached_repo(const std::string & repo_id) {
499
+ if (!is_valid_repo_id(repo_id)) {
500
+ LOG_WRN("%s: invalid repository: %s\n", __func__, repo_id.c_str());
501
+ return false;
502
+ }
503
+ fs::path repo_path = get_repo_path(repo_id);
504
+ std::error_code ec;
505
+ auto removed = fs::remove_all(repo_path, ec);
506
+ if (ec) {
507
+ LOG_ERR("%s: failed to remove repo cache %s: %s\n", __func__, repo_path.string().c_str(), ec.message().c_str());
508
+ return false;
509
+ }
510
+ return removed > 0;
511
+ }
512
+
498
513
  } // namespace hf_cache
@@ -29,4 +29,7 @@ hf_files get_cached_files(const std::string & repo_id = {});
29
29
  // Create snapshot path (link or move/copy) and return it
30
30
  std::string finalize_file(const hf_file & file);
31
31
 
32
+ // Remove the entire cached directory for a repo, returns true if removed
33
+ bool remove_cached_repo(const std::string & repo_id);
34
+
32
35
  } // namespace hf_cache
@@ -11,8 +11,13 @@
11
11
  #include <sstream>
12
12
  #include <thread>
13
13
  #include <vector>
14
+ #include <algorithm>
14
15
 
15
16
  #if defined(_WIN32)
17
+ # define WIN32_LEAN_AND_MEAN
18
+ # ifndef NOMINMAX
19
+ # define NOMINMAX
20
+ # endif
16
21
  # include <io.h>
17
22
  # include <windows.h>
18
23
  # define isatty _isatty
@@ -62,16 +67,15 @@ static const char* g_col[] = {
62
67
  };
63
68
 
64
69
  struct common_log_entry {
65
- enum ggml_log_level level;
66
-
67
- bool prefix;
68
-
69
- int64_t timestamp;
70
+ enum ggml_log_level level {GGML_LOG_LEVEL_INFO};
70
71
 
71
72
  std::vector<char> msg;
72
73
 
73
- // signals the worker thread to stop
74
- bool is_end;
74
+ int64_t timestamp { 0 };
75
+ bool is_end { false }; // signals the worker thread to stop
76
+ bool prefix { false };
77
+
78
+ common_log_entry(size_t size = 256) : msg(size) { }
75
79
 
76
80
  void print(FILE * file = nullptr) const {
77
81
  FILE * fcur = file;
@@ -122,22 +126,15 @@ struct common_log_entry {
122
126
  };
123
127
 
124
128
  struct common_log {
125
- // default capacity - will be expanded if needed
126
- common_log() : common_log(256) {}
127
-
128
- common_log(size_t capacity) {
129
- file = nullptr;
130
- prefix = false;
129
+ // default capacity
130
+ common_log(size_t capacity = 512) {
131
+ file = nullptr;
132
+ prefix = false;
131
133
  timestamps = false;
132
- running = false;
133
- t_start = t_us();
134
-
135
- // initial message size - will be expanded if longer messages arrive
136
- entries.resize(capacity);
137
- for (auto & entry : entries) {
138
- entry.msg.resize(256);
139
- }
134
+ running = false;
135
+ t_start = t_us();
140
136
 
137
+ queue.resize(capacity, common_log_entry(256));
141
138
  head = 0;
142
139
  tail = 0;
143
140
 
@@ -152,9 +149,10 @@ struct common_log {
152
149
  }
153
150
 
154
151
  private:
155
- std::mutex mtx;
156
- std::thread thrd;
157
- std::condition_variable cv;
152
+ std::mutex mtx;
153
+ std::thread thrd;
154
+ std::condition_variable cv_new; // new entry
155
+ std::condition_variable cv_full; // wait on full
158
156
 
159
157
  FILE * file;
160
158
 
@@ -164,24 +162,53 @@ private:
164
162
 
165
163
  int64_t t_start;
166
164
 
167
- // ring buffer of entries
168
- std::vector<common_log_entry> entries;
165
+ // queue of entries
166
+ std::vector<common_log_entry> queue;
169
167
  size_t head;
170
168
  size_t tail;
171
169
 
172
- // worker thread copies into this
173
- common_log_entry cur;
170
+ bool print_entry(const common_log_entry & e) const {
171
+ if (e.is_end) return true;
172
+
173
+ e.print();
174
+ if (file) {
175
+ e.print(file);
176
+ }
177
+ return false;
178
+ }
179
+
180
+ bool flush_queue(size_t start_head, size_t end_tail, size_t & out_head) const {
181
+ bool stop = false;
182
+ size_t h = start_head;
183
+ while (h != end_tail && !stop) {
184
+ stop = print_entry(queue[h]);
185
+ h = (h + 1) % queue.size();
186
+ }
187
+ out_head = h;
188
+ return stop;
189
+ }
174
190
 
175
191
  public:
192
+ bool is_full() const {
193
+ return ((tail + 1) % queue.size()) == head;
194
+ }
195
+
196
+ bool is_empty() const {
197
+ return head == tail;
198
+ }
199
+
176
200
  void add(enum ggml_log_level level, const char * fmt, va_list args) {
177
- std::lock_guard<std::mutex> lock(mtx);
201
+ std::unique_lock<std::mutex> lock(mtx);
202
+
203
+ // block if the queue is full
204
+ cv_full.wait(lock, [this]() { return !running || !is_full(); });
178
205
 
179
206
  if (!running) {
180
207
  // discard messages while the worker thread is paused
181
208
  return;
182
209
  }
183
210
 
184
- auto & entry = entries[tail];
211
+ auto & entry = queue[tail];
185
212
 
186
213
  {
187
214
  // cannot use args twice, so make a copy in case we need to expand the buffer
@@ -216,38 +243,16 @@ public:
216
243
  va_end(args_copy);
217
244
  }
218
245
 
219
- entry.level = level;
220
- entry.prefix = prefix;
246
+ entry.is_end = false;
247
+ entry.level = level;
248
+ entry.prefix = prefix;
221
249
  entry.timestamp = 0;
222
250
  if (timestamps) {
223
251
  entry.timestamp = t_us() - t_start;
224
252
  }
225
- entry.is_end = false;
226
-
227
- tail = (tail + 1) % entries.size();
228
- if (tail == head) {
229
- // expand the buffer
230
- std::vector<common_log_entry> new_entries(2*entries.size());
231
-
232
- size_t new_tail = 0;
233
253
 
234
- do {
235
- new_entries[new_tail] = std::move(entries[head]);
236
-
237
- head = (head + 1) % entries.size();
238
- new_tail = (new_tail + 1);
239
- } while (head != tail);
240
-
241
- head = 0;
242
- tail = new_tail;
243
-
244
- for (size_t i = tail; i < new_entries.size(); i++) {
245
- new_entries[i].msg.resize(256);
246
- }
247
-
248
- entries = std::move(new_entries);
249
- }
250
- cv.notify_one();
254
+ tail = (tail + 1) % queue.size();
255
+ cv_new.notify_one();
251
256
  }
252
257
 
253
258
  void resume() {
@@ -261,22 +266,23 @@ public:
261
266
 
262
267
  thrd = std::thread([this]() {
263
268
  while (true) {
264
- {
265
- std::unique_lock<std::mutex> lock(mtx);
266
- cv.wait(lock, [this]() { return head != tail; });
267
- cur = entries[head];
269
+ std::unique_lock<std::mutex> lock(mtx);
270
+ cv_new.wait(lock, [this]() { return !is_empty(); });
268
271
 
269
- head = (head + 1) % entries.size();
270
- }
272
+ size_t cached_head = head;
273
+ size_t cached_tail = tail;
271
274
 
272
- if (cur.is_end) {
273
- break;
274
- }
275
+ lock.unlock(); // drop the lock during flush
276
+
277
+ size_t next_head;
278
+ bool stop = flush_queue(cached_head, cached_tail, next_head);
275
279
 
276
- cur.print(); // stdout and stderr
280
+ lock.lock();
281
+ head = next_head;
282
+ cv_full.notify_all();
277
283
 
278
- if (file) {
279
- cur.print(file);
284
+ if (stop) {
285
+ break;
280
286
  }
281
287
  }
282
288
  });
@@ -293,13 +299,13 @@ public:
293
299
  running = false;
294
300
 
295
301
  // push an entry to signal the worker thread to stop
296
- {
297
- auto & entry = entries[tail];
298
- entry.is_end = true;
302
+ auto & entry = queue[tail];
303
+ entry.is_end = true;
304
+ tail = (tail + 1) % queue.size();
299
305
 
300
- tail = (tail + 1) % entries.size();
301
- }
302
- cv.notify_one();
306
+ // wakeup everyone
307
+ cv_new.notify_one();
308
+ cv_full.notify_all();
303
309
  }
304
310
 
305
311
  thrd.join();
@@ -438,7 +438,14 @@ if (GGML_CPU_ALL_VARIANTS)
438
438
  ggml_add_cpu_backend_variant(power8_2 POWER8 VSX)
439
439
  ggml_add_cpu_backend_variant(power9 POWER9 VSX)
440
440
  ggml_add_cpu_backend_variant(power10 POWER10 VSX)
441
- ggml_add_cpu_backend_variant(power11 POWER11 VSX)
441
+ # POWER11 backend: only if compiler supports -mcpu=power11
442
+ check_cxx_compiler_flag("-mcpu=power11" GGML_CXX_SUPPORTS_POWER11)
443
+ if (GGML_CXX_SUPPORTS_POWER11)
444
+ message(STATUS "Compiler supports -mcpu=power11, enabling POWER11 backend")
445
+ ggml_add_cpu_backend_variant(power11 POWER11 VSX)
446
+ else()
447
+ message(STATUS "Skipping POWER11 backend: compiler does not support -mcpu=power11")
448
+ endif()
442
449
  else()
443
450
  message(FATAL_ERROR "Unsupported PowerPC target OS: ${CMAKE_SYSTEM_NAME}")
444
451
  endif()
@@ -389,7 +389,7 @@ function(ggml_add_cpu_backend_variant_impl tag_name)
389
389
  string(REGEX MATCHALL "POWER *([0-9]+)" MATCHED_STRING "${POWER10_M_UPPER}")
390
390
  string(REGEX REPLACE "POWER *([0-9]+)" "\\1" EXTRACTED_NUMBER "${MATCHED_STRING}")
391
391
 
392
- if (EXTRACTED_NUMBER GREATER_EQUAL 10)
392
+ if (EXTRACTED_NUMBER EQUAL 10 OR EXTRACTED_NUMBER EQUAL 11)
393
393
  list(APPEND ARCH_FLAGS -mcpu=power10)
394
394
  elseif (EXTRACTED_NUMBER EQUAL 9)
395
395
  list(APPEND ARCH_FLAGS -mcpu=power9)
@@ -66,7 +66,6 @@ struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_base(ggml
66
66
  const char * op_str = "undefined";
67
67
  switch (op) {
68
68
  case GGML_OP_ADD_ID: op_str = "add_id"; break;
69
- case GGML_OP_CONCAT: op_str = "concat"; break;
70
69
  default: GGML_ABORT("fatal error");
71
70
  };
72
71
 
@@ -211,6 +210,21 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_repeat(ggml_meta
211
210
  return res;
212
211
  }
213
212
 
213
+ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_concat(ggml_metal_library_t lib, ggml_type tsrc) {
214
+ char base[256];
215
+ char name[256];
216
+
217
+ snprintf(base, 256, "kernel_concat_%s", ggml_type_name(tsrc));
218
+ snprintf(name, 256, "%s", base);
219
+
220
+ ggml_metal_pipeline_with_params res = ggml_metal_library_get_pipeline(lib, name);
221
+ if (!res.pipeline) {
222
+ res = ggml_metal_library_compile_pipeline(lib, base, name, nullptr);
223
+ }
224
+
225
+ return res;
226
+ }
227
+
214
228
  ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_unary(ggml_metal_library_t lib, const ggml_tensor * op) {
215
229
  char base[256];
216
230
  char name[256];
@@ -1689,7 +1703,9 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_norm(ggml_metal_
1689
1703
  }
1690
1704
 
1691
1705
  ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_rope(ggml_metal_library_t lib, const ggml_tensor * op) {
1692
- assert(op->op == GGML_OP_ROPE);
1706
+ assert(op->op == GGML_OP_ROPE || op->op == GGML_OP_ROPE_BACK);
1707
+
1708
+ const bool is_back = op->op == GGML_OP_ROPE_BACK;
1693
1709
 
1694
1710
  char base[256];
1695
1711
  char name[256];
@@ -1713,13 +1729,14 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_rope(ggml_metal_
1713
1729
  snprintf(base, 256, "kernel_rope_norm_%s", ggml_type_name(op->src[0]->type));
1714
1730
  }
1715
1731
 
1716
- snprintf(name, 256, "%s_imrope=%d", base, is_imrope ? 1 : 0);
1732
+ snprintf(name, 256, "%s_imrope=%d_is_back=%d", base, is_imrope ? 1 : 0, is_back ? 1 : 0);
1717
1733
 
1718
1734
  ggml_metal_pipeline_with_params res = ggml_metal_library_get_pipeline(lib, name);
1719
1735
  if (!res.pipeline) {
1720
1736
  ggml_metal_cv_t cv = ggml_metal_cv_init();
1721
1737
 
1722
1738
  ggml_metal_cv_set_bool(cv, is_imrope, FC_ROPE + 0);
1739
+ ggml_metal_cv_set_bool(cv, is_back, FC_ROPE + 1);
1723
1740
 
1724
1741
  res = ggml_metal_library_compile_pipeline(lib, base, name, cv);
1725
1742
 
@@ -115,6 +115,7 @@ struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_get_rows
115
115
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_set_rows (ggml_metal_library_t lib, enum ggml_type tidx, enum ggml_type tdst);
116
116
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_diag (ggml_metal_library_t lib, const struct ggml_tensor * op);
117
117
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_repeat (ggml_metal_library_t lib, enum ggml_type tsrc);
118
+ struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_concat (ggml_metal_library_t lib, enum ggml_type tsrc);
118
119
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_unary (ggml_metal_library_t lib, const struct ggml_tensor * op);
119
120
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_glu (ggml_metal_library_t lib, const struct ggml_tensor * op);
120
121
  struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_sum (ggml_metal_library_t lib, const struct ggml_tensor * op);
@@ -375,6 +375,7 @@ static int ggml_metal_op_encode_impl(ggml_metal_op_t ctx, int idx) {
375
375
  n_fuse = ggml_metal_op_norm(ctx, idx);
376
376
  } break;
377
377
  case GGML_OP_ROPE:
378
+ case GGML_OP_ROPE_BACK:
378
379
  {
379
380
  n_fuse = ggml_metal_op_rope(ctx, idx);
380
381
  } break;
@@ -556,7 +557,7 @@ int ggml_metal_op_concat(ggml_metal_op_t ctx, int idx) {
556
557
  /*.dim =*/ dim,
557
558
  };
558
559
 
559
- auto pipeline = ggml_metal_library_get_pipeline_base(lib, GGML_OP_CONCAT);
560
+ auto pipeline = ggml_metal_library_get_pipeline_concat(lib, op->type);
560
561
 
561
562
  ggml_metal_encoder_set_pipeline(enc, pipeline);
562
563
  ggml_metal_encoder_set_bytes (enc, &args, sizeof(args), 0);
@@ -4358,6 +4358,7 @@ template [[host_name("kernel_mul_mv_bf16_bf16_short")]] kernel mul_mv_t_t_short_
4358
4358
  #endif
4359
4359
 
4360
4360
  constant bool FC_rope_is_imrope [[function_constant(FC_ROPE + 0)]];
4361
+ constant bool FC_rope_is_back [[function_constant(FC_ROPE + 1)]];
4361
4362
 
4362
4363
  static float rope_yarn_ramp(const float low, const float high, const int i0) {
4363
4364
  const float y = (i0 / 2 - low) / max(0.001f, high - low);
@@ -4381,6 +4382,9 @@ static void rope_yarn(
4381
4382
  }
4382
4383
  *cos_theta = cos(theta) * mscale;
4383
4384
  *sin_theta = sin(theta) * mscale;
4385
+ if (FC_rope_is_back) {
4386
+ *sin_theta *= -1.0f;
4387
+ }
4384
4388
  }
4385
4389
 
4386
4390
  // Apparently solving `n_rot = 2pi * x * base^((2 * max_pos_emb) / n_dims)` for x, we get
@@ -7513,14 +7517,15 @@ template [[host_name("kernel_cpy_q5_0_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<
7513
7517
  template [[host_name("kernel_cpy_q5_1_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<half4x4, block_q5_1, 2, dequantize_q5_1>;
7514
7518
  template [[host_name("kernel_cpy_q8_0_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<half4x4, block_q8_0, 2, dequantize_q8_0>;
7515
7519
 
7520
+ template<typename T>
7516
7521
  kernel void kernel_concat(
7517
- constant ggml_metal_kargs_concat & args,
7518
- device const char * src0,
7519
- device const char * src1,
7520
- device char * dst,
7521
- uint3 tgpig[[threadgroup_position_in_grid]],
7522
- ushort3 tpitg[[thread_position_in_threadgroup]],
7523
- ushort3 ntg[[threads_per_threadgroup]]) {
7522
+ constant ggml_metal_kargs_concat & args,
7523
+ device const char * src0,
7524
+ device const char * src1,
7525
+ device char * dst,
7526
+ uint3 tgpig[[threadgroup_position_in_grid]],
7527
+ ushort3 tpitg[[thread_position_in_threadgroup]],
7528
+ ushort3 ntg[[threads_per_threadgroup]]) {
7524
7529
 
7525
7530
  const int i3 = tgpig.z;
7526
7531
  const int i2 = tgpig.y;
@@ -7533,21 +7538,31 @@ kernel void kernel_concat(
7533
7538
  int o[4] = {0, 0, 0, 0};
7534
7539
  o[args.dim] = args.dim == 0 ? args.ne00 : (args.dim == 1 ? args.ne01 : (args.dim == 2 ? args.ne02 : args.ne03));
7535
7540
 
7536
- device const float * x;
7537
-
7538
7541
  for (int i0 = tpitg.x; i0 < args.ne0; i0 += ntg.x) {
7542
+ device const T * x;
7543
+
7539
7544
  if (i0 < args.ne00 && i1 < args.ne01 && i2 < args.ne02 && i3 < args.ne03) {
7540
- x = (device const float *)(src0 + (i3 )*args.nb03 + (i2 )*args.nb02 + (i1 )*args.nb01 + (i0 )*args.nb00);
7545
+ x = (device const T *)(src0 + (i3 )*args.nb03 + (i2 )*args.nb02 + (i1 )*args.nb01 + (i0 )*args.nb00);
7541
7546
  } else {
7542
- x = (device const float *)(src1 + (i3 - o[3])*args.nb13 + (i2 - o[2])*args.nb12 + (i1 - o[1])*args.nb11 + (i0 - o[0])*args.nb10);
7547
+ x = (device const T *)(src1 + (i3 - o[3])*args.nb13 + (i2 - o[2])*args.nb12 + (i1 - o[1])*args.nb11 + (i0 - o[0])*args.nb10);
7543
7548
  }
7544
7549
 
7545
- device float * y = (device float *)(dst + i3*args.nb3 + i2*args.nb2 + i1*args.nb1 + i0*args.nb0);
7550
+ device T * y = (device T *)(dst + i3*args.nb3 + i2*args.nb2 + i1*args.nb1 + i0*args.nb0);
7546
7551
 
7547
7552
  *y = *x;
7548
7553
  }
7549
7554
  }
7550
7555
 
7556
+ typedef decltype(kernel_concat<float>) kernel_concat_t;
7557
+
7558
+ template [[host_name("kernel_concat_f32")]] kernel kernel_concat_t kernel_concat<float>;
7559
+ template [[host_name("kernel_concat_f16")]] kernel kernel_concat_t kernel_concat<half>;
7560
+ template [[host_name("kernel_concat_bf16")]] kernel kernel_concat_t kernel_concat<bfloat>;
7561
+ template [[host_name("kernel_concat_i8")]] kernel kernel_concat_t kernel_concat<char>;
7562
+ template [[host_name("kernel_concat_i16")]] kernel kernel_concat_t kernel_concat<short>;
7563
+ template [[host_name("kernel_concat_i32")]] kernel kernel_concat_t kernel_concat<int>;
7564
+ template [[host_name("kernel_concat_i64")]] kernel kernel_concat_t kernel_concat<long>;
7565
+
7551
7566
  template<int nr0, typename args_t>
7552
7567
  void kernel_mul_mv_q2_K_f32_impl(
7553
7568
  args_t args,
@@ -564,6 +564,9 @@ struct ggml_backend_opencl_context {
564
564
  cl_kernel kernel_mul_mat_f16_f32_1row;
565
565
  cl_kernel kernel_mul_mat_f16_f32;
566
566
  cl_kernel kernel_mul_mat_f16_f32_l4;
567
+ cl_kernel kernel_mul_mat_f16_f32_l4_dr;
568
+ cl_kernel kernel_mul_mat_f16_f32_l4_dr_ls;
569
+ cl_kernel kernel_mul_mat_f16_f32_l4_dr_lq;
567
570
  cl_kernel kernel_mul_mat_f16_f32_tiled;
568
571
  cl_kernel kernel_adreno_xmem_pack_src_f32;
569
572
  cl_kernel kernel_adreno_xmem_prepack_weight_f16;
@@ -1787,6 +1790,11 @@ static void load_cl_kernels(ggml_backend_opencl_context *backend_ctx) {
1787
1790
  build_program_from_source(backend_ctx->context, backend_ctx->device, kernel_src.c_str(), compile_opts);
1788
1791
 
1789
1792
  CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4 = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4", &err), err));
1793
+ CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr", &err), err));
1794
+ if (backend_ctx->gpu_family == ADRENO) {
1795
+ CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr_ls", &err), err));
1796
+ CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr_lq", &err), err));
1797
+ }
1790
1798
  GGML_LOG_CONT(".");
1791
1799
  }
1792
1800
 
@@ -14570,11 +14578,31 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co
14570
14578
  }
14571
14579
 
14572
14580
  if (src1t == GGML_TYPE_F32) {
14581
+ // heuristic for packing more work for Adreno
14582
+ const bool adreno_use_lane_split =
14583
+ backend_ctx->gpu_family == ADRENO &&
14584
+ ne11 == 1 &&
14585
+ ne01 >= 8 &&
14586
+ ne00 % 4 == 0 &&
14587
+ r3 == 1 && r2 >= 1 && r2 <= 8 &&
14588
+ (ne12 % r2) == 0;
14589
+
14573
14590
  if (ne11 * ne12 < 4) {
14574
14591
  kernel = backend_ctx->kernel_mul_mat_f16_f32_1row;
14592
+ } else if (adreno_use_lane_split && ne00 >= 64 && ne00 <= 128) {
14593
+ kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq;
14594
+ nrows = 1;
14595
+ } else if (adreno_use_lane_split && r2 >= 2 && ne00 > 128 && ne00 <= 256) {
14596
+ kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls;
14597
+ nrows = 1;
14575
14598
  } else if (ne00 >= 128 && ne01 >= 8 && ne00%4 == 0) {
14576
- kernel = backend_ctx->kernel_mul_mat_f16_f32_l4;
14577
- nrows = ne11;
14599
+ if (ne11 == 1) {
14600
+ kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr;
14601
+ nrows = 1; // not used by this kernel
14602
+ } else {
14603
+ kernel = backend_ctx->kernel_mul_mat_f16_f32_l4;
14604
+ nrows = ne11;
14605
+ }
14578
14606
  } else {
14579
14607
  kernel = backend_ctx->kernel_mul_mat_f16_f32;
14580
14608
  nrows = 4;
@@ -15353,12 +15381,30 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co
15353
15381
 
15354
15382
  backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15355
15383
  } else {
15356
- int64_t ny = (ne11 + nrows - 1)/nrows;
15384
+ if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr) {
15385
+ const int NDST_DR = 4;
15386
+ size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, NDST_DR)*nth0, (size_t)nth1, (size_t)ne12*ne13};
15387
+ size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
15357
15388
 
15358
- size_t global_work_size[] = {(size_t)ne01*nth0, (size_t)ny*nth1, (size_t)ne12*ne13};
15359
- size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
15389
+ backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15390
+ } else if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls) {
15391
+ size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, 2)*nth0, (size_t)nth1, (size_t)ne02*ne03};
15392
+ size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
15360
15393
 
15361
- backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15394
+ backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15395
+ } else if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq) {
15396
+ size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, 4)*nth0, (size_t)nth1, (size_t)ne02*ne03};
15397
+ size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
15398
+
15399
+ backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15400
+ } else {
15401
+ int64_t ny = (ne11 + nrows - 1)/nrows;
15402
+
15403
+ size_t global_work_size[] = {(size_t)ne01*nth0, (size_t)ny*nth1, (size_t)ne12*ne13};
15404
+ size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
15405
+
15406
+ backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
15407
+ }
15362
15408
  }
15363
15409
  }
15364
15410