llama-cpp-bin 9672.0.0__tar.gz → 9692.0.0__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/PKG-INFO +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/download.cpp +84 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/download.h +7 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/hf-cache.cpp +15 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/hf-cache.h +3 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/log.cpp +81 -75
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/CMakeLists.txt +8 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.cpp +20 -3
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h +1 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp +2 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.metal +27 -12
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp +52 -6
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/CMakeLists.txt +2 -4
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +1651 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.h +76 -23
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.cpp +57 -3
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.h +29 -8
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino.cpp +303 -59
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.cpp +66 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.h +10 -4
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +114 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.h +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.h +4 -4
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +169 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/add_id.cpp +62 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/argsort.cpp +47 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/clamp.cpp +33 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/concat.cpp +48 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +40 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +34 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/div.cpp +146 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +177 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/gated_delta_net.cpp +282 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/gated_delta_net.hpp +65 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/get_rows.cpp +2 -9
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_geglu.cpp +21 -7
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_swiglu.cpp +10 -7
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/im2col.cpp +120 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/l2_norm.cpp +44 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/mul_mat_id.cpp +108 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/mulmat.cpp +19 -9
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/norm.cpp +58 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/pad.cpp +95 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/permute.cpp +58 -13
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/repeat.cpp +74 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/reshape.cpp +13 -6
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rms_norm.cpp +1 -1
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +245 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/set_rows.cpp +3 -3
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +106 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/ssm_conv.cpp +59 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/sum_rows.cpp +27 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +54 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_silu.cpp +1 -1
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_softplus.cpp +38 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +118 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +64 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.h +17 -5
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.cpp +43 -40
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.h +5 -4
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +802 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +88 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.cpp +383 -94
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.h +11 -8
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/backend.hpp +1 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/common.hpp +14 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-sycl/conv3d.cpp +218 -0
- llama_cpp_bin-9692.0.0/llama.cpp/ggml/src/ggml-sycl/conv3d.hpp +8 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp +15 -7
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp +122 -50
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp +6 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-context.cpp +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-hparams.cpp +4 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-hparams.h +7 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama.cpp +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/eagle3.cpp +4 -4
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-image.cpp +21 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-image.h +6 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd.cpp +6 -25
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-http.cpp +17 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-http.h +1 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-models.cpp +397 -34
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-models.h +62 -27
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-queue.cpp +11 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-queue.h +5 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-task.h +12 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server.cpp +8 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/_version.py +3 -3
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/PKG-INFO +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/SOURCES.txt +18 -1
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +0 -985
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +0 -74
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +0 -112
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +0 -48
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +0 -21
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +0 -90
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +0 -149
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +0 -89
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +0 -23
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_gelu.cpp +0 -25
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +0 -53
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +0 -47
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +0 -257
- llama_cpp_bin-9672.0.0/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +0 -86
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/scripts/generate-pep503-index.py +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-everything.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-cpu.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-cuda.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-macos.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-rocm.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/build-wheels-vulkan.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/check-upstream.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.github/workflows/update-index.yml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.gitignore +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/.gitmodules +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/LICENSE +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/MANIFEST.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/README.md +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/app/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/app/llama.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-apple-clang.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-linux-clang.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/arm64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/build-info.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/common.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/download-models.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/git-vars.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/license.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/llama-config.cmake.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/llama.pc.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/riscv64-spacemit-linux-gnu-gcc.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/cmake/x64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/arg.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/arg.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/build-info.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-generator.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-helpers.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser-helpers.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-auto-parser.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-diff-analyzer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat-peg-parser.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/chat.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/common.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/console.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/debug.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/debug.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/fit.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/fit.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/http.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/imatrix-loader.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/imatrix-loader.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/caps.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/caps.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/lexer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/lexer.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/parser.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/runtime.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/runtime.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/string.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/string.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/value.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/jinja/value.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-partial.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-partial.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/json-schema-to-grammar.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/llguidance.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/log.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-cache.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-cache.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-map.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-map.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-mod.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/ngram-mod.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/peg-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/peg-parser.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/preset.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/preset.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/reasoning-budget.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/regex-partial.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/regex-partial.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/speculative.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/speculative.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/unicode.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/common/unicode.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/debug/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/debug/debug.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/deprecation-warning/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion-cli.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/diffusion/diffusion.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gen-docs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gen-docs/gen-docs.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/gguf-hash/gguf-hash.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/idle/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/idle/idle.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/ai_chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/logging.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/model-conversion/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-chat/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-chat/simple-chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative-simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/speculative-simple/speculative-simple.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/training/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/examples/training/finetune.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/FindNCCL.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/GitVars.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/common.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/cmake/ggml-config.cmake.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-alloc.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-backend.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-blas.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cann.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cpp.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cpu.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-cuda.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-hexagon.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-metal.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-opencl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-openvino.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-opt.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-rpc.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-sycl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-virtgpu.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-vulkan.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-webgpu.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-zdnn.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml-zendnn.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/ggml.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/include/gguf.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-alloc.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-dl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-dl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-meta.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-blas/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/repack.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/loongarch/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/repack.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/wasm/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/repack.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/arch-fallback.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSMTIME.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-gemm.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime1_kernels.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime2_kernels.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_kernels.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_barrier.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_tcm.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/hip.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/musa.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/act-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/argsort-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/binary-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cmake-toolchain.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/concat-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cpy-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cumsum-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/diag-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/fill-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/flash-attn-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/gated-delta-net-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/get-rows-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dump.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-fastdiv.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-flash-attn-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-profile.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ctx.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-arith.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-base.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-copy.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-div.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-dump.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-exp.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-flash-attn.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-floor.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-inverse.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-log.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-pow.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-reduce.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-repl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-scale.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sigmoid.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sin-cos.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sqrt.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-types.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/main.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/matmul-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/pad-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/repeat-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/rope-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/set-rows-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/softmax-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/solve-tri-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/ssm-conv.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/sum-rows-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/unary-ops.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/vtcm-utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-opnode.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hexagon/libdl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-hip/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-context.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-musa/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/scale.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/mark_decompression_convert_constant_folding.h +1 -1
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/rt_info/weightless_caching_attributes.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opt.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-quants.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-quants.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/common.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dequantize.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-common.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-vec.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gemm.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/presets.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/quantize.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/quants.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq112-dv112.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq128-dv128.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq256-dv256.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq40-dv40.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq512-dv512.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq576-dv512.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq64-dv64.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq72-dv72.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq80-dv80.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq96-dv96.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-f16.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/type.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-threading.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-threading.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/apir_cs_ggml-rpc-front.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/apir_cs_ggml-rpc-back.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-convert.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-device.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/api_remoting.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-device.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-remoting.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/include/apir_hw.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-apir.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward.gen.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/cmake/host-toolchain.cmake.in +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-webgpu/pre_wgsl.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/common.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/ggml-zdnn.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zendnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-zendnn/ggml-zendnn.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/gguf.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/include/llama-cpp.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/include/llama.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-all.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-compare-llama-bench.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_legacy_llama.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-convert_lora_to_gguf.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-gguf_editor_gui.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-pydantic.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-server-bench.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-test-tokenizer-random.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements/requirements-tool_bench.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/jinja/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/snapdragon/qdc/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/scripts/ui-assets.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-adapter.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-adapter.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-arch.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-arch.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-batch.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-batch.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-chat.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-context.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-cparams.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-cparams.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-ext.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-grammar.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-grammar.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-graph.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-graph.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-impl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-io.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-io.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-dsa.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-dsa.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-iswa.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache-iswa.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cache.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-kv-cells.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-hybrid.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-recurrent.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory-recurrent.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-memory.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-mmap.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-mmap.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-loader.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-loader.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-saver.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model-saver.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-model.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-quant.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-quant.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-sampler.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-sampler.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-vocab.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/llama-vocab.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/afmoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/apertus.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arcee.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arctic.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/arwkv7.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/baichuan.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bailingmoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bailingmoe2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bitnet.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/bloom.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/chameleon.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/chatglm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/codeshell.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cohere2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/cohere2moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/command-r.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dbrx.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deci.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek2ocr.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/deepseek32.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/delta-net-base.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dots1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/dream.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/ernie4-5-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/ernie4-5.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/eurobert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/exaone4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/falcon-h1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/falcon.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma-embedding.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma3n.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma4-assistant.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gemma4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm-dsa.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm4-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/glm4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gpt2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/gptneox.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite-hybrid.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/granite.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/grok.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/grovemoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-dense.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/hunyuan-vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/internlm2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jais.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jais2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jamba.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jina-bert-v2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/jina-bert-v3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/kimi-linear.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/lfm2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/lfm2moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llada-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llada.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama-embed.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/llama4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/maincoder.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba-base.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mamba2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mellum.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mimo2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minicpm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minicpm3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/minimax-m2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mistral3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mistral4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/models.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/modern-bert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/mpt.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron-h-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron-h.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nemotron.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/neo-bert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nomic-bert-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/nomic-bert.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmo.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmo2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/olmoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/openai-moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/openelm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/orion.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/pangu-embed.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phi2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phi3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/phimoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plamo3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/plm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen35.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen35moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3moe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3next.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/qwen3vlmoe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/refact.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rnd1.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6-base.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv6qwen2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv7-base.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/rwkv7.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/seed-oss.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/smallthinker.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/smollm3.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/stablelm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/starcoder.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/starcoder2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/step35.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/t5.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/t5encoder.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/talkie.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/wavtokenizer-dec.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/models/xverse.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode-data.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode-data.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/src/unicode.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/export-graph-ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/gguf-model-data.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-basic.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-gbnf-generation.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-json-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-json-serialization.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-python-dict-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/test-unicode.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/peg-parser/tests.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-alloc.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-arg-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-backend-sampler.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-barrier.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-auto-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-col2im-1d.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gbnf-validator.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-gguf.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-integration.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-llguidance.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-jinja.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-json-partial.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-llama-archs.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-log.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-mtmd-c-api.c +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-peg-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quant-type-selection.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-quantize-stats.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-recurrent-state-rollback.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-regex-partial.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-save-load-state.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-state-restore-fragmented.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-thread-safety.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tests/testing.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/batched-bench/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/cli.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cli/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/completion.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/completion/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/completions.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/cvector-generator.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/mean.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/negative.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/pca.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/cvector-generator/positive.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/export-lora/export-lora.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/fit-params.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/fit-params/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/gguf-split/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/gguf-split/gguf-split.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/imatrix/imatrix.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/llama-bench.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/llama-bench/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-graph.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-impl.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip-model.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/clip.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/conformer.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/deepseekocr.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/deepseekocr2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/dotsocr.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/exaone4_5.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4a.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4ua.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4uv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/gemma4v.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/glm4v.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/granite-speech.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/granite4-vision.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/hunyuanvl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/internvl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/kimik25.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/kimivl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/llama4.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/llava.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/mimovl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/minicpmv.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/mobilenetv5.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/models.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/nemotron-v2-vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/pixtral.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen3a.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/siglip.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/step3vl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/whisper-enc.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/yasa2.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/models/youtuvl.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-audio.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-audio.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-cli.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-helper.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd-helper.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/mtmd.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/tests/test-1-ground-truth.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/mtmd/tests/tests-requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/debug-template-parser.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/parser/template-analysis.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/perplexity/perplexity.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/quantize/quantize.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/results/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/results/results.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/rpc/rpc-server.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/bench/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/bench/speed-bench/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/main.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-chat.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-chat.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-common.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-common.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-context.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-context.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-cors-proxy.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-task.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-tools.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/server-tools.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/server/tests/requirements.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tokenize/tokenize.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tts/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/tts/tts.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/embed.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/tools/ui/sources.cmake +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/CMakeLists.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/httplib.cpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/cpp-httplib/httplib.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/miniaudio/miniaudio.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/nlohmann/json.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/nlohmann/json_fwd.hpp +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/sheredom/subprocess.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/vendor/stb/stb_image.h +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/pyproject.toml +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/setup.cfg +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/setup.py +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/__init__.py +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/bin/.gitkeep +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/cli.py +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin/core.py +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/dependency_links.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/entry_points.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/requires.txt +0 -0
- {llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/src/llama_cpp_bin.egg-info/top_level.txt +0 -0
|
@@ -997,3 +997,87 @@ std::vector<common_cached_model_info> common_list_cached_models() {
|
|
|
997
997
|
|
|
998
998
|
return result;
|
|
999
999
|
}
|
|
1000
|
+
|
|
1001
|
+
bool common_download_remove(const std::string & hf_repo_with_tag) {
|
|
1002
|
+
namespace fs = std::filesystem;
|
|
1003
|
+
|
|
1004
|
+
auto [repo_id, tag] = common_download_split_repo_tag(hf_repo_with_tag);
|
|
1005
|
+
|
|
1006
|
+
if (tag.empty()) {
|
|
1007
|
+
return hf_cache::remove_cached_repo(repo_id);
|
|
1008
|
+
}
|
|
1009
|
+
|
|
1010
|
+
std::string tag_upper = tag;
|
|
1011
|
+
for (char & c : tag_upper) {
|
|
1012
|
+
c = (char) std::toupper((unsigned char) c);
|
|
1013
|
+
}
|
|
1014
|
+
|
|
1015
|
+
auto files = hf_cache::get_cached_files(repo_id);
|
|
1016
|
+
if (files.empty()) {
|
|
1017
|
+
return false;
|
|
1018
|
+
}
|
|
1019
|
+
|
|
1020
|
+
// collect snapshot entries whose tag matches
|
|
1021
|
+
std::vector<fs::path> to_remove;
|
|
1022
|
+
for (const auto & f : files) {
|
|
1023
|
+
auto split = get_gguf_split_info(f.path);
|
|
1024
|
+
if (split.tag == tag_upper) {
|
|
1025
|
+
to_remove.emplace_back(f.local_path);
|
|
1026
|
+
}
|
|
1027
|
+
}
|
|
1028
|
+
|
|
1029
|
+
if (to_remove.empty()) {
|
|
1030
|
+
return false;
|
|
1031
|
+
}
|
|
1032
|
+
|
|
1033
|
+
// resolve blob paths from symlinks before deleting snapshot entries
|
|
1034
|
+
std::vector<fs::path> blobs_to_check;
|
|
1035
|
+
for (const auto & p : to_remove) {
|
|
1036
|
+
std::error_code ec;
|
|
1037
|
+
if (fs::is_symlink(p, ec)) {
|
|
1038
|
+
auto target = fs::read_symlink(p, ec);
|
|
1039
|
+
if (!ec) {
|
|
1040
|
+
blobs_to_check.push_back((p.parent_path() / target).lexically_normal());
|
|
1041
|
+
}
|
|
1042
|
+
}
|
|
1043
|
+
}
|
|
1044
|
+
|
|
1045
|
+
// remove snapshot entries
|
|
1046
|
+
for (const auto & p : to_remove) {
|
|
1047
|
+
std::error_code ec;
|
|
1048
|
+
fs::remove(p, ec);
|
|
1049
|
+
if (ec) {
|
|
1050
|
+
LOG_WRN("%s: failed to remove %s: %s\n", __func__, p.string().c_str(), ec.message().c_str());
|
|
1051
|
+
}
|
|
1052
|
+
}
|
|
1053
|
+
|
|
1054
|
+
if (blobs_to_check.empty()) {
|
|
1055
|
+
return true;
|
|
1056
|
+
}
|
|
1057
|
+
|
|
1058
|
+
// collect blobs still referenced by remaining snapshot entries
|
|
1059
|
+
std::unordered_set<std::string> still_referenced;
|
|
1060
|
+
for (const auto & f : hf_cache::get_cached_files(repo_id)) {
|
|
1061
|
+
fs::path p(f.local_path);
|
|
1062
|
+
std::error_code ec;
|
|
1063
|
+
if (fs::is_symlink(p, ec)) {
|
|
1064
|
+
auto target = fs::read_symlink(p, ec);
|
|
1065
|
+
if (!ec) {
|
|
1066
|
+
still_referenced.insert((p.parent_path() / target).lexically_normal().string());
|
|
1067
|
+
}
|
|
1068
|
+
}
|
|
1069
|
+
}
|
|
1070
|
+
|
|
1071
|
+
// remove orphaned blobs
|
|
1072
|
+
for (const auto & blob : blobs_to_check) {
|
|
1073
|
+
if (still_referenced.find(blob.string()) == still_referenced.end()) {
|
|
1074
|
+
std::error_code ec;
|
|
1075
|
+
fs::remove(blob, ec);
|
|
1076
|
+
if (ec) {
|
|
1077
|
+
LOG_WRN("%s: failed to remove blob %s: %s\n", __func__, blob.string().c_str(), ec.message().c_str());
|
|
1078
|
+
}
|
|
1079
|
+
}
|
|
1080
|
+
}
|
|
1081
|
+
|
|
1082
|
+
return true;
|
|
1083
|
+
}
|
|
@@ -115,3 +115,10 @@ int common_download_file_single(const std::string & url,
|
|
|
115
115
|
// resolve and download model from Docker registry
|
|
116
116
|
// return local path to downloaded model file
|
|
117
117
|
std::string common_docker_resolve_model(const std::string & docker);
|
|
118
|
+
|
|
119
|
+
// Remove a cached model from disk
|
|
120
|
+
// input format: "user/model" or "user/model:tag"
|
|
121
|
+
// - if tag is omitted, removes the entire repo cache directory
|
|
122
|
+
// - if tag is present, removes only files matching that tag (and orphaned blobs)
|
|
123
|
+
// returns true if anything was removed
|
|
124
|
+
bool common_download_remove(const std::string & hf_repo_with_tag);
|
|
@@ -495,4 +495,19 @@ std::string finalize_file(const hf_file & file) {
|
|
|
495
495
|
return file.final_path;
|
|
496
496
|
}
|
|
497
497
|
|
|
498
|
+
bool remove_cached_repo(const std::string & repo_id) {
|
|
499
|
+
if (!is_valid_repo_id(repo_id)) {
|
|
500
|
+
LOG_WRN("%s: invalid repository: %s\n", __func__, repo_id.c_str());
|
|
501
|
+
return false;
|
|
502
|
+
}
|
|
503
|
+
fs::path repo_path = get_repo_path(repo_id);
|
|
504
|
+
std::error_code ec;
|
|
505
|
+
auto removed = fs::remove_all(repo_path, ec);
|
|
506
|
+
if (ec) {
|
|
507
|
+
LOG_ERR("%s: failed to remove repo cache %s: %s\n", __func__, repo_path.string().c_str(), ec.message().c_str());
|
|
508
|
+
return false;
|
|
509
|
+
}
|
|
510
|
+
return removed > 0;
|
|
511
|
+
}
|
|
512
|
+
|
|
498
513
|
} // namespace hf_cache
|
|
@@ -29,4 +29,7 @@ hf_files get_cached_files(const std::string & repo_id = {});
|
|
|
29
29
|
// Create snapshot path (link or move/copy) and return it
|
|
30
30
|
std::string finalize_file(const hf_file & file);
|
|
31
31
|
|
|
32
|
+
// Remove the entire cached directory for a repo, returns true if removed
|
|
33
|
+
bool remove_cached_repo(const std::string & repo_id);
|
|
34
|
+
|
|
32
35
|
} // namespace hf_cache
|
|
@@ -11,8 +11,13 @@
|
|
|
11
11
|
#include <sstream>
|
|
12
12
|
#include <thread>
|
|
13
13
|
#include <vector>
|
|
14
|
+
#include <algorithm>
|
|
14
15
|
|
|
15
16
|
#if defined(_WIN32)
|
|
17
|
+
# define WIN32_LEAN_AND_MEAN
|
|
18
|
+
# ifndef NOMINMAX
|
|
19
|
+
# define NOMINMAX
|
|
20
|
+
# endif
|
|
16
21
|
# include <io.h>
|
|
17
22
|
# include <windows.h>
|
|
18
23
|
# define isatty _isatty
|
|
@@ -62,16 +67,15 @@ static const char* g_col[] = {
|
|
|
62
67
|
};
|
|
63
68
|
|
|
64
69
|
struct common_log_entry {
|
|
65
|
-
enum ggml_log_level level;
|
|
66
|
-
|
|
67
|
-
bool prefix;
|
|
68
|
-
|
|
69
|
-
int64_t timestamp;
|
|
70
|
+
enum ggml_log_level level {GGML_LOG_LEVEL_INFO};
|
|
70
71
|
|
|
71
72
|
std::vector<char> msg;
|
|
72
73
|
|
|
73
|
-
|
|
74
|
-
bool is_end;
|
|
74
|
+
int64_t timestamp { 0 };
|
|
75
|
+
bool is_end { false }; // signals the worker thread to stop
|
|
76
|
+
bool prefix { false };
|
|
77
|
+
|
|
78
|
+
common_log_entry(size_t size = 256) : msg(size) { }
|
|
75
79
|
|
|
76
80
|
void print(FILE * file = nullptr) const {
|
|
77
81
|
FILE * fcur = file;
|
|
@@ -122,22 +126,15 @@ struct common_log_entry {
|
|
|
122
126
|
};
|
|
123
127
|
|
|
124
128
|
struct common_log {
|
|
125
|
-
// default capacity
|
|
126
|
-
common_log(
|
|
127
|
-
|
|
128
|
-
|
|
129
|
-
file = nullptr;
|
|
130
|
-
prefix = false;
|
|
129
|
+
// default capacity
|
|
130
|
+
common_log(size_t capacity = 512) {
|
|
131
|
+
file = nullptr;
|
|
132
|
+
prefix = false;
|
|
131
133
|
timestamps = false;
|
|
132
|
-
running
|
|
133
|
-
t_start
|
|
134
|
-
|
|
135
|
-
// initial message size - will be expanded if longer messages arrive
|
|
136
|
-
entries.resize(capacity);
|
|
137
|
-
for (auto & entry : entries) {
|
|
138
|
-
entry.msg.resize(256);
|
|
139
|
-
}
|
|
134
|
+
running = false;
|
|
135
|
+
t_start = t_us();
|
|
140
136
|
|
|
137
|
+
queue.resize(capacity, common_log_entry(256));
|
|
141
138
|
head = 0;
|
|
142
139
|
tail = 0;
|
|
143
140
|
|
|
@@ -152,9 +149,10 @@ struct common_log {
|
|
|
152
149
|
}
|
|
153
150
|
|
|
154
151
|
private:
|
|
155
|
-
std::mutex
|
|
156
|
-
std::thread
|
|
157
|
-
std::condition_variable
|
|
152
|
+
std::mutex mtx;
|
|
153
|
+
std::thread thrd;
|
|
154
|
+
std::condition_variable cv_new; // new entry
|
|
155
|
+
std::condition_variable cv_full; // wait on full
|
|
158
156
|
|
|
159
157
|
FILE * file;
|
|
160
158
|
|
|
@@ -164,24 +162,53 @@ private:
|
|
|
164
162
|
|
|
165
163
|
int64_t t_start;
|
|
166
164
|
|
|
167
|
-
//
|
|
168
|
-
std::vector<common_log_entry>
|
|
165
|
+
// queue of entries
|
|
166
|
+
std::vector<common_log_entry> queue;
|
|
169
167
|
size_t head;
|
|
170
168
|
size_t tail;
|
|
171
169
|
|
|
172
|
-
|
|
173
|
-
|
|
170
|
+
bool print_entry(const common_log_entry & e) const {
|
|
171
|
+
if (e.is_end) return true;
|
|
172
|
+
|
|
173
|
+
e.print();
|
|
174
|
+
if (file) {
|
|
175
|
+
e.print(file);
|
|
176
|
+
}
|
|
177
|
+
return false;
|
|
178
|
+
}
|
|
179
|
+
|
|
180
|
+
bool flush_queue(size_t start_head, size_t end_tail, size_t & out_head) const {
|
|
181
|
+
bool stop = false;
|
|
182
|
+
size_t h = start_head;
|
|
183
|
+
while (h != end_tail && !stop) {
|
|
184
|
+
stop = print_entry(queue[h]);
|
|
185
|
+
h = (h + 1) % queue.size();
|
|
186
|
+
}
|
|
187
|
+
out_head = h;
|
|
188
|
+
return stop;
|
|
189
|
+
}
|
|
174
190
|
|
|
175
191
|
public:
|
|
192
|
+
bool is_full() const {
|
|
193
|
+
return ((tail + 1) % queue.size()) == head;
|
|
194
|
+
}
|
|
195
|
+
|
|
196
|
+
bool is_empty() const {
|
|
197
|
+
return head == tail;
|
|
198
|
+
}
|
|
199
|
+
|
|
176
200
|
void add(enum ggml_log_level level, const char * fmt, va_list args) {
|
|
177
|
-
std::
|
|
201
|
+
std::unique_lock<std::mutex> lock(mtx);
|
|
202
|
+
|
|
203
|
+
// block if the queue is full
|
|
204
|
+
cv_full.wait(lock, [this]() { return !running || !is_full(); });
|
|
178
205
|
|
|
179
206
|
if (!running) {
|
|
180
207
|
// discard messages while the worker thread is paused
|
|
181
208
|
return;
|
|
182
209
|
}
|
|
183
210
|
|
|
184
|
-
auto & entry =
|
|
211
|
+
auto & entry = queue[tail];
|
|
185
212
|
|
|
186
213
|
{
|
|
187
214
|
// cannot use args twice, so make a copy in case we need to expand the buffer
|
|
@@ -216,38 +243,16 @@ public:
|
|
|
216
243
|
va_end(args_copy);
|
|
217
244
|
}
|
|
218
245
|
|
|
219
|
-
entry.
|
|
220
|
-
entry.
|
|
246
|
+
entry.is_end = false;
|
|
247
|
+
entry.level = level;
|
|
248
|
+
entry.prefix = prefix;
|
|
221
249
|
entry.timestamp = 0;
|
|
222
250
|
if (timestamps) {
|
|
223
251
|
entry.timestamp = t_us() - t_start;
|
|
224
252
|
}
|
|
225
|
-
entry.is_end = false;
|
|
226
|
-
|
|
227
|
-
tail = (tail + 1) % entries.size();
|
|
228
|
-
if (tail == head) {
|
|
229
|
-
// expand the buffer
|
|
230
|
-
std::vector<common_log_entry> new_entries(2*entries.size());
|
|
231
|
-
|
|
232
|
-
size_t new_tail = 0;
|
|
233
253
|
|
|
234
|
-
|
|
235
|
-
|
|
236
|
-
|
|
237
|
-
head = (head + 1) % entries.size();
|
|
238
|
-
new_tail = (new_tail + 1);
|
|
239
|
-
} while (head != tail);
|
|
240
|
-
|
|
241
|
-
head = 0;
|
|
242
|
-
tail = new_tail;
|
|
243
|
-
|
|
244
|
-
for (size_t i = tail; i < new_entries.size(); i++) {
|
|
245
|
-
new_entries[i].msg.resize(256);
|
|
246
|
-
}
|
|
247
|
-
|
|
248
|
-
entries = std::move(new_entries);
|
|
249
|
-
}
|
|
250
|
-
cv.notify_one();
|
|
254
|
+
tail = (tail + 1) % queue.size();
|
|
255
|
+
cv_new.notify_one();
|
|
251
256
|
}
|
|
252
257
|
|
|
253
258
|
void resume() {
|
|
@@ -261,22 +266,23 @@ public:
|
|
|
261
266
|
|
|
262
267
|
thrd = std::thread([this]() {
|
|
263
268
|
while (true) {
|
|
264
|
-
|
|
265
|
-
|
|
266
|
-
cv.wait(lock, [this]() { return head != tail; });
|
|
267
|
-
cur = entries[head];
|
|
269
|
+
std::unique_lock<std::mutex> lock(mtx);
|
|
270
|
+
cv_new.wait(lock, [this]() { return !is_empty(); });
|
|
268
271
|
|
|
269
|
-
|
|
270
|
-
|
|
272
|
+
size_t cached_head = head;
|
|
273
|
+
size_t cached_tail = tail;
|
|
271
274
|
|
|
272
|
-
|
|
273
|
-
|
|
274
|
-
|
|
275
|
+
lock.unlock(); // drop the lock during flush
|
|
276
|
+
|
|
277
|
+
size_t next_head;
|
|
278
|
+
bool stop = flush_queue(cached_head, cached_tail, next_head);
|
|
275
279
|
|
|
276
|
-
|
|
280
|
+
lock.lock();
|
|
281
|
+
head = next_head;
|
|
282
|
+
cv_full.notify_all();
|
|
277
283
|
|
|
278
|
-
if (
|
|
279
|
-
|
|
284
|
+
if (stop) {
|
|
285
|
+
break;
|
|
280
286
|
}
|
|
281
287
|
}
|
|
282
288
|
});
|
|
@@ -293,13 +299,13 @@ public:
|
|
|
293
299
|
running = false;
|
|
294
300
|
|
|
295
301
|
// push an entry to signal the worker thread to stop
|
|
296
|
-
|
|
297
|
-
|
|
298
|
-
|
|
302
|
+
auto & entry = queue[tail];
|
|
303
|
+
entry.is_end = true;
|
|
304
|
+
tail = (tail + 1) % queue.size();
|
|
299
305
|
|
|
300
|
-
|
|
301
|
-
|
|
302
|
-
|
|
306
|
+
// wakeup everyone
|
|
307
|
+
cv_new.notify_one();
|
|
308
|
+
cv_full.notify_all();
|
|
303
309
|
}
|
|
304
310
|
|
|
305
311
|
thrd.join();
|
|
@@ -438,7 +438,14 @@ if (GGML_CPU_ALL_VARIANTS)
|
|
|
438
438
|
ggml_add_cpu_backend_variant(power8_2 POWER8 VSX)
|
|
439
439
|
ggml_add_cpu_backend_variant(power9 POWER9 VSX)
|
|
440
440
|
ggml_add_cpu_backend_variant(power10 POWER10 VSX)
|
|
441
|
-
|
|
441
|
+
# POWER11 backend: only if compiler supports -mcpu=power11
|
|
442
|
+
check_cxx_compiler_flag("-mcpu=power11" GGML_CXX_SUPPORTS_POWER11)
|
|
443
|
+
if (GGML_CXX_SUPPORTS_POWER11)
|
|
444
|
+
message(STATUS "Compiler supports -mcpu=power11, enabling POWER11 backend")
|
|
445
|
+
ggml_add_cpu_backend_variant(power11 POWER11 VSX)
|
|
446
|
+
else()
|
|
447
|
+
message(STATUS "Skipping POWER11 backend: compiler does not support -mcpu=power11")
|
|
448
|
+
endif()
|
|
442
449
|
else()
|
|
443
450
|
message(FATAL_ERROR "Unsupported PowerPC target OS: ${CMAKE_SYSTEM_NAME}")
|
|
444
451
|
endif()
|
{llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt
RENAMED
|
@@ -389,7 +389,7 @@ function(ggml_add_cpu_backend_variant_impl tag_name)
|
|
|
389
389
|
string(REGEX MATCHALL "POWER *([0-9]+)" MATCHED_STRING "${POWER10_M_UPPER}")
|
|
390
390
|
string(REGEX REPLACE "POWER *([0-9]+)" "\\1" EXTRACTED_NUMBER "${MATCHED_STRING}")
|
|
391
391
|
|
|
392
|
-
if (EXTRACTED_NUMBER
|
|
392
|
+
if (EXTRACTED_NUMBER EQUAL 10 OR EXTRACTED_NUMBER EQUAL 11)
|
|
393
393
|
list(APPEND ARCH_FLAGS -mcpu=power10)
|
|
394
394
|
elseif (EXTRACTED_NUMBER EQUAL 9)
|
|
395
395
|
list(APPEND ARCH_FLAGS -mcpu=power9)
|
|
@@ -66,7 +66,6 @@ struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_base(ggml
|
|
|
66
66
|
const char * op_str = "undefined";
|
|
67
67
|
switch (op) {
|
|
68
68
|
case GGML_OP_ADD_ID: op_str = "add_id"; break;
|
|
69
|
-
case GGML_OP_CONCAT: op_str = "concat"; break;
|
|
70
69
|
default: GGML_ABORT("fatal error");
|
|
71
70
|
};
|
|
72
71
|
|
|
@@ -211,6 +210,21 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_repeat(ggml_meta
|
|
|
211
210
|
return res;
|
|
212
211
|
}
|
|
213
212
|
|
|
213
|
+
ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_concat(ggml_metal_library_t lib, ggml_type tsrc) {
|
|
214
|
+
char base[256];
|
|
215
|
+
char name[256];
|
|
216
|
+
|
|
217
|
+
snprintf(base, 256, "kernel_concat_%s", ggml_type_name(tsrc));
|
|
218
|
+
snprintf(name, 256, "%s", base);
|
|
219
|
+
|
|
220
|
+
ggml_metal_pipeline_with_params res = ggml_metal_library_get_pipeline(lib, name);
|
|
221
|
+
if (!res.pipeline) {
|
|
222
|
+
res = ggml_metal_library_compile_pipeline(lib, base, name, nullptr);
|
|
223
|
+
}
|
|
224
|
+
|
|
225
|
+
return res;
|
|
226
|
+
}
|
|
227
|
+
|
|
214
228
|
ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_unary(ggml_metal_library_t lib, const ggml_tensor * op) {
|
|
215
229
|
char base[256];
|
|
216
230
|
char name[256];
|
|
@@ -1689,7 +1703,9 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_norm(ggml_metal_
|
|
|
1689
1703
|
}
|
|
1690
1704
|
|
|
1691
1705
|
ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_rope(ggml_metal_library_t lib, const ggml_tensor * op) {
|
|
1692
|
-
assert(op->op == GGML_OP_ROPE);
|
|
1706
|
+
assert(op->op == GGML_OP_ROPE || op->op == GGML_OP_ROPE_BACK);
|
|
1707
|
+
|
|
1708
|
+
const bool is_back = op->op == GGML_OP_ROPE_BACK;
|
|
1693
1709
|
|
|
1694
1710
|
char base[256];
|
|
1695
1711
|
char name[256];
|
|
@@ -1713,13 +1729,14 @@ ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_rope(ggml_metal_
|
|
|
1713
1729
|
snprintf(base, 256, "kernel_rope_norm_%s", ggml_type_name(op->src[0]->type));
|
|
1714
1730
|
}
|
|
1715
1731
|
|
|
1716
|
-
snprintf(name, 256, "%s_imrope=%d", base, is_imrope ? 1 : 0);
|
|
1732
|
+
snprintf(name, 256, "%s_imrope=%d_is_back=%d", base, is_imrope ? 1 : 0, is_back ? 1 : 0);
|
|
1717
1733
|
|
|
1718
1734
|
ggml_metal_pipeline_with_params res = ggml_metal_library_get_pipeline(lib, name);
|
|
1719
1735
|
if (!res.pipeline) {
|
|
1720
1736
|
ggml_metal_cv_t cv = ggml_metal_cv_init();
|
|
1721
1737
|
|
|
1722
1738
|
ggml_metal_cv_set_bool(cv, is_imrope, FC_ROPE + 0);
|
|
1739
|
+
ggml_metal_cv_set_bool(cv, is_back, FC_ROPE + 1);
|
|
1723
1740
|
|
|
1724
1741
|
res = ggml_metal_library_compile_pipeline(lib, base, name, cv);
|
|
1725
1742
|
|
{llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h
RENAMED
|
@@ -115,6 +115,7 @@ struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_get_rows
|
|
|
115
115
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_set_rows (ggml_metal_library_t lib, enum ggml_type tidx, enum ggml_type tdst);
|
|
116
116
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_diag (ggml_metal_library_t lib, const struct ggml_tensor * op);
|
|
117
117
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_repeat (ggml_metal_library_t lib, enum ggml_type tsrc);
|
|
118
|
+
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_concat (ggml_metal_library_t lib, enum ggml_type tsrc);
|
|
118
119
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_unary (ggml_metal_library_t lib, const struct ggml_tensor * op);
|
|
119
120
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_glu (ggml_metal_library_t lib, const struct ggml_tensor * op);
|
|
120
121
|
struct ggml_metal_pipeline_with_params ggml_metal_library_get_pipeline_sum (ggml_metal_library_t lib, const struct ggml_tensor * op);
|
{llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp
RENAMED
|
@@ -375,6 +375,7 @@ static int ggml_metal_op_encode_impl(ggml_metal_op_t ctx, int idx) {
|
|
|
375
375
|
n_fuse = ggml_metal_op_norm(ctx, idx);
|
|
376
376
|
} break;
|
|
377
377
|
case GGML_OP_ROPE:
|
|
378
|
+
case GGML_OP_ROPE_BACK:
|
|
378
379
|
{
|
|
379
380
|
n_fuse = ggml_metal_op_rope(ctx, idx);
|
|
380
381
|
} break;
|
|
@@ -556,7 +557,7 @@ int ggml_metal_op_concat(ggml_metal_op_t ctx, int idx) {
|
|
|
556
557
|
/*.dim =*/ dim,
|
|
557
558
|
};
|
|
558
559
|
|
|
559
|
-
auto pipeline =
|
|
560
|
+
auto pipeline = ggml_metal_library_get_pipeline_concat(lib, op->type);
|
|
560
561
|
|
|
561
562
|
ggml_metal_encoder_set_pipeline(enc, pipeline);
|
|
562
563
|
ggml_metal_encoder_set_bytes (enc, &args, sizeof(args), 0);
|
{llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.metal
RENAMED
|
@@ -4358,6 +4358,7 @@ template [[host_name("kernel_mul_mv_bf16_bf16_short")]] kernel mul_mv_t_t_short_
|
|
|
4358
4358
|
#endif
|
|
4359
4359
|
|
|
4360
4360
|
constant bool FC_rope_is_imrope [[function_constant(FC_ROPE + 0)]];
|
|
4361
|
+
constant bool FC_rope_is_back [[function_constant(FC_ROPE + 1)]];
|
|
4361
4362
|
|
|
4362
4363
|
static float rope_yarn_ramp(const float low, const float high, const int i0) {
|
|
4363
4364
|
const float y = (i0 / 2 - low) / max(0.001f, high - low);
|
|
@@ -4381,6 +4382,9 @@ static void rope_yarn(
|
|
|
4381
4382
|
}
|
|
4382
4383
|
*cos_theta = cos(theta) * mscale;
|
|
4383
4384
|
*sin_theta = sin(theta) * mscale;
|
|
4385
|
+
if (FC_rope_is_back) {
|
|
4386
|
+
*sin_theta *= -1.0f;
|
|
4387
|
+
}
|
|
4384
4388
|
}
|
|
4385
4389
|
|
|
4386
4390
|
// Apparently solving `n_rot = 2pi * x * base^((2 * max_pos_emb) / n_dims)` for x, we get
|
|
@@ -7513,14 +7517,15 @@ template [[host_name("kernel_cpy_q5_0_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<
|
|
|
7513
7517
|
template [[host_name("kernel_cpy_q5_1_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<half4x4, block_q5_1, 2, dequantize_q5_1>;
|
|
7514
7518
|
template [[host_name("kernel_cpy_q8_0_f16")]] kernel cpy_q_f_t kernel_cpy_q_f32<half4x4, block_q8_0, 2, dequantize_q8_0>;
|
|
7515
7519
|
|
|
7520
|
+
template<typename T>
|
|
7516
7521
|
kernel void kernel_concat(
|
|
7517
|
-
|
|
7518
|
-
|
|
7519
|
-
|
|
7520
|
-
|
|
7521
|
-
|
|
7522
|
-
|
|
7523
|
-
|
|
7522
|
+
constant ggml_metal_kargs_concat & args,
|
|
7523
|
+
device const char * src0,
|
|
7524
|
+
device const char * src1,
|
|
7525
|
+
device char * dst,
|
|
7526
|
+
uint3 tgpig[[threadgroup_position_in_grid]],
|
|
7527
|
+
ushort3 tpitg[[thread_position_in_threadgroup]],
|
|
7528
|
+
ushort3 ntg[[threads_per_threadgroup]]) {
|
|
7524
7529
|
|
|
7525
7530
|
const int i3 = tgpig.z;
|
|
7526
7531
|
const int i2 = tgpig.y;
|
|
@@ -7533,21 +7538,31 @@ kernel void kernel_concat(
|
|
|
7533
7538
|
int o[4] = {0, 0, 0, 0};
|
|
7534
7539
|
o[args.dim] = args.dim == 0 ? args.ne00 : (args.dim == 1 ? args.ne01 : (args.dim == 2 ? args.ne02 : args.ne03));
|
|
7535
7540
|
|
|
7536
|
-
device const float * x;
|
|
7537
|
-
|
|
7538
7541
|
for (int i0 = tpitg.x; i0 < args.ne0; i0 += ntg.x) {
|
|
7542
|
+
device const T * x;
|
|
7543
|
+
|
|
7539
7544
|
if (i0 < args.ne00 && i1 < args.ne01 && i2 < args.ne02 && i3 < args.ne03) {
|
|
7540
|
-
x = (device const
|
|
7545
|
+
x = (device const T *)(src0 + (i3 )*args.nb03 + (i2 )*args.nb02 + (i1 )*args.nb01 + (i0 )*args.nb00);
|
|
7541
7546
|
} else {
|
|
7542
|
-
x = (device const
|
|
7547
|
+
x = (device const T *)(src1 + (i3 - o[3])*args.nb13 + (i2 - o[2])*args.nb12 + (i1 - o[1])*args.nb11 + (i0 - o[0])*args.nb10);
|
|
7543
7548
|
}
|
|
7544
7549
|
|
|
7545
|
-
device
|
|
7550
|
+
device T * y = (device T *)(dst + i3*args.nb3 + i2*args.nb2 + i1*args.nb1 + i0*args.nb0);
|
|
7546
7551
|
|
|
7547
7552
|
*y = *x;
|
|
7548
7553
|
}
|
|
7549
7554
|
}
|
|
7550
7555
|
|
|
7556
|
+
typedef decltype(kernel_concat<float>) kernel_concat_t;
|
|
7557
|
+
|
|
7558
|
+
template [[host_name("kernel_concat_f32")]] kernel kernel_concat_t kernel_concat<float>;
|
|
7559
|
+
template [[host_name("kernel_concat_f16")]] kernel kernel_concat_t kernel_concat<half>;
|
|
7560
|
+
template [[host_name("kernel_concat_bf16")]] kernel kernel_concat_t kernel_concat<bfloat>;
|
|
7561
|
+
template [[host_name("kernel_concat_i8")]] kernel kernel_concat_t kernel_concat<char>;
|
|
7562
|
+
template [[host_name("kernel_concat_i16")]] kernel kernel_concat_t kernel_concat<short>;
|
|
7563
|
+
template [[host_name("kernel_concat_i32")]] kernel kernel_concat_t kernel_concat<int>;
|
|
7564
|
+
template [[host_name("kernel_concat_i64")]] kernel kernel_concat_t kernel_concat<long>;
|
|
7565
|
+
|
|
7551
7566
|
template<int nr0, typename args_t>
|
|
7552
7567
|
void kernel_mul_mv_q2_K_f32_impl(
|
|
7553
7568
|
args_t args,
|
{llama_cpp_bin-9672.0.0 → llama_cpp_bin-9692.0.0}/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp
RENAMED
|
@@ -564,6 +564,9 @@ struct ggml_backend_opencl_context {
|
|
|
564
564
|
cl_kernel kernel_mul_mat_f16_f32_1row;
|
|
565
565
|
cl_kernel kernel_mul_mat_f16_f32;
|
|
566
566
|
cl_kernel kernel_mul_mat_f16_f32_l4;
|
|
567
|
+
cl_kernel kernel_mul_mat_f16_f32_l4_dr;
|
|
568
|
+
cl_kernel kernel_mul_mat_f16_f32_l4_dr_ls;
|
|
569
|
+
cl_kernel kernel_mul_mat_f16_f32_l4_dr_lq;
|
|
567
570
|
cl_kernel kernel_mul_mat_f16_f32_tiled;
|
|
568
571
|
cl_kernel kernel_adreno_xmem_pack_src_f32;
|
|
569
572
|
cl_kernel kernel_adreno_xmem_prepack_weight_f16;
|
|
@@ -1787,6 +1790,11 @@ static void load_cl_kernels(ggml_backend_opencl_context *backend_ctx) {
|
|
|
1787
1790
|
build_program_from_source(backend_ctx->context, backend_ctx->device, kernel_src.c_str(), compile_opts);
|
|
1788
1791
|
|
|
1789
1792
|
CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4 = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4", &err), err));
|
|
1793
|
+
CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr", &err), err));
|
|
1794
|
+
if (backend_ctx->gpu_family == ADRENO) {
|
|
1795
|
+
CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr_ls", &err), err));
|
|
1796
|
+
CL_CHECK((backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq = clCreateKernel(backend_ctx->program_mul_mv_f16_f32_l4, "kernel_mul_mat_f16_f32_l4_dr_lq", &err), err));
|
|
1797
|
+
}
|
|
1790
1798
|
GGML_LOG_CONT(".");
|
|
1791
1799
|
}
|
|
1792
1800
|
|
|
@@ -14570,11 +14578,31 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co
|
|
|
14570
14578
|
}
|
|
14571
14579
|
|
|
14572
14580
|
if (src1t == GGML_TYPE_F32) {
|
|
14581
|
+
// heuristic for packing more work for Adreno
|
|
14582
|
+
const bool adreno_use_lane_split =
|
|
14583
|
+
backend_ctx->gpu_family == ADRENO &&
|
|
14584
|
+
ne11 == 1 &&
|
|
14585
|
+
ne01 >= 8 &&
|
|
14586
|
+
ne00 % 4 == 0 &&
|
|
14587
|
+
r3 == 1 && r2 >= 1 && r2 <= 8 &&
|
|
14588
|
+
(ne12 % r2) == 0;
|
|
14589
|
+
|
|
14573
14590
|
if (ne11 * ne12 < 4) {
|
|
14574
14591
|
kernel = backend_ctx->kernel_mul_mat_f16_f32_1row;
|
|
14592
|
+
} else if (adreno_use_lane_split && ne00 >= 64 && ne00 <= 128) {
|
|
14593
|
+
kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq;
|
|
14594
|
+
nrows = 1;
|
|
14595
|
+
} else if (adreno_use_lane_split && r2 >= 2 && ne00 > 128 && ne00 <= 256) {
|
|
14596
|
+
kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls;
|
|
14597
|
+
nrows = 1;
|
|
14575
14598
|
} else if (ne00 >= 128 && ne01 >= 8 && ne00%4 == 0) {
|
|
14576
|
-
|
|
14577
|
-
|
|
14599
|
+
if (ne11 == 1) {
|
|
14600
|
+
kernel = backend_ctx->kernel_mul_mat_f16_f32_l4_dr;
|
|
14601
|
+
nrows = 1; // not used by this kernel
|
|
14602
|
+
} else {
|
|
14603
|
+
kernel = backend_ctx->kernel_mul_mat_f16_f32_l4;
|
|
14604
|
+
nrows = ne11;
|
|
14605
|
+
}
|
|
14578
14606
|
} else {
|
|
14579
14607
|
kernel = backend_ctx->kernel_mul_mat_f16_f32;
|
|
14580
14608
|
nrows = 4;
|
|
@@ -15353,12 +15381,30 @@ static void ggml_cl_mul_mat(ggml_backend_t backend, const ggml_tensor * src0, co
|
|
|
15353
15381
|
|
|
15354
15382
|
backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
|
|
15355
15383
|
} else {
|
|
15356
|
-
|
|
15384
|
+
if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr) {
|
|
15385
|
+
const int NDST_DR = 4;
|
|
15386
|
+
size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, NDST_DR)*nth0, (size_t)nth1, (size_t)ne12*ne13};
|
|
15387
|
+
size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
|
|
15357
15388
|
|
|
15358
|
-
|
|
15359
|
-
|
|
15389
|
+
backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
|
|
15390
|
+
} else if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr_ls) {
|
|
15391
|
+
size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, 2)*nth0, (size_t)nth1, (size_t)ne02*ne03};
|
|
15392
|
+
size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
|
|
15360
15393
|
|
|
15361
|
-
|
|
15394
|
+
backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
|
|
15395
|
+
} else if (kernel == backend_ctx->kernel_mul_mat_f16_f32_l4_dr_lq) {
|
|
15396
|
+
size_t global_work_size[] = {(size_t)CEIL_DIV(ne01, 4)*nth0, (size_t)nth1, (size_t)ne02*ne03};
|
|
15397
|
+
size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
|
|
15398
|
+
|
|
15399
|
+
backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
|
|
15400
|
+
} else {
|
|
15401
|
+
int64_t ny = (ne11 + nrows - 1)/nrows;
|
|
15402
|
+
|
|
15403
|
+
size_t global_work_size[] = {(size_t)ne01*nth0, (size_t)ny*nth1, (size_t)ne12*ne13};
|
|
15404
|
+
size_t local_work_size[] = {(size_t)nth0, (size_t)nth1, 1};
|
|
15405
|
+
|
|
15406
|
+
backend_ctx->enqueue_ndrange_kernel(kernel, 3, global_work_size, local_work_size, dst);
|
|
15407
|
+
}
|
|
15362
15408
|
}
|
|
15363
15409
|
}
|
|
15364
15410
|
|