llama-cpp-bin 9616.0.0__tar.gz → 9628.0.0__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/PKG-INFO +1 -1
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/arg.cpp +7 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/common.h +1 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/fit.cpp +29 -6
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/fit.h +10 -4
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/runtime.cpp +2 -2
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/value.cpp +26 -7
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp +107 -56
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp +44 -42
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/scripts/ui-assets.cmake +85 -197
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-arch.cpp +1 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-arch.h +1 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model-saver.cpp +1 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model.cpp +8 -1
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/cohere2.cpp +3 -3
- llama_cpp_bin-9628.0.0/llama.cpp/src/models/cohere2moe.cpp +443 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/models.h +17 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-jinja.cpp +24 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-llama-archs.cpp +2 -1
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/clip-graph.h +4 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/clip.cpp +54 -23
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/clip.h +5 -3
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/gemma4v.cpp +11 -9
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/models.h +1 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-helper.h +8 -5
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd.cpp +289 -59
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd.h +36 -4
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-common.cpp +8 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-common.h +4 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-context.cpp +109 -19
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-http.cpp +58 -201
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/ui/CMakeLists.txt +3 -1
- llama_cpp_bin-9628.0.0/llama.cpp/tools/ui/embed.cpp +307 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin/_version.py +3 -3
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/PKG-INFO +1 -1
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/SOURCES.txt +1 -0
- llama_cpp_bin-9616.0.0/llama.cpp/tools/ui/embed.cpp +0 -163
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/scripts/generate-pep503-index.py +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-everything.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-wheels-cpu.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-wheels-cuda.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-wheels-macos.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-wheels-rocm.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/build-wheels-vulkan.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/check-upstream.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.github/workflows/update-index.yml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.gitignore +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/.gitmodules +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/LICENSE +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/MANIFEST.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/README.md +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/app/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/app/llama.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/arm64-apple-clang.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/arm64-linux-clang.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/arm64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/build-info.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/common.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/download-models.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/git-vars.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/license.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/llama-config.cmake.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/llama.pc.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/riscv64-spacemit-linux-gnu-gcc.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/cmake/x64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/arg.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/build-info.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-auto-parser-generator.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-auto-parser-helpers.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-auto-parser-helpers.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-auto-parser.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-diff-analyzer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat-peg-parser.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/chat.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/common.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/console.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/debug.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/debug.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/download.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/download.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/hf-cache.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/hf-cache.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/http.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/imatrix-loader.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/imatrix-loader.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/caps.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/caps.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/lexer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/lexer.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/parser.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/runtime.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/string.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/string.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/jinja/value.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/json-partial.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/json-partial.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/json-schema-to-grammar.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/llguidance.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/log.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/log.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-cache.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-cache.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-map.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-map.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-mod.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/ngram-mod.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/peg-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/peg-parser.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/preset.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/preset.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/reasoning-budget.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/regex-partial.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/regex-partial.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/speculative.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/speculative.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/unicode.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/common/unicode.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/debug/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/debug/debug.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/deprecation-warning/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/diffusion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/diffusion/diffusion-cli.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/diffusion/diffusion.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/diffusion/diffusion.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gen-docs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gen-docs/gen-docs.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/gguf-hash/gguf-hash.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/idle/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/idle/idle.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/ai_chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/logging.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/model-conversion/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/simple-chat/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/simple-chat/simple-chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/speculative-simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/speculative-simple/speculative-simple.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/training/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/examples/training/finetune.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/cmake/FindNCCL.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/cmake/GitVars.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/cmake/common.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/cmake/ggml-config.cmake.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-alloc.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-backend.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-blas.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-cann.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-cpp.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-cpu.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-cuda.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-hexagon.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-metal.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-opencl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-openvino.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-opt.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-rpc.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-sycl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-virtgpu.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-vulkan.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-webgpu.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-zdnn.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml-zendnn.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/ggml.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/include/gguf.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-alloc.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend-dl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend-dl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend-meta.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-blas/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/common.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-common.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/common.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/repack.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/loongarch/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/repack.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/wasm/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/repack.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/arch-fallback.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSMTIME.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/common.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-gemm.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime1_kernels.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime2_kernels.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_kernels.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_barrier.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_tcm.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/hip.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/musa.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/act-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/argsort-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/binary-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cmake-toolchain.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/concat-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cpy-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cumsum-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/diag-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/fill-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/flash-attn-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/gated-delta-net-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/get-rows-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dump.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-fastdiv.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-flash-attn-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-profile.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ctx.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-arith.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-base.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-copy.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-div.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-dump.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-exp.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-flash-attn.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-floor.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-inverse.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-log.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-pow.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-reduce.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-repl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-scale.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sigmoid.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sin-cos.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sqrt.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-types.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/main.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/matmul-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/pad-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/repeat-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/rope-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/set-rows-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/softmax-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/solve-tri-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/ssm-conv.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/sum-rows-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/unary-ops.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/vtcm-utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-opnode.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hexagon/libdl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-hip/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-context.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.metal +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-musa/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/get_rows.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_geglu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_swiglu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/mulmat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/permute.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/reshape.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rms_norm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/scale.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/set_rows.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_gelu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_silu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/mark_decompression_convert_constant_folding.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/rt_info/weightless_caching_attributes.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-opt.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-quants.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-quants.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/backend.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/common.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/common.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/dequantize.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-common.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-vec.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/gemm.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/presets.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/quantize.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/quants.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/set.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/set.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq112-dv112.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq128-dv128.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq256-dv256.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq40-dv40.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq512-dv512.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq576-dv512.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq64-dv64.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq72-dv72.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq80-dv80.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq96-dv96.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-f16.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/type.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-threading.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-threading.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/apir_cs_ggml-rpc-front.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/apir_cs_ggml-rpc-back.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-convert.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-device.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/api_remoting.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-device.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-remoting.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/include/apir_hw.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-apir.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward.gen.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/cmake/host-toolchain.cmake.in +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-webgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-webgpu/pre_wgsl.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/common.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/ggml-zdnn.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zendnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-zendnn/ggml-zendnn.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/gguf.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/include/llama-cpp.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/include/llama.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-all.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-compare-llama-bench.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-convert_legacy_llama.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-convert_lora_to_gguf.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-gguf_editor_gui.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-pydantic.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-server-bench.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-test-tokenizer-random.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements/requirements-tool_bench.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/scripts/jinja/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/scripts/snapdragon/qdc/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-adapter.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-adapter.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-batch.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-batch.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-chat.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-context.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-context.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-cparams.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-cparams.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-ext.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-grammar.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-grammar.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-graph.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-graph.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-hparams.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-hparams.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-impl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-io.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-io.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache-dsa.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache-dsa.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache-iswa.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache-iswa.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cache.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-kv-cells.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-hybrid.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-hybrid.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-recurrent.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory-recurrent.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-memory.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-mmap.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-mmap.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model-loader.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model-loader.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model-saver.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-model.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-quant.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-quant.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-sampler.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-sampler.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-vocab.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama-vocab.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/llama.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/afmoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/apertus.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/arcee.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/arctic.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/arwkv7.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/baichuan.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/bailingmoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/bailingmoe2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/bert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/bitnet.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/bloom.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/chameleon.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/chatglm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/codeshell.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/command-r.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/dbrx.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/deci.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/deepseek.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/deepseek2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/deepseek2ocr.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/deepseek32.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/delta-net-base.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/dots1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/dream.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/eagle3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/ernie4-5-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/ernie4-5.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/eurobert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/exaone-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/exaone.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/exaone4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/falcon-h1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/falcon.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma-embedding.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma3n.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma4-assistant.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gemma4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/glm-dsa.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/glm4-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/glm4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gpt2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/gptneox.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/granite-hybrid.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/granite-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/granite.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/grok.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/grovemoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/hunyuan-dense.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/hunyuan-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/hunyuan-vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/internlm2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/jais.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/jais2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/jamba.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/jina-bert-v2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/jina-bert-v3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/kimi-linear.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/lfm2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/lfm2moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/llada-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/llada.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/llama-embed.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/llama.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/llama4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/maincoder.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mamba-base.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mamba.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mamba2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mellum.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mimo2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/minicpm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/minicpm3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/minimax-m2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mistral3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mistral4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/modern-bert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/mpt.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/nemotron-h-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/nemotron-h.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/nemotron.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/neo-bert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/nomic-bert-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/nomic-bert.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/olmo.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/olmo2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/olmoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/openai-moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/openelm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/orion.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/pangu-embed.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/phi2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/phi3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/phimoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/plamo.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/plamo2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/plamo3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/plm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen2moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen35.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen35moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen3moe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen3next.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/qwen3vlmoe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/refact.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rnd1.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rwkv6-base.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rwkv6.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rwkv6qwen2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rwkv7-base.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/rwkv7.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/seed-oss.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/smallthinker.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/smollm3.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/stablelm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/starcoder.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/starcoder2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/step35.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/t5.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/t5encoder.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/talkie.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/wavtokenizer-dec.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/models/xverse.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/unicode-data.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/unicode-data.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/unicode.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/src/unicode.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/export-graph-ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/gguf-model-data.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-basic.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-gbnf-generation.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-json-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-json-serialization.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-python-dict-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/test-unicode.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/peg-parser/tests.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-alloc.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-arg-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-backend-sampler.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-barrier.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-chat-auto-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-col2im-1d.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-gbnf-validator.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-gguf.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-grammar-integration.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-grammar-llguidance.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-json-partial.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-log.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-mtmd-c-api.c +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-peg-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-quant-type-selection.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-quantize-stats.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-recurrent-state-rollback.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-regex-partial.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-save-load-state.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-state-restore-fragmented.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-thread-safety.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tests/testing.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/batched-bench/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cli/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cli/cli.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cli/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/completion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/completion/completion.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/completion/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/completions.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/cvector-generator.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/mean.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/negative.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/pca.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/cvector-generator/positive.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/export-lora/export-lora.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/fit-params/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/fit-params/fit-params.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/fit-params/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/gguf-split/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/gguf-split/gguf-split.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/imatrix/imatrix.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/llama-bench/llama-bench.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/llama-bench/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/clip-impl.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/clip-model.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/conformer.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/deepseekocr.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/deepseekocr2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/dotsocr.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/exaone4_5.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/gemma4a.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/gemma4ua.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/gemma4uv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/glm4v.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/granite-speech.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/granite4-vision.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/hunyuanvl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/internvl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/kimik25.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/kimivl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/llama4.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/llava.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/mimovl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/minicpmv.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/mobilenetv5.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/nemotron-v2-vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/pixtral.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/qwen3a.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/siglip.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/step3vl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/whisper-enc.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/yasa2.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/models/youtuvl.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-audio.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-audio.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-cli.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-helper.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-image.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/mtmd-image.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/tests/test-1-ground-truth.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/mtmd/tests/tests-requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/parser/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/parser/debug-template-parser.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/parser/template-analysis.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/perplexity/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/perplexity/perplexity.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/quantize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/quantize/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/quantize/quantize.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/results/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/results/results.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/rpc/rpc-server.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/bench/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/bench/speed-bench/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/main.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-chat.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-chat.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-context.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-cors-proxy.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-http.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-models.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-models.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-queue.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-queue.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-task.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-task.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-tools.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server-tools.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/server.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/server/tests/requirements.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/tokenize/tokenize.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/tts/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/tts/tts.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/tools/ui/sources.cmake +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/cpp-httplib/CMakeLists.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/cpp-httplib/httplib.cpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/cpp-httplib/httplib.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/miniaudio/miniaudio.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/nlohmann/json.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/nlohmann/json_fwd.hpp +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/sheredom/subprocess.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/vendor/stb/stb_image.h +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/pyproject.toml +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/setup.cfg +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/setup.py +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin/__init__.py +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin/bin/.gitkeep +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin/cli.py +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin/core.py +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/dependency_links.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/entry_points.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/requires.txt +0 -0
- {llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/src/llama_cpp_bin.egg-info/top_level.txt +0 -0
|
@@ -2243,6 +2243,13 @@ common_params_context common_params_parser_init(common_params & params, llama_ex
|
|
|
2243
2243
|
params.image_max_tokens = value;
|
|
2244
2244
|
}
|
|
2245
2245
|
).set_examples(mmproj_examples).set_env("LLAMA_ARG_IMAGE_MAX_TOKENS"));
|
|
2246
|
+
add_opt(common_arg(
|
|
2247
|
+
{"--mtmd-batch-max-tokens"}, "N",
|
|
2248
|
+
string_format("maximum number of image tokens per batch when encoding images (default: %d)", params.mtmd_batch_max_tokens),
|
|
2249
|
+
[](common_params & params, int value) {
|
|
2250
|
+
params.mtmd_batch_max_tokens = value;
|
|
2251
|
+
}
|
|
2252
|
+
).set_examples({LLAMA_EXAMPLE_SERVER}).set_env("LLAMA_ARG_MTMD_BATCH_MAX_TOKENS"));
|
|
2246
2253
|
if (llama_supports_rpc()) {
|
|
2247
2254
|
add_opt(common_arg(
|
|
2248
2255
|
{"--rpc"}, "SERVERS",
|
|
@@ -575,6 +575,7 @@ struct common_params {
|
|
|
575
575
|
std::vector<std::string> image; // path to image file(s) ; TODO: change the name to "media"
|
|
576
576
|
int image_min_tokens = -1;
|
|
577
577
|
int image_max_tokens = -1;
|
|
578
|
+
int mtmd_batch_max_tokens = 1024;
|
|
578
579
|
|
|
579
580
|
// finetune
|
|
580
581
|
struct lr_opt lr;
|
|
@@ -26,7 +26,7 @@ class common_params_fit_exception : public std::runtime_error {
|
|
|
26
26
|
using std::runtime_error::runtime_error;
|
|
27
27
|
};
|
|
28
28
|
|
|
29
|
-
std::vector<llama_device_memory_data>
|
|
29
|
+
static std::vector<llama_device_memory_data> common_get_device_memory_data_impl(
|
|
30
30
|
const char * path_model,
|
|
31
31
|
const llama_model_params * mparams,
|
|
32
32
|
const llama_context_params * cparams,
|
|
@@ -150,6 +150,29 @@ std::vector<llama_device_memory_data> common_get_device_memory_data(
|
|
|
150
150
|
return ret;
|
|
151
151
|
}
|
|
152
152
|
|
|
153
|
+
common_device_memory_data_vec common_get_device_memory_data(
|
|
154
|
+
const char * path_model,
|
|
155
|
+
const llama_model_params * mparams,
|
|
156
|
+
const llama_context_params * cparams,
|
|
157
|
+
std::vector<ggml_backend_dev_t> & devs,
|
|
158
|
+
uint32_t & hp_ngl,
|
|
159
|
+
uint32_t & hp_n_ctx_train,
|
|
160
|
+
uint32_t & hp_n_expert,
|
|
161
|
+
ggml_log_level log_level) {
|
|
162
|
+
std::vector<llama_device_memory_data> impl = common_get_device_memory_data_impl(
|
|
163
|
+
path_model, mparams, cparams, devs, hp_ngl, hp_n_ctx_train, hp_n_expert, log_level);
|
|
164
|
+
|
|
165
|
+
common_device_memory_data_vec ret(impl.size());
|
|
166
|
+
for (size_t i = 0; i < impl.size(); i++) {
|
|
167
|
+
ret[i].total = impl[i].total;
|
|
168
|
+
ret[i].free = impl[i].free;
|
|
169
|
+
ret[i].model = impl[i].mb.model;
|
|
170
|
+
ret[i].context = impl[i].mb.context;
|
|
171
|
+
ret[i].compute = impl[i].mb.compute;
|
|
172
|
+
}
|
|
173
|
+
return ret;
|
|
174
|
+
}
|
|
175
|
+
|
|
153
176
|
static void common_params_fit_impl(
|
|
154
177
|
const char * path_model, struct llama_model_params * mparams, struct llama_context_params * cparams,
|
|
155
178
|
float * tensor_split, struct llama_model_tensor_buft_override * tensor_buft_overrides,
|
|
@@ -169,7 +192,7 @@ static void common_params_fit_impl(
|
|
|
169
192
|
// step 1: get data for default parameters and check whether any changes are necessary in the first place
|
|
170
193
|
|
|
171
194
|
LOG_TRC("%s: getting device memory data for initial parameters:\n", __func__);
|
|
172
|
-
const dmds_t dmds_full =
|
|
195
|
+
const dmds_t dmds_full = common_get_device_memory_data_impl(path_model, mparams, cparams, devs, hp_ngl, hp_nct, hp_nex, log_level);
|
|
173
196
|
const size_t nd = devs.size(); // number of devices
|
|
174
197
|
|
|
175
198
|
std::vector<int64_t> margins; // this function uses int64_t rather than size_t for memory sizes to more conveniently handle deficits
|
|
@@ -304,7 +327,7 @@ static void common_params_fit_impl(
|
|
|
304
327
|
|
|
305
328
|
int64_t sum_projected_used_min_ctx = 0;
|
|
306
329
|
cparams->n_ctx = n_ctx_min;
|
|
307
|
-
const dmds_t dmds_min_ctx =
|
|
330
|
+
const dmds_t dmds_min_ctx = common_get_device_memory_data_impl(path_model, mparams, cparams, devs, hp_ngl, hp_nct, hp_nex, log_level);
|
|
308
331
|
if (nd == 0) {
|
|
309
332
|
sum_projected_used_min_ctx = dmds_min_ctx.back().mb.total();
|
|
310
333
|
} else {
|
|
@@ -482,7 +505,7 @@ static void common_params_fit_impl(
|
|
|
482
505
|
llama_model_params mparams_copy = *mparams;
|
|
483
506
|
set_ngl_tensor_split_tbo(ngl_per_device, overflow_bufts, mparams_copy);
|
|
484
507
|
|
|
485
|
-
const dmds_t dmd_nl =
|
|
508
|
+
const dmds_t dmd_nl = common_get_device_memory_data_impl(
|
|
486
509
|
path_model, &mparams_copy, cparams, devs, hp_ngl, hp_nct, hp_nex, log_level);
|
|
487
510
|
|
|
488
511
|
LOG_TRC("%s: memory for test allocation by device:\n", func_name);
|
|
@@ -510,7 +533,7 @@ static void common_params_fit_impl(
|
|
|
510
533
|
mparams->tensor_buft_overrides = tensor_buft_overrides;
|
|
511
534
|
|
|
512
535
|
LOG_TRC("%s: getting device memory data with all MoE tensors moved to system memory:\n", __func__);
|
|
513
|
-
const dmds_t dmds_cpu_moe =
|
|
536
|
+
const dmds_t dmds_cpu_moe = common_get_device_memory_data_impl(
|
|
514
537
|
path_model, mparams, cparams, devs, hp_ngl, hp_nct, hp_nex, log_level);
|
|
515
538
|
|
|
516
539
|
for (size_t id = 0; id < nd; id++) {
|
|
@@ -940,7 +963,7 @@ void common_fit_print(
|
|
|
940
963
|
uint32_t hp_nct = 0; // hparams.n_ctx_train
|
|
941
964
|
uint32_t hp_nex = 0; // hparams.n_expert
|
|
942
965
|
|
|
943
|
-
auto dmd =
|
|
966
|
+
auto dmd = common_get_device_memory_data_impl(path_model, mparams, cparams, devs, hp_ngl, hp_nct, hp_nex, GGML_LOG_LEVEL_ERROR);
|
|
944
967
|
GGML_ASSERT(dmd.size() == devs.size() + 1);
|
|
945
968
|
|
|
946
969
|
for (size_t id = 0; id < devs.size(); id++) {
|
|
@@ -34,12 +34,18 @@ void common_fit_print(
|
|
|
34
34
|
|
|
35
35
|
void common_memory_breakdown_print(const llama_context * ctx);
|
|
36
36
|
|
|
37
|
-
|
|
38
|
-
|
|
39
|
-
|
|
37
|
+
struct common_device_memory_data {
|
|
38
|
+
int64_t total;
|
|
39
|
+
int64_t free;
|
|
40
|
+
size_t model;
|
|
41
|
+
size_t context;
|
|
42
|
+
size_t compute;
|
|
43
|
+
};
|
|
44
|
+
|
|
45
|
+
using common_device_memory_data_vec = std::vector<common_device_memory_data>;
|
|
40
46
|
|
|
41
47
|
// Load a model + context with no_alloc and return the per-device memory breakdown.
|
|
42
|
-
|
|
48
|
+
common_device_memory_data_vec common_get_device_memory_data(
|
|
43
49
|
const char * path_model,
|
|
44
50
|
const llama_model_params * mparams,
|
|
45
51
|
const llama_context_params * cparams,
|
|
@@ -761,9 +761,9 @@ value member_expression::execute_impl(context & ctx) {
|
|
|
761
761
|
|
|
762
762
|
if (is_stmt<slice_expression>(this->property)) {
|
|
763
763
|
auto s = cast_stmt<slice_expression>(this->property);
|
|
764
|
-
value start_val = s->start_expr ? s->start_expr->execute(ctx) : mk_val<value_int>(0);
|
|
765
|
-
value stop_val = s->stop_expr ? s->stop_expr->execute(ctx) : mk_val<value_int>(arr_size);
|
|
766
764
|
value step_val = s->step_expr ? s->step_expr->execute(ctx) : mk_val<value_int>(1);
|
|
765
|
+
value start_val = s->start_expr ? s->start_expr->execute(ctx) : (step_val->as_int() < 0 ? mk_val<value_int>(arr_size - 1) : mk_val<value_int>(0));
|
|
766
|
+
value stop_val = s->stop_expr ? s->stop_expr->execute(ctx) : (step_val->as_int() < 0 ? mk_val<value_int>(-1) : mk_val<value_int>(arr_size));
|
|
767
767
|
|
|
768
768
|
// translate to function call: obj.slice(start, stop, step)
|
|
769
769
|
JJ_DEBUG("Member expression is a slice: start %s, stop %s, step %s",
|
|
@@ -90,14 +90,14 @@ static T slice(const T & array, int64_t start, int64_t stop, int64_t step = 1) {
|
|
|
90
90
|
stop_val = std::min(stop_val, len);
|
|
91
91
|
}
|
|
92
92
|
} else {
|
|
93
|
-
start_val =
|
|
93
|
+
start_val = start;
|
|
94
94
|
if (start_val < 0) {
|
|
95
|
-
start_val = std::max(len + start_val, (int64_t)
|
|
95
|
+
start_val = std::max(len + start_val, (int64_t)0);
|
|
96
96
|
} else {
|
|
97
97
|
start_val = std::min(start_val, len - 1);
|
|
98
98
|
}
|
|
99
99
|
|
|
100
|
-
stop_val =
|
|
100
|
+
stop_val = stop;
|
|
101
101
|
if (stop_val < -1) {
|
|
102
102
|
stop_val = std::max(len + stop_val, (int64_t)-1);
|
|
103
103
|
} else {
|
|
@@ -673,6 +673,9 @@ const func_builtins & value_string_t::get_builtins() const {
|
|
|
673
673
|
std::string str = val_input->as_string().str();
|
|
674
674
|
// FIXME: Support non-specified delimiter (split on consecutive (no leading or trailing) whitespace)
|
|
675
675
|
std::string delim = (args.count() > 1) ? args.get_pos(1)->as_string().str() : " ";
|
|
676
|
+
if (delim.empty()) {
|
|
677
|
+
throw raised_exception("empty separator");
|
|
678
|
+
}
|
|
676
679
|
int64_t maxsplit = (args.count() > 2) ? args.get_pos(2)->as_int() : -1;
|
|
677
680
|
auto result = mk_val<value_array>();
|
|
678
681
|
size_t pos = 0;
|
|
@@ -697,6 +700,9 @@ const func_builtins & value_string_t::get_builtins() const {
|
|
|
697
700
|
std::string str = val_input->as_string().str();
|
|
698
701
|
// FIXME: Support non-specified delimiter (split on consecutive (no leading or trailing) whitespace)
|
|
699
702
|
std::string delim = (args.count() > 1) ? args.get_pos(1)->as_string().str() : " ";
|
|
703
|
+
if (delim.empty()) {
|
|
704
|
+
throw raised_exception("empty separator");
|
|
705
|
+
}
|
|
700
706
|
int64_t maxsplit = (args.count() > 2) ? args.get_pos(2)->as_int() : -1;
|
|
701
707
|
auto result = mk_val<value_array>();
|
|
702
708
|
size_t pos = 0;
|
|
@@ -722,10 +728,23 @@ const func_builtins & value_string_t::get_builtins() const {
|
|
|
722
728
|
if (count > 0) {
|
|
723
729
|
throw not_implemented_exception("String replace with count argument not implemented");
|
|
724
730
|
}
|
|
725
|
-
|
|
726
|
-
|
|
727
|
-
|
|
728
|
-
|
|
731
|
+
if (old_str != new_str) {
|
|
732
|
+
size_t pos = 0;
|
|
733
|
+
if (old_str.empty()) {
|
|
734
|
+
std::string new_res;
|
|
735
|
+
new_res.reserve(str.length() + new_str.length() * (str.length() + 1));
|
|
736
|
+
new_res += new_str;
|
|
737
|
+
for (const char c : str) {
|
|
738
|
+
new_res.push_back(c);
|
|
739
|
+
new_res += new_str;
|
|
740
|
+
}
|
|
741
|
+
str = new_res;
|
|
742
|
+
} else {
|
|
743
|
+
while ((pos = str.find(old_str, pos)) != std::string::npos) {
|
|
744
|
+
str.replace(pos, old_str.length(), new_str);
|
|
745
|
+
pos += new_str.length();
|
|
746
|
+
}
|
|
747
|
+
}
|
|
729
748
|
}
|
|
730
749
|
auto res = mk_val<value_string>(str);
|
|
731
750
|
res->val_str.mark_input_based_on(args.get_pos(0)->val_str);
|
{llama_cpp_bin-9616.0.0 → llama_cpp_bin-9628.0.0}/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp
RENAMED
|
@@ -833,6 +833,7 @@ struct vk_device_struct {
|
|
|
833
833
|
|
|
834
834
|
// [src/dst 0=fp32,1=fp16]
|
|
835
835
|
vk_pipeline pipeline_exp[2];
|
|
836
|
+
vk_pipeline pipeline_expm1[2];
|
|
836
837
|
vk_pipeline pipeline_elu[2];
|
|
837
838
|
vk_pipeline pipeline_gelu[2];
|
|
838
839
|
vk_pipeline pipeline_gelu_erf[2];
|
|
@@ -1202,30 +1203,35 @@ struct vk_op_glu_push_constants {
|
|
|
1202
1203
|
uint32_t mode; // 0: default, 1: swapped, 2: split
|
|
1203
1204
|
float alpha; // for swiglu_oai
|
|
1204
1205
|
float limit;
|
|
1206
|
+
uint32_t nb00;
|
|
1205
1207
|
uint32_t nb01;
|
|
1206
1208
|
uint32_t nb02;
|
|
1207
1209
|
uint32_t nb03;
|
|
1208
|
-
uint32_t
|
|
1209
|
-
uint32_t ne02;
|
|
1210
|
+
uint32_t nb10;
|
|
1210
1211
|
uint32_t nb11;
|
|
1211
1212
|
uint32_t nb12;
|
|
1212
1213
|
uint32_t nb13;
|
|
1213
|
-
uint32_t
|
|
1214
|
-
uint32_t
|
|
1214
|
+
uint32_t nb20;
|
|
1215
|
+
uint32_t nb21;
|
|
1216
|
+
uint32_t nb22;
|
|
1217
|
+
uint32_t nb23;
|
|
1218
|
+
uint32_t ne21;
|
|
1219
|
+
uint32_t ne22;
|
|
1220
|
+
uint32_t misalign_offsets;
|
|
1221
|
+
uint32_t ne2_012mp; uint32_t ne2_012L;
|
|
1222
|
+
uint32_t ne2_01mp; uint32_t ne2_01L;
|
|
1223
|
+
uint32_t ne2_0mp; uint32_t ne2_0L;
|
|
1215
1224
|
};
|
|
1225
|
+
static_assert(sizeof(vk_op_glu_push_constants) <= 128, "sizeof(vk_op_glu_push_constants) must be <= 128");
|
|
1216
1226
|
|
|
1217
1227
|
struct vk_op_unary_push_constants {
|
|
1218
1228
|
uint32_t ne;
|
|
1219
1229
|
uint32_t ne00; uint32_t ne01; uint32_t ne02; uint32_t ne03; uint32_t nb00; uint32_t nb01; uint32_t nb02; uint32_t nb03;
|
|
1220
1230
|
uint32_t ne10; uint32_t ne11; uint32_t ne12; uint32_t ne13; uint32_t nb10; uint32_t nb11; uint32_t nb12; uint32_t nb13;
|
|
1221
1231
|
uint32_t misalign_offsets;
|
|
1222
|
-
float param1; float param2;
|
|
1223
|
-
uint32_t ne0_012mp; uint32_t
|
|
1224
|
-
uint32_t
|
|
1225
|
-
uint32_t ne0_0mp; uint32_t ne0_0L;
|
|
1226
|
-
uint32_t ne1_012mp; uint32_t ne1_012L;
|
|
1227
|
-
uint32_t ne1_01mp; uint32_t ne1_01L;
|
|
1228
|
-
uint32_t ne1_0mp; uint32_t ne1_0L;
|
|
1232
|
+
float param1; float param2; float param3; float param4;
|
|
1233
|
+
uint32_t ne0_012mp; uint32_t ne0_01mp; uint32_t ne0_0mp; uint32_t ne0_Ls;
|
|
1234
|
+
uint32_t ne1_012mp; uint32_t ne1_01mp; uint32_t ne1_0mp; uint32_t ne1_Ls;
|
|
1229
1235
|
};
|
|
1230
1236
|
static_assert(sizeof(vk_op_unary_push_constants) <= 128, "sizeof(vk_op_unary_push_constants) must be <= 128");
|
|
1231
1237
|
|
|
@@ -1330,6 +1336,10 @@ static void init_fastdiv_values(uint32_t d, uint32_t &mp, uint32_t &L)
|
|
|
1330
1336
|
mp = (uint32_t)((uint64_t{1} << 32) * ((uint64_t{1} << L) - d) / d + 1);
|
|
1331
1337
|
}
|
|
1332
1338
|
|
|
1339
|
+
static uint32_t pack_fastdiv_L(uint32_t L0, uint32_t L1, uint32_t L2) {
|
|
1340
|
+
return L0 | (L1 << 8) | (L2 << 16);
|
|
1341
|
+
}
|
|
1342
|
+
|
|
1333
1343
|
template <typename T> void init_pushconst_fastdiv(T &p) {
|
|
1334
1344
|
GGML_UNUSED(p);
|
|
1335
1345
|
static_assert(!std::is_const<T>::value, "unexpected type");
|
|
@@ -1337,12 +1347,29 @@ template <typename T> void init_pushconst_fastdiv(T &p) {
|
|
|
1337
1347
|
|
|
1338
1348
|
template <> void init_pushconst_fastdiv(vk_op_unary_push_constants &p) {
|
|
1339
1349
|
// Compute magic values to divide by these six numbers.
|
|
1340
|
-
|
|
1341
|
-
|
|
1342
|
-
|
|
1343
|
-
|
|
1344
|
-
|
|
1345
|
-
|
|
1350
|
+
uint32_t ne0_012L;
|
|
1351
|
+
uint32_t ne0_01L;
|
|
1352
|
+
uint32_t ne0_0L;
|
|
1353
|
+
uint32_t ne1_012L;
|
|
1354
|
+
uint32_t ne1_01L;
|
|
1355
|
+
uint32_t ne1_0L;
|
|
1356
|
+
|
|
1357
|
+
init_fastdiv_values(p.ne02*p.ne01*p.ne00, p.ne0_012mp, ne0_012L);
|
|
1358
|
+
init_fastdiv_values(p.ne01*p.ne00, p.ne0_01mp, ne0_01L);
|
|
1359
|
+
init_fastdiv_values(p.ne00, p.ne0_0mp, ne0_0L);
|
|
1360
|
+
init_fastdiv_values(p.ne12*p.ne11*p.ne10, p.ne1_012mp, ne1_012L);
|
|
1361
|
+
init_fastdiv_values(p.ne11*p.ne10, p.ne1_01mp, ne1_01L);
|
|
1362
|
+
init_fastdiv_values(p.ne10, p.ne1_0mp, ne1_0L);
|
|
1363
|
+
|
|
1364
|
+
p.ne0_Ls = pack_fastdiv_L(ne0_012L, ne0_01L, ne0_0L);
|
|
1365
|
+
p.ne1_Ls = pack_fastdiv_L(ne1_012L, ne1_01L, ne1_0L);
|
|
1366
|
+
}
|
|
1367
|
+
|
|
1368
|
+
template <> void init_pushconst_fastdiv(vk_op_glu_push_constants &p) {
|
|
1369
|
+
// GLU linearizes over dst, then uses dst coordinates for src0/src1.
|
|
1370
|
+
init_fastdiv_values(p.ne22*p.ne21*p.ne20, p.ne2_012mp, p.ne2_012L);
|
|
1371
|
+
init_fastdiv_values(p.ne21*p.ne20, p.ne2_01mp, p.ne2_01L);
|
|
1372
|
+
init_fastdiv_values(p.ne20, p.ne2_0mp, p.ne2_0L);
|
|
1346
1373
|
}
|
|
1347
1374
|
|
|
1348
1375
|
struct vk_op_binary_push_constants {
|
|
@@ -5006,8 +5033,8 @@ static void ggml_vk_load_shaders(vk_device& device, vk_pipeline requested) {
|
|
|
5006
5033
|
ggml_vk_create_pipeline(device, device->pipeline_repeat_i16, "repeat_i16", repeat_i16_len, repeat_i16_data, "main", 2, sizeof(vk_op_unary_push_constants), {512, 1, 1}, {}, 1);
|
|
5007
5034
|
|
|
5008
5035
|
#define CREATE_UNARY(name) \
|
|
5009
|
-
ggml_vk_create_pipeline(device, device->pipeline_ ## name [0], #name "_f32", name ## _f32_len, name ## _f32_data, "main", 2, sizeof(
|
|
5010
|
-
ggml_vk_create_pipeline(device, device->pipeline_ ## name [1], #name "_f16", name ## _f16_len, name ## _f16_data, "main", 2, sizeof(
|
|
5036
|
+
ggml_vk_create_pipeline(device, device->pipeline_ ## name [0], #name "_f32", name ## _f32_len, name ## _f32_data, "main", 2, sizeof(vk_op_unary_push_constants), {512, 1, 1}, {}, 1); \
|
|
5037
|
+
ggml_vk_create_pipeline(device, device->pipeline_ ## name [1], #name "_f16", name ## _f16_len, name ## _f16_data, "main", 2, sizeof(vk_op_unary_push_constants), {512, 1, 1}, {}, 1);
|
|
5011
5038
|
|
|
5012
5039
|
CREATE_UNARY(elu)
|
|
5013
5040
|
CREATE_UNARY(gelu)
|
|
@@ -5030,6 +5057,7 @@ static void ggml_vk_load_shaders(vk_device& device, vk_pipeline requested) {
|
|
|
5030
5057
|
CREATE_UNARY(trunc)
|
|
5031
5058
|
CREATE_UNARY(sgn)
|
|
5032
5059
|
CREATE_UNARY(exp)
|
|
5060
|
+
CREATE_UNARY(expm1)
|
|
5033
5061
|
#undef CREATE_UNARY
|
|
5034
5062
|
|
|
5035
5063
|
ggml_vk_create_pipeline(device, device->pipeline_add1_f16_f16, "add1_f16_f16", add1_f16_f16_len, add1_f16_f16_data, "main", 3, sizeof(vk_op_binary_push_constants), {512, 1, 1}, {}, 1);
|
|
@@ -8192,7 +8220,6 @@ static vk_pipeline ggml_vk_get_cpy_pipeline(ggml_backend_vk_context * ctx, const
|
|
|
8192
8220
|
static void ggml_vk_cpy_to_contiguous(ggml_backend_vk_context * ctx, vk_context& subctx, vk_pipeline pipeline, const ggml_tensor * tensor, const vk_subbuffer & in, const vk_subbuffer & out) {
|
|
8193
8221
|
VK_LOG_DEBUG("ggml_vk_cpy_to_contiguous((" << tensor << ", type=" << tensor->type << ", ne0=" << tensor->ne[0] << ", ne1=" << tensor->ne[1] << ", ne2=" << tensor->ne[2] << ", ne3=" << tensor->ne[3] << ", nb0=" << tensor->nb[0] << ", nb1=" << tensor->nb[1] << ", nb2=" << tensor->nb[2] << ", nb3=" << tensor->nb[3] << "), ";
|
|
8194
8222
|
std::cerr << "buffer in size=" << in.buffer->size << ", buffer out size=" << out.buffer->size << ")");
|
|
8195
|
-
const int tensor_type_size = ggml_type_size(tensor->type);
|
|
8196
8223
|
|
|
8197
8224
|
const uint32_t ne = ggml_nelements(tensor);
|
|
8198
8225
|
std::array<uint32_t, 3> elements;
|
|
@@ -8205,14 +8232,11 @@ static void ggml_vk_cpy_to_contiguous(ggml_backend_vk_context * ctx, vk_context&
|
|
|
8205
8232
|
elements = { ne, 1, 1 };
|
|
8206
8233
|
}
|
|
8207
8234
|
|
|
8208
|
-
vk_op_unary_push_constants pc =
|
|
8209
|
-
|
|
8210
|
-
|
|
8211
|
-
|
|
8212
|
-
|
|
8213
|
-
0.0f, 0.0f,
|
|
8214
|
-
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
|
|
8215
|
-
};
|
|
8235
|
+
vk_op_unary_push_constants pc = vk_op_unary_push_constants_init(tensor, tensor, ne);
|
|
8236
|
+
pc.nb10 = 1;
|
|
8237
|
+
pc.nb11 = (uint32_t)tensor->ne[0];
|
|
8238
|
+
pc.nb12 = (uint32_t)(tensor->ne[0] * tensor->ne[1]);
|
|
8239
|
+
pc.nb13 = (uint32_t)(tensor->ne[0] * tensor->ne[1] * tensor->ne[2]);
|
|
8216
8240
|
init_pushconst_fastdiv(pc);
|
|
8217
8241
|
ggml_vk_dispatch_pipeline(ctx, subctx, pipeline, { in, out }, pc, elements);
|
|
8218
8242
|
ggml_vk_sync_buffers(ctx, subctx);
|
|
@@ -8226,7 +8250,6 @@ static void ggml_vk_cpy_to_strided(
|
|
|
8226
8250
|
uint32_t nb10, uint32_t nb11, uint32_t nb12, uint32_t nb13) {
|
|
8227
8251
|
VK_LOG_DEBUG("ggml_vk_cpy_to_strided((" << tensor << ", type=" << tensor->type << ", ne0=" << tensor->ne[0] << ", ne1=" << tensor->ne[1] << ", ne2=" << tensor->ne[2] << ", ne3=" << tensor->ne[3] << ", nb0=" << tensor->nb[0] << ", nb1=" << tensor->nb[1] << ", nb2=" << tensor->nb[2] << ", nb3=" << tensor->nb[3] << "), ";
|
|
8228
8252
|
std::cerr << "dst_nb=(" << nb10 << ", " << nb11 << ", " << nb12 << ", " << nb13 << "), buffer in size=" << in.buffer->size << ", buffer out size=" << out.buffer->size << ")");
|
|
8229
|
-
const int tensor_type_size = ggml_type_size(tensor->type);
|
|
8230
8253
|
|
|
8231
8254
|
const uint32_t ne = ggml_nelements(tensor);
|
|
8232
8255
|
std::array<uint32_t, 3> elements;
|
|
@@ -8239,14 +8262,11 @@ static void ggml_vk_cpy_to_strided(
|
|
|
8239
8262
|
elements = { ne, 1, 1 };
|
|
8240
8263
|
}
|
|
8241
8264
|
|
|
8242
|
-
vk_op_unary_push_constants pc =
|
|
8243
|
-
|
|
8244
|
-
|
|
8245
|
-
|
|
8246
|
-
|
|
8247
|
-
0.0f, 0.0f,
|
|
8248
|
-
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
|
|
8249
|
-
};
|
|
8265
|
+
vk_op_unary_push_constants pc = vk_op_unary_push_constants_init(tensor, tensor, ne);
|
|
8266
|
+
pc.nb10 = nb10;
|
|
8267
|
+
pc.nb11 = nb11;
|
|
8268
|
+
pc.nb12 = nb12;
|
|
8269
|
+
pc.nb13 = nb13;
|
|
8250
8270
|
init_pushconst_fastdiv(pc);
|
|
8251
8271
|
ggml_vk_dispatch_pipeline(ctx, subctx, pipeline, { in, out }, pc, elements);
|
|
8252
8272
|
ggml_vk_sync_buffers(ctx, subctx);
|
|
@@ -10451,6 +10471,8 @@ static vk_pipeline ggml_vk_op_get_pipeline(ggml_backend_vk_context * ctx, const
|
|
|
10451
10471
|
switch (ggml_get_unary_op(dst)) {
|
|
10452
10472
|
case GGML_UNARY_OP_EXP:
|
|
10453
10473
|
return ctx->device->pipeline_exp[dst->type == GGML_TYPE_F16];
|
|
10474
|
+
case GGML_UNARY_OP_EXPM1:
|
|
10475
|
+
return ctx->device->pipeline_expm1[dst->type == GGML_TYPE_F16];
|
|
10454
10476
|
case GGML_UNARY_OP_ELU:
|
|
10455
10477
|
return ctx->device->pipeline_elu[dst->type == GGML_TYPE_F16];
|
|
10456
10478
|
case GGML_UNARY_OP_SILU:
|
|
@@ -10849,6 +10871,21 @@ template <> void init_pushconst_tensor_offsets(ggml_backend_vk_context * ctx, vk
|
|
|
10849
10871
|
GGML_UNUSED(src3);
|
|
10850
10872
|
}
|
|
10851
10873
|
|
|
10874
|
+
template <> void init_pushconst_tensor_offsets(ggml_backend_vk_context * ctx, vk_op_glu_push_constants &p, const ggml_tensor * src0, const ggml_tensor * src1, const ggml_tensor * src2, const ggml_tensor * src3, ggml_tensor * dst) {
|
|
10875
|
+
const uint32_t a_offset = get_misalign_bytes(ctx, src0) / ggml_type_size(src0->type);
|
|
10876
|
+
const uint32_t b_offset = src1 ? get_misalign_bytes(ctx, src1) / ggml_type_size(src1->type) : a_offset;
|
|
10877
|
+
const uint32_t d_offset = get_misalign_bytes(ctx, dst) / ggml_type_size(dst->type);
|
|
10878
|
+
|
|
10879
|
+
GGML_ASSERT(a_offset < (1u << 8));
|
|
10880
|
+
GGML_ASSERT(b_offset < (1u << 8));
|
|
10881
|
+
GGML_ASSERT(d_offset < (1u << 8));
|
|
10882
|
+
|
|
10883
|
+
p.misalign_offsets = (a_offset << 16) | (b_offset << 8) | d_offset;
|
|
10884
|
+
|
|
10885
|
+
GGML_UNUSED(src2);
|
|
10886
|
+
GGML_UNUSED(src3);
|
|
10887
|
+
}
|
|
10888
|
+
|
|
10852
10889
|
template <> void init_pushconst_tensor_offsets(ggml_backend_vk_context * ctx, vk_op_sum_rows_push_constants &p, const ggml_tensor * src0, const ggml_tensor * src1, const ggml_tensor * src2, const ggml_tensor * src3, ggml_tensor * dst) {
|
|
10853
10890
|
const uint32_t a_offset = get_misalign_bytes(ctx, src0) / ggml_type_size(src0->type);
|
|
10854
10891
|
const uint32_t d_offset = get_misalign_bytes(ctx, dst) / ggml_type_size(dst->type);
|
|
@@ -12198,17 +12235,17 @@ static void ggml_vk_l2_norm(ggml_backend_vk_context * ctx, vk_context& subctx, c
|
|
|
12198
12235
|
}
|
|
12199
12236
|
|
|
12200
12237
|
static void ggml_vk_unary(ggml_backend_vk_context * ctx, vk_context& subctx, const ggml_tensor * src0, ggml_tensor * dst) {
|
|
12201
|
-
ggml_vk_op_f32
|
|
12238
|
+
ggml_vk_op_f32(ctx, subctx, src0, nullptr, nullptr, nullptr, dst, GGML_OP_UNARY, vk_op_unary_push_constants_init(src0, dst));
|
|
12202
12239
|
}
|
|
12203
12240
|
|
|
12204
12241
|
static void ggml_vk_xielu(ggml_backend_vk_context * ctx, vk_context& subctx, const ggml_tensor * src0, ggml_tensor * dst) {
|
|
12205
12242
|
float * op_params = (float *)dst->op_params;
|
|
12206
|
-
|
|
12207
|
-
|
|
12208
|
-
|
|
12209
|
-
|
|
12210
|
-
|
|
12211
|
-
);
|
|
12243
|
+
vk_op_unary_push_constants p = vk_op_unary_push_constants_init(src0, dst);
|
|
12244
|
+
p.param1 = op_params[1];
|
|
12245
|
+
p.param2 = op_params[2];
|
|
12246
|
+
p.param3 = op_params[3];
|
|
12247
|
+
p.param4 = op_params[4];
|
|
12248
|
+
ggml_vk_op_f32(ctx, subctx, src0, nullptr, nullptr, nullptr, dst, GGML_OP_UNARY, std::move(p));
|
|
12212
12249
|
}
|
|
12213
12250
|
|
|
12214
12251
|
static void ggml_vk_glu(ggml_backend_vk_context * ctx, vk_context& subctx, const ggml_tensor * src0, const ggml_tensor * src1, ggml_tensor * dst) {
|
|
@@ -12228,6 +12265,9 @@ static void ggml_vk_glu(ggml_backend_vk_context * ctx, vk_context& subctx, const
|
|
|
12228
12265
|
}
|
|
12229
12266
|
|
|
12230
12267
|
const uint32_t mode = split ? 2 : (swapped ? 1 : 0);
|
|
12268
|
+
const uint32_t src0_type_size = ggml_type_size(src0->type);
|
|
12269
|
+
const uint32_t src1_type_size = split ? ggml_type_size(src1->type) : src0_type_size;
|
|
12270
|
+
const uint32_t dst_type_size = ggml_type_size(dst->type);
|
|
12231
12271
|
|
|
12232
12272
|
ggml_vk_op_f32<vk_op_glu_push_constants>(ctx, subctx, src0, src1, nullptr, nullptr, dst, GGML_OP_GLU,
|
|
12233
12273
|
{
|
|
@@ -12237,16 +12277,22 @@ static void ggml_vk_glu(ggml_backend_vk_context * ctx, vk_context& subctx, const
|
|
|
12237
12277
|
mode,
|
|
12238
12278
|
alpha,
|
|
12239
12279
|
limit,
|
|
12240
|
-
(uint32_t)(src0->nb[
|
|
12241
|
-
(uint32_t)(src0->nb[
|
|
12242
|
-
(uint32_t)(src0->nb[
|
|
12243
|
-
(uint32_t)src0->
|
|
12244
|
-
(uint32_t)src0->
|
|
12245
|
-
(uint32_t)(
|
|
12246
|
-
(uint32_t)(
|
|
12247
|
-
(uint32_t)(
|
|
12280
|
+
(uint32_t)(src0->nb[0] / src0_type_size),
|
|
12281
|
+
(uint32_t)(src0->nb[1] / src0_type_size),
|
|
12282
|
+
(uint32_t)(src0->nb[2] / src0_type_size),
|
|
12283
|
+
(uint32_t)(src0->nb[3] / src0_type_size),
|
|
12284
|
+
(uint32_t)((split ? src1->nb[0] : src0->nb[0]) / src1_type_size),
|
|
12285
|
+
(uint32_t)((split ? src1->nb[1] : src0->nb[1]) / src1_type_size),
|
|
12286
|
+
(uint32_t)((split ? src1->nb[2] : src0->nb[2]) / src1_type_size),
|
|
12287
|
+
(uint32_t)((split ? src1->nb[3] : src0->nb[3]) / src1_type_size),
|
|
12288
|
+
(uint32_t)(dst->nb[0] / dst_type_size),
|
|
12289
|
+
(uint32_t)(dst->nb[1] / dst_type_size),
|
|
12290
|
+
(uint32_t)(dst->nb[2] / dst_type_size),
|
|
12291
|
+
(uint32_t)(dst->nb[3] / dst_type_size),
|
|
12248
12292
|
(uint32_t)dst->ne[1],
|
|
12249
|
-
(uint32_t)dst->ne[2]
|
|
12293
|
+
(uint32_t)dst->ne[2],
|
|
12294
|
+
0,
|
|
12295
|
+
0, 0, 0, 0, 0, 0,
|
|
12250
12296
|
});
|
|
12251
12297
|
}
|
|
12252
12298
|
|
|
@@ -14249,6 +14295,7 @@ static bool ggml_vk_build_graph(ggml_backend_vk_context * ctx, ggml_cgraph * cgr
|
|
|
14249
14295
|
switch (ggml_get_unary_op(node)) {
|
|
14250
14296
|
case GGML_UNARY_OP_ELU:
|
|
14251
14297
|
case GGML_UNARY_OP_EXP:
|
|
14298
|
+
case GGML_UNARY_OP_EXPM1:
|
|
14252
14299
|
case GGML_UNARY_OP_SILU:
|
|
14253
14300
|
case GGML_UNARY_OP_GELU:
|
|
14254
14301
|
case GGML_UNARY_OP_GELU_ERF:
|
|
@@ -16638,6 +16685,7 @@ static bool ggml_backend_vk_device_supports_op(ggml_backend_dev_t dev, const ggm
|
|
|
16638
16685
|
case GGML_OP_UNARY:
|
|
16639
16686
|
switch (ggml_get_unary_op(op)) {
|
|
16640
16687
|
case GGML_UNARY_OP_EXP:
|
|
16688
|
+
case GGML_UNARY_OP_EXPM1:
|
|
16641
16689
|
case GGML_UNARY_OP_ELU:
|
|
16642
16690
|
case GGML_UNARY_OP_GELU:
|
|
16643
16691
|
case GGML_UNARY_OP_GELU_ERF:
|
|
@@ -16658,8 +16706,7 @@ static bool ggml_backend_vk_device_supports_op(ggml_backend_dev_t dev, const ggm
|
|
|
16658
16706
|
case GGML_UNARY_OP_FLOOR:
|
|
16659
16707
|
case GGML_UNARY_OP_TRUNC:
|
|
16660
16708
|
case GGML_UNARY_OP_SGN:
|
|
16661
|
-
return
|
|
16662
|
-
(op->src[0]->type == GGML_TYPE_F32 || op->src[0]->type == GGML_TYPE_F16) &&
|
|
16709
|
+
return (op->src[0]->type == GGML_TYPE_F32 || op->src[0]->type == GGML_TYPE_F16) &&
|
|
16663
16710
|
(op->type == GGML_TYPE_F32 || op->type == GGML_TYPE_F16) &&
|
|
16664
16711
|
(op->src[0]->type == op->type);
|
|
16665
16712
|
default:
|
|
@@ -16675,7 +16722,8 @@ static bool ggml_backend_vk_device_supports_op(ggml_backend_dev_t dev, const ggm
|
|
|
16675
16722
|
case GGML_GLU_OP_GEGLU_QUICK:
|
|
16676
16723
|
return (op->src[0]->type == GGML_TYPE_F32 || op->src[0]->type == GGML_TYPE_F16) &&
|
|
16677
16724
|
(op->type == GGML_TYPE_F32 || op->type == GGML_TYPE_F16) &&
|
|
16678
|
-
(op->src[0]->type == op->type)
|
|
16725
|
+
(op->src[0]->type == op->type) &&
|
|
16726
|
+
(!op->src[1] || op->src[1]->type == op->src[0]->type);
|
|
16679
16727
|
default:
|
|
16680
16728
|
return false;
|
|
16681
16729
|
}
|
|
@@ -17805,6 +17853,9 @@ static void ggml_vk_check_results_0(ggml_backend_vk_context * ctx, ggml_cgraph *
|
|
|
17805
17853
|
case GGML_UNARY_OP_EXP:
|
|
17806
17854
|
tensor_clone = ggml_exp(ggml_ctx, src_clone[0]);
|
|
17807
17855
|
break;
|
|
17856
|
+
case GGML_UNARY_OP_EXPM1:
|
|
17857
|
+
tensor_clone = ggml_expm1(ggml_ctx, src_clone[0]);
|
|
17858
|
+
break;
|
|
17808
17859
|
case GGML_UNARY_OP_ELU:
|
|
17809
17860
|
tensor_clone = ggml_elu(ggml_ctx, src_clone[0]);
|
|
17810
17861
|
break;
|