llama-cpp-bin 9660.0.0__tar.gz → 9670.0.0__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/PKG-INFO +1 -1
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/speculative.cpp +62 -2
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.cpp +7 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.cpp +21 -1
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.cpp +133 -1
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp +25 -51
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp +2 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp +205 -14
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.cpp +115 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/mmvq.hpp +17 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp +105 -14
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp +3 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-graph.cpp +58 -45
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-graph.h +3 -2
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/llama-bench/llama-bench.cpp +7 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-context.cpp +27 -3
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin/_version.py +3 -3
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/PKG-INFO +1 -1
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/scripts/generate-pep503-index.py +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-everything.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-wheels-cpu.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-wheels-cuda.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-wheels-macos.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-wheels-rocm.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/build-wheels-vulkan.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/check-upstream.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.github/workflows/update-index.yml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.gitignore +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/.gitmodules +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/LICENSE +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/MANIFEST.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/README.md +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/app/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/app/llama.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/arm64-apple-clang.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/arm64-linux-clang.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/arm64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/build-info.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/common.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/download-models.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/git-vars.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/license.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/llama-config.cmake.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/llama.pc.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/riscv64-spacemit-linux-gnu-gcc.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/cmake/x64-windows-llvm.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/arg.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/arg.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/base64.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/build-info.cpp.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/build-info.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-auto-parser-generator.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-auto-parser-helpers.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-auto-parser-helpers.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-auto-parser.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-diff-analyzer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat-peg-parser.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/chat.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/common.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/console.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/console.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/debug.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/debug.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/download.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/download.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/fit.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/fit.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/hf-cache.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/hf-cache.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/http.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/imatrix-loader.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/imatrix-loader.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/caps.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/caps.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/lexer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/lexer.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/parser.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/runtime.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/runtime.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/string.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/string.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/value.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/jinja/value.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/json-partial.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/json-partial.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/json-schema-to-grammar.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/llguidance.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/log.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/log.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-cache.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-cache.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-map.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-map.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-mod.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/ngram-mod.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/peg-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/peg-parser.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/preset.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/preset.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/reasoning-budget.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/regex-partial.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/regex-partial.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/sampling.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/sampling.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/speculative.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/unicode.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/common/unicode.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/batched/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/batched/batched.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/debug/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/debug/debug.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/deprecation-warning/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/diffusion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/diffusion/diffusion-cli.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/diffusion/diffusion.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/diffusion/diffusion.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/embedding/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/embedding/embedding.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/eval-callback/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/eval-callback/eval-callback.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gen-docs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gen-docs/gen-docs.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf/gguf.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/sha1/sha1.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/sha256/sha256.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/gguf-hash/gguf-hash.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/idle/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/idle/idle.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/ai_chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/llama.android/lib/src/main/cpp/logging.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookahead/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookahead/lookahead.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookup/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookup/lookup-create.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookup/lookup-merge.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookup/lookup-stats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/lookup/lookup.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/model-conversion/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/parallel/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/parallel/parallel.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/passkey/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/passkey/passkey.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/retrieval/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/retrieval/retrieval.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/simple/simple.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/simple-chat/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/simple-chat/simple-chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/speculative/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/speculative/speculative.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/speculative-simple/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/speculative-simple/speculative-simple.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/sycl/ls-sycl-device.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/training/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/examples/training/finetune.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/cmake/FindNCCL.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/cmake/GitVars.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/cmake/common.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/cmake/ggml-config.cmake.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-alloc.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-backend.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-blas.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-cann.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-cpp.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-cpu.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-cuda.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-hexagon.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-metal.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-opencl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-openvino.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-opt.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-rpc.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-sycl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-virtgpu.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-vulkan.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-webgpu.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-zdnn.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml-zendnn.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/ggml.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/include/gguf.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-alloc.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend-dl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend-dl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend-meta.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-blas/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/acl_tensor.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/aclnn_ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/amx.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/amx/mmq.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/arm/repack.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/loongarch/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/powerpc/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/riscv/repack.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/s390/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/wasm/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/cpu-feats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch/x86/repack.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/arch-fallback.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/binary-ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/cmake/FindSMTIME.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/hbm.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/quants.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/repack.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-gemm.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime1_kernels.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime2_kernels.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_env.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/ime_kernels.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/repack.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/rvv_kernels.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_barrier.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_mem_pool.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/spacemit/spine_tcm.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/traits.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/unary-ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cpu/vec.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/hip.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-cuda/vendors/musa.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/act-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/argsort-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/binary-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cmake-toolchain.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/concat-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cpy-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/cumsum-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/diag-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/fill-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/flash-attn-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/gated-delta-net-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/get-rows-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-dump.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-fastdiv.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hex-utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-flash-attn-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-profile.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hmx-utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ctx.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/htp-ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-arith.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-base.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-copy.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-div.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-dump.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-exp.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-flash-attn.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-floor.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-inverse.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-log.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-pow.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-reduce.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-repl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-scale.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sigmoid.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sin-cos.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sqrt.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-types.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/hvx-utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/main.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/matmul-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/pad-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/repeat-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/rope-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/set-rows-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/softmax-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/solve-tri-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/ssm-conv.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/sum-rows-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/unary-ops.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/vtcm-utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-drv.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/htp-opnode.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hexagon/libdl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-hip/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-context.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-metal/ggml-metal.metal +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-musa/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-decoder.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-openvino.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/ggml-quants.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/frontend.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/input_model.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/get_rows.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_geglu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_swiglu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/mulmat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/permute.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/reshape.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rms_norm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/scale.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/set_rows.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_gelu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_silu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/op_table.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/mark_decompression_convert_constant_folding.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/rt_info/weightless_caching_attributes.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/openvino/utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-openvino/utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-opt.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-quants.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-quants.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-rpc/transport.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/add-id.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/backend.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/binbcast.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/common.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/common.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/concat.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/conv.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/convert.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/count-equal.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/cpy.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/cumsum.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/dequantize.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/diag.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/dmmv.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-buffers.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-common.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-tile.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn-vec.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fattn.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/fill.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/gated_delta_net.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/gemm.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/getrows.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/gla.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/im2col.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/mmq.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/norm.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/outprod.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pad.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/pool.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/presets.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/quantize.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/quants.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/repeat_back.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/roll.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/rope.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/set.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/set.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/set_rows.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/softmax.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/solve_tri.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_conv.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/ssm_scan.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq112-dv112.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq128-dv128.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq256-dv256.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq40-dv40.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq512-dv512.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq576-dv512.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq64-dv64.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq72-dv72.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq80-dv80.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq96-dv96.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-f16.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q8_0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/tsembd.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/type.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/upscale.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/wkv.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-threading.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-threading.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/apir_cs_ggml-rpc-front.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/apir_cs_ggml-rpc-back.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-convert.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-device.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/backend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/api_remoting.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-device.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-reg.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-backend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/ggml-remoting.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/include/apir_hw.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-apir.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward.gen.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-virtgpu/virtgpu.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-vulkan/cmake/host-toolchain.cmake.in +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-webgpu/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-webgpu/pre_wgsl.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/common.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/ggml-zdnn.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/mmf.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zdnn/utils.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zendnn/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-zendnn/ggml-zendnn.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/gguf.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/include/llama-cpp.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/include/llama.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/pocs/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/pocs/vdot/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/pocs/vdot/q8dot.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/pocs/vdot/vdot.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-all.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-compare-llama-bench.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-convert_legacy_llama.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-convert_lora_to_gguf.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-gguf_editor_gui.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-pydantic.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-server-bench.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-test-tokenizer-random.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements/requirements-tool_bench.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/scripts/jinja/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/scripts/snapdragon/qdc/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/scripts/ui-assets.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-adapter.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-adapter.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-arch.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-arch.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-batch.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-batch.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-chat.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-context.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-context.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-cparams.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-cparams.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-ext.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-grammar.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-grammar.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-hparams.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-hparams.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-impl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-io.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-io.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache-dsa.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache-dsa.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache-iswa.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache-iswa.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cache.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-kv-cells.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-hybrid-iswa.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-hybrid.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-hybrid.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-recurrent.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory-recurrent.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-memory.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-mmap.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-mmap.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model-loader.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model-loader.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model-saver.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model-saver.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-model.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-quant.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-quant.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-sampler.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-sampler.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-vocab.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama-vocab.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/llama.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/afmoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/apertus.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/arcee.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/arctic.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/arwkv7.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/baichuan.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/bailingmoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/bailingmoe2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/bert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/bitnet.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/bloom.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/chameleon.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/chatglm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/codeshell.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/cohere2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/cohere2moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/command-r.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/dbrx.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/deci.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/deepseek.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/deepseek2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/deepseek2ocr.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/deepseek32.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/delta-net-base.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/dots1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/dream.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/eagle3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/ernie4-5-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/ernie4-5.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/eurobert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/exaone-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/exaone.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/exaone4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/falcon-h1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/falcon.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma-embedding.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma3n.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma4-assistant.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gemma4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/glm-dsa.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/glm4-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/glm4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gpt2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/gptneox.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/granite-hybrid.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/granite-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/granite.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/grok.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/grovemoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/hunyuan-dense.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/hunyuan-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/hunyuan-vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/internlm2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/jais.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/jais2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/jamba.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/jina-bert-v2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/jina-bert-v3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/kimi-linear.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/lfm2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/lfm2moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/llada-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/llada.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/llama-embed.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/llama.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/llama4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/maincoder.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mamba-base.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mamba.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mamba2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mellum.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mimo2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/minicpm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/minicpm3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/minimax-m2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mistral3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mistral4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/models.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/modern-bert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/mpt.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/nemotron-h-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/nemotron-h.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/nemotron.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/neo-bert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/nomic-bert-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/nomic-bert.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/olmo.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/olmo2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/olmoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/openai-moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/openelm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/orion.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/pangu-embed.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/phi2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/phi3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/phimoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/plamo.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/plamo2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/plamo3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/plm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen2moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen35.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen35moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen3moe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen3next.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/qwen3vlmoe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/refact.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rnd1.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rwkv6-base.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rwkv6.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rwkv6qwen2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rwkv7-base.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/rwkv7.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/seed-oss.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/smallthinker.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/smollm3.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/stablelm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/starcoder.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/starcoder2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/step35.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/t5.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/t5encoder.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/talkie.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/wavtokenizer-dec.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/models/xverse.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/unicode-data.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/unicode-data.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/unicode.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/src/unicode.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/export-graph-ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/get-model.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/get-model.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/gguf-model-data.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/simple-tokenize.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-basic.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-gbnf-generation.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-json-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-json-serialization.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-python-dict-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/test-unicode.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/peg-parser/tests.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-alloc.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-arg-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-autorelease.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-backend-ops.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-backend-sampler.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-barrier.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-c.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-chat-auto-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-chat-peg-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-chat-template.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-col2im-1d.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-double-float.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-gbnf-validator.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-gguf-model-data.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-gguf.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-grammar-integration.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-grammar-llguidance.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-grammar-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-jinja.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-json-partial.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-json-schema-to-grammar.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-llama-archs.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-llama-grammar.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-log.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-model-load-cancel.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-mtmd-c-api.c +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-opt.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-peg-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-quant-type-selection.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-quantize-fns.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-quantize-perf.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-quantize-stats.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-reasoning-budget.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-recurrent-state-rollback.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-regex-partial.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-rope.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-sampling.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-save-load-state.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-state-restore-fragmented.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-thread-safety.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-tokenizer-0.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-tokenizer-1-bpe.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/test-tokenizer-1-spm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tests/testing.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/batched-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/batched-bench/batched-bench.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/batched-bench/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cli/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cli/cli.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cli/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/completion/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/completion/completion.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/completion/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/completions.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/cvector-generator.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/mean.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/negative.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/pca.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/cvector-generator/positive.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/export-lora/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/export-lora/export-lora.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/fit-params/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/fit-params/fit-params.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/fit-params/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/gguf-split/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/gguf-split/gguf-split.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/imatrix/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/imatrix/imatrix.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/llama-bench/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/llama-bench/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/clip-graph.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/clip-impl.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/clip-model.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/clip.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/clip.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/debug/mtmd-debug.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/deprecation-warning.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/cogvlm.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/conformer.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/deepseekocr.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/deepseekocr2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/dotsocr.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/exaone4_5.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/gemma4a.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/gemma4ua.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/gemma4uv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/gemma4v.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/glm4v.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/granite-speech.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/granite4-vision.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/hunyuanvl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/internvl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/kimik25.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/kimivl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/llama4.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/llava.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/mimovl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/minicpmv.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/mobilenetv5.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/models.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/nemotron-v2-vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/paddleocr.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/pixtral.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/qwen2vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/qwen3a.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/qwen3vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/siglip.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/step3vl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/whisper-enc.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/yasa2.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/models/youtuvl.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-audio.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-audio.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-cli.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-helper.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-helper.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-image.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd-image.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/mtmd.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/tests/test-1-ground-truth.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/mtmd/tests/tests-requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/parser/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/parser/debug-template-parser.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/parser/template-analysis.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/perplexity/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/perplexity/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/perplexity/perplexity.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/quantize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/quantize/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/quantize/quantize.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/results/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/results/results.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/rpc/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/rpc/rpc-server.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/bench/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/bench/speed-bench/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/main.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-chat.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-chat.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-common.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-common.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-context.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-cors-proxy.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-http.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-http.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-models.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-models.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-queue.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-queue.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-task.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-task.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-tools.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server-tools.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/server.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/server/tests/requirements.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/tokenize/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/tokenize/tokenize.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/tts/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/tts/tts.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/ui/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/ui/embed.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/tools/ui/sources.cmake +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/cpp-httplib/CMakeLists.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/cpp-httplib/httplib.cpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/cpp-httplib/httplib.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/miniaudio/miniaudio.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/nlohmann/json.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/nlohmann/json_fwd.hpp +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/sheredom/subprocess.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/vendor/stb/stb_image.h +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/pyproject.toml +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/setup.cfg +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/setup.py +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin/__init__.py +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin/bin/.gitkeep +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin/cli.py +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin/core.py +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/SOURCES.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/dependency_links.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/entry_points.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/requires.txt +0 -0
- {llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/src/llama_cpp_bin.egg-info/top_level.txt +0 -0
|
@@ -140,6 +140,8 @@ struct common_speculative_impl {
|
|
|
140
140
|
size_t n_gen_tokens = 0; // number of tokens generated by this implementation.
|
|
141
141
|
size_t n_acc_tokens = 0; // number of tokens accepted by the target model.
|
|
142
142
|
|
|
143
|
+
std::vector<size_t> n_acc_tokens_per_pos; // number of tokens accepted per draft position.
|
|
144
|
+
|
|
143
145
|
// TODO: track performance of most recent calls
|
|
144
146
|
const bool gen_perf = true; // whether to generate performance stats.
|
|
145
147
|
|
|
@@ -416,6 +418,9 @@ struct common_speculative_impl_draft_eagle3 : public common_speculative_impl {
|
|
|
416
418
|
|
|
417
419
|
std::vector<common_sampler_ptr> smpls;
|
|
418
420
|
|
|
421
|
+
// backend sampler chain per seq, attached to ctx_dft
|
|
422
|
+
std::vector<llama_sampler *> backend_chains;
|
|
423
|
+
|
|
419
424
|
int32_t n_embd_dec = 0; // draft hidden size
|
|
420
425
|
int32_t n_embd_enc = 0; // target_layer_ids_n * target_hidden_size
|
|
421
426
|
int32_t n_embd_tgt = 0; // target model hidden size
|
|
@@ -441,7 +446,7 @@ struct common_speculative_impl_draft_eagle3 : public common_speculative_impl {
|
|
|
441
446
|
, params(params.draft)
|
|
442
447
|
{
|
|
443
448
|
LOG_INF("%s: adding speculative implementation 'draft-eagle3'\n", __func__);
|
|
444
|
-
LOG_INF("%s: - n_max=%d, n_min=%d, p_min=%f\n", __func__, params.draft.n_max, params.draft.n_min, params.draft.p_min);
|
|
449
|
+
LOG_INF("%s: - n_max=%d, n_min=%d, p_min=%f, backend_sampling=%d\n", __func__, params.draft.n_max, params.draft.n_min, params.draft.p_min, (int) params.draft.backend_sampling);
|
|
445
450
|
|
|
446
451
|
auto * ctx_tgt = this->params.ctx_tgt;
|
|
447
452
|
auto * ctx_dft = this->params.ctx_dft;
|
|
@@ -476,6 +481,22 @@ struct common_speculative_impl_draft_eagle3 : public common_speculative_impl {
|
|
|
476
481
|
s.reset(common_sampler_init(llama_get_model(ctx_dft), sparams));
|
|
477
482
|
}
|
|
478
483
|
|
|
484
|
+
// offload draft sampling to the backend
|
|
485
|
+
backend_chains.assign(n_seq, nullptr);
|
|
486
|
+
if (this->params.backend_sampling) {
|
|
487
|
+
for (llama_seq_id seq_id = 0; seq_id < (llama_seq_id) n_seq; ++seq_id) {
|
|
488
|
+
llama_sampler * chain = llama_sampler_chain_init(llama_sampler_chain_default_params());
|
|
489
|
+
llama_sampler_chain_add(chain, llama_sampler_init_top_k(10));
|
|
490
|
+
|
|
491
|
+
if (!llama_set_sampler(ctx_dft, seq_id, chain)) {
|
|
492
|
+
LOG_WRN("%s: backend offload failed for seq_id=%d; using CPU sampler\n", __func__, (int) seq_id);
|
|
493
|
+
llama_sampler_free(chain);
|
|
494
|
+
chain = nullptr;
|
|
495
|
+
}
|
|
496
|
+
backend_chains[seq_id] = chain;
|
|
497
|
+
}
|
|
498
|
+
}
|
|
499
|
+
|
|
479
500
|
// turn on extraction of the target layers' input embeddings
|
|
480
501
|
for (uint32_t k = 0; k < target_layer_ids_n; ++k) {
|
|
481
502
|
llama_set_embeddings_layer_inp(ctx_tgt, (uint32_t) target_layer_ids[k], true);
|
|
@@ -494,6 +515,18 @@ struct common_speculative_impl_draft_eagle3 : public common_speculative_impl {
|
|
|
494
515
|
}
|
|
495
516
|
|
|
496
517
|
~common_speculative_impl_draft_eagle3() override {
|
|
518
|
+
auto * ctx_dft = this->params.ctx_dft;
|
|
519
|
+
for (llama_seq_id seq_id = 0; seq_id < (llama_seq_id) backend_chains.size(); ++seq_id) {
|
|
520
|
+
if (backend_chains[seq_id] == nullptr) {
|
|
521
|
+
continue;
|
|
522
|
+
}
|
|
523
|
+
if (ctx_dft) {
|
|
524
|
+
llama_set_sampler(ctx_dft, seq_id, nullptr);
|
|
525
|
+
}
|
|
526
|
+
llama_sampler_free(backend_chains[seq_id]);
|
|
527
|
+
}
|
|
528
|
+
backend_chains.clear();
|
|
529
|
+
|
|
497
530
|
if (batch.token != nullptr) {
|
|
498
531
|
free(batch.token);
|
|
499
532
|
batch.token = nullptr;
|
|
@@ -2059,6 +2092,15 @@ void common_speculative_accept(common_speculative * spec, llama_seq_id seq_id, u
|
|
|
2059
2092
|
|
|
2060
2093
|
{
|
|
2061
2094
|
common_time_meas tm(impl->t_accept_us, !impl->gen_perf);
|
|
2095
|
+
|
|
2096
|
+
if (impl->n_acc_tokens_per_pos.size() < n_accepted) {
|
|
2097
|
+
impl->n_acc_tokens_per_pos.resize(n_accepted, 0);
|
|
2098
|
+
}
|
|
2099
|
+
|
|
2100
|
+
for (size_t i = 0; i < n_accepted; ++i) {
|
|
2101
|
+
impl->n_acc_tokens_per_pos[i]++;
|
|
2102
|
+
}
|
|
2103
|
+
|
|
2062
2104
|
if (n_accepted > 0) {
|
|
2063
2105
|
impl->n_acc_drafts++;
|
|
2064
2106
|
impl->n_acc_tokens += n_accepted;
|
|
@@ -2093,13 +2135,31 @@ void common_speculative_print_stats(const common_speculative * spec) {
|
|
|
2093
2135
|
str_perf = "";
|
|
2094
2136
|
}
|
|
2095
2137
|
|
|
2096
|
-
|
|
2138
|
+
std::string str_stats;
|
|
2139
|
+
if (impl->n_call_accept > 0) {
|
|
2140
|
+
const double mean =
|
|
2141
|
+
1.0 + (double) impl->n_acc_tokens / (double) impl->n_call_accept;
|
|
2142
|
+
std::ostringstream tmp;
|
|
2143
|
+
tmp << std::fixed << std::setprecision(3);
|
|
2144
|
+
for (size_t i = 0; i < impl->n_acc_tokens_per_pos.size(); ++i) {
|
|
2145
|
+
if (i > 0) {
|
|
2146
|
+
tmp << ", ";
|
|
2147
|
+
}
|
|
2148
|
+
tmp << (double) impl->n_acc_tokens_per_pos[i] / (double) impl->n_call_accept;
|
|
2149
|
+
}
|
|
2150
|
+
std::ostringstream oss;
|
|
2151
|
+
oss << std::fixed << std::setprecision(2) << mean;
|
|
2152
|
+
str_stats = ", #mean acc len = " + oss.str() + ", #acc rate/pos = (" + tmp.str() + ")";
|
|
2153
|
+
}
|
|
2154
|
+
|
|
2155
|
+
LOG_INF("statistics %16s: #calls(b,g,a) = %4zu %6zu %6zu, #gen drafts = %6zu, #acc drafts = %5zu, #gen tokens = %6zu, #acc tokens = %5zu%s%s\n",
|
|
2097
2156
|
common_speculative_type_to_str(impl->type).c_str(),
|
|
2098
2157
|
impl->n_call_begin, impl->n_call_draft, impl->n_call_accept,
|
|
2099
2158
|
impl->n_gen_drafts,
|
|
2100
2159
|
impl->n_acc_drafts,
|
|
2101
2160
|
impl->n_gen_tokens,
|
|
2102
2161
|
impl->n_acc_tokens,
|
|
2162
|
+
str_stats.c_str(),
|
|
2103
2163
|
str_perf.c_str());
|
|
2104
2164
|
}
|
|
2105
2165
|
}
|
|
@@ -287,6 +287,13 @@ inline void ggml_sycl_op_bin_bcast(ggml_backend_sycl_context & ctx, const ggml_t
|
|
|
287
287
|
ne10, ne11, ne12, ne13, ne0, ne1, ne2, ne3, nb00, nb01, nb02, nb03, nb10, nb11, nb12, nb13, nb0, nb1, nb2,
|
|
288
288
|
nb3, ggml_is_contiguous(src0), ggml_is_contiguous(src1), ggml_is_permuted(src0), ggml_is_permuted(src1),
|
|
289
289
|
main_stream);
|
|
290
|
+
#ifdef GGML_SYCL_HAS_BF16
|
|
291
|
+
} else if (src0->type == GGML_TYPE_BF16 && src1->type == GGML_TYPE_BF16 && dst->type == GGML_TYPE_BF16) {
|
|
292
|
+
op()((const sycl::ext::oneapi::bfloat16 *) src0->data, (const sycl::ext::oneapi::bfloat16 *) src1->data,
|
|
293
|
+
(sycl::ext::oneapi::bfloat16 *) dst->data, ne00, ne01, ne02, ne03, ne10, ne11, ne12, ne13, ne0, ne1, ne2,
|
|
294
|
+
ne3, nb00, nb01, nb02, nb03, nb10, nb11, nb12, nb13, nb0, nb1, nb2, nb3, ggml_is_contiguous(src0),
|
|
295
|
+
ggml_is_contiguous(src1), ggml_is_permuted(src0), ggml_is_permuted(src1), main_stream);
|
|
296
|
+
#endif
|
|
290
297
|
} else {
|
|
291
298
|
fprintf(stderr, "%s: unsupported types: dst: %s, src0: %s, src1: %s\n", __func__, ggml_type_name(dst->type),
|
|
292
299
|
ggml_type_name(src0->type), ggml_type_name(src1->type));
|
|
@@ -10,6 +10,8 @@
|
|
|
10
10
|
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
|
|
11
11
|
//
|
|
12
12
|
|
|
13
|
+
#include "ggml.h"
|
|
14
|
+
|
|
13
15
|
#include "concat.hpp"
|
|
14
16
|
|
|
15
17
|
static inline size_t elem_size(ggml_type t) {
|
|
@@ -192,11 +194,29 @@ void ggml_sycl_op_concat(ggml_backend_sycl_context & ctx, ggml_tensor *dst) {
|
|
|
192
194
|
case GGML_TYPE_F32:
|
|
193
195
|
concat_impl_sycl<float>(ctx, dst);
|
|
194
196
|
break;
|
|
197
|
+
case GGML_TYPE_F16:
|
|
198
|
+
concat_impl_sycl<sycl::half>(ctx, dst);
|
|
199
|
+
break;
|
|
200
|
+
#ifdef GGML_SYCL_HAS_BF16
|
|
201
|
+
case GGML_TYPE_BF16:
|
|
202
|
+
concat_impl_sycl<sycl::ext::oneapi::bfloat16>(ctx, dst);
|
|
203
|
+
break;
|
|
204
|
+
#endif
|
|
195
205
|
case GGML_TYPE_I32:
|
|
196
206
|
concat_impl_sycl<int32_t>(ctx, dst);
|
|
197
207
|
break;
|
|
208
|
+
case GGML_TYPE_I16:
|
|
209
|
+
concat_impl_sycl<int16_t>(ctx, dst);
|
|
210
|
+
break;
|
|
211
|
+
case GGML_TYPE_I64:
|
|
212
|
+
concat_impl_sycl<int64_t>(ctx, dst);
|
|
213
|
+
break;
|
|
214
|
+
case GGML_TYPE_I8:
|
|
215
|
+
concat_impl_sycl<int8_t>(ctx, dst);
|
|
216
|
+
break;
|
|
198
217
|
default:
|
|
199
|
-
|
|
218
|
+
fprintf(stderr, "%s: unsupported types: dst: %s\n", __func__, ggml_type_name(dst->type));
|
|
219
|
+
GGML_ASSERT(false);
|
|
200
220
|
break;
|
|
201
221
|
}
|
|
202
222
|
}
|
|
@@ -1022,6 +1022,120 @@ static void dequantize_mul_mat_vec_q5_k(const void *__restrict__ vx,
|
|
|
1022
1022
|
}
|
|
1023
1023
|
}
|
|
1024
1024
|
|
|
1025
|
+
static void dequantize_mul_mat_vec_q5_k_reorder(const void *__restrict__ vx,
|
|
1026
|
+
const float *__restrict__ yy,
|
|
1027
|
+
float *__restrict__ dst,
|
|
1028
|
+
const int ncols, int nrows,
|
|
1029
|
+
const sycl::nd_item<3> &item_ct1) {
|
|
1030
|
+
|
|
1031
|
+
const int row = item_ct1.get_group(2);
|
|
1032
|
+
const int num_blocks_per_row = ncols / QK_K;
|
|
1033
|
+
const int ib0 = row*num_blocks_per_row;
|
|
1034
|
+
|
|
1035
|
+
// SOA base pointers for the reordered layout:
|
|
1036
|
+
// [qs: nb * QK_K/2] [qh: nb * QK_K/8] [scales: nb * K_SCALE_SIZE] [dm: nb * sizeof(half2)]
|
|
1037
|
+
const int nb = nrows * num_blocks_per_row;
|
|
1038
|
+
const uint8_t * qs_base = (const uint8_t *)vx;
|
|
1039
|
+
const uint8_t * qh_base = qs_base + (size_t)nb * (QK_K / 2);
|
|
1040
|
+
const uint8_t * scales_base = qh_base + (size_t)nb * (QK_K / 8);
|
|
1041
|
+
const sycl::half2 * dm_base = (const sycl::half2 *)(scales_base + (size_t)nb * K_SCALE_SIZE);
|
|
1042
|
+
|
|
1043
|
+
float tmp = 0; // partial sum for thread in warp
|
|
1044
|
+
|
|
1045
|
+
#if QK_K == 256
|
|
1046
|
+
const uint16_t kmask1 = 0x3f3f;
|
|
1047
|
+
const uint16_t kmask2 = 0x0f0f;
|
|
1048
|
+
const uint16_t kmask3 = 0xc0c0;
|
|
1049
|
+
|
|
1050
|
+
const int tid = item_ct1.get_local_id(2) / 2; // 0...15
|
|
1051
|
+
const int ix = item_ct1.get_local_id(2) % 2;
|
|
1052
|
+
|
|
1053
|
+
const int il = tid/4; // 0...3
|
|
1054
|
+
const int ir = tid - 4*il;// 0...3
|
|
1055
|
+
const int n = 2;
|
|
1056
|
+
|
|
1057
|
+
const int im = il/2; // 0 or 1. 0 computes 0,32 + 128,160, 1 computes 64,96 + 192,224
|
|
1058
|
+
const int in = il%2;
|
|
1059
|
+
|
|
1060
|
+
const int l0 = n*(2*ir + in);
|
|
1061
|
+
const int q_offset = 32*im + l0;
|
|
1062
|
+
const int y_offset = 64*im + l0;
|
|
1063
|
+
|
|
1064
|
+
const uint8_t hm1 = 1 << (2*im);
|
|
1065
|
+
const uint8_t hm2 = hm1 << 4;
|
|
1066
|
+
|
|
1067
|
+
uint16_t aux[4];
|
|
1068
|
+
const uint8_t * sc = (const uint8_t *)aux;
|
|
1069
|
+
|
|
1070
|
+
uint16_t q16[8];
|
|
1071
|
+
const uint8_t * q4 = (const uint8_t *)q16;
|
|
1072
|
+
|
|
1073
|
+
for (int i = ix; i < num_blocks_per_row; i += 2) {
|
|
1074
|
+
const int bi = ib0 + i;
|
|
1075
|
+
|
|
1076
|
+
const uint8_t * ql1 = qs_base + bi * (QK_K / 2) + q_offset;
|
|
1077
|
+
const uint8_t * qh = qh_base + bi * (QK_K / 8) + l0;
|
|
1078
|
+
const float * y1 = yy + i*QK_K + y_offset;
|
|
1079
|
+
const float * y2 = y1 + 128;
|
|
1080
|
+
|
|
1081
|
+
const sycl::half2 dm_val = dm_base[bi];
|
|
1082
|
+
const float dall = dm_val[0];
|
|
1083
|
+
const float dmin = dm_val[1];
|
|
1084
|
+
|
|
1085
|
+
const uint16_t * a = (const uint16_t *)(scales_base + bi * K_SCALE_SIZE);
|
|
1086
|
+
aux[0] = a[im+0] & kmask1;
|
|
1087
|
+
aux[1] = a[im+2] & kmask1;
|
|
1088
|
+
aux[2] = ((a[im+4] >> 0) & kmask2) | ((a[im+0] & kmask3) >> 2);
|
|
1089
|
+
aux[3] = ((a[im+4] >> 4) & kmask2) | ((a[im+2] & kmask3) >> 2);
|
|
1090
|
+
|
|
1091
|
+
sycl::float4 sum = {0.f, 0.f, 0.f, 0.f};
|
|
1092
|
+
float smin = 0;
|
|
1093
|
+
const uint16_t * q1 = (const uint16_t *)ql1;
|
|
1094
|
+
const uint16_t * q2 = q1 + 32;
|
|
1095
|
+
q16[0] = q1[0] & 0x0f0f;
|
|
1096
|
+
q16[1] = q1[8] & 0x0f0f;
|
|
1097
|
+
q16[2] = (q1[0] >> 4) & 0x0f0f;
|
|
1098
|
+
q16[3] = (q1[8] >> 4) & 0x0f0f;
|
|
1099
|
+
q16[4] = q2[0] & 0x0f0f;
|
|
1100
|
+
q16[5] = q2[8] & 0x0f0f;
|
|
1101
|
+
q16[6] = (q2[0] >> 4) & 0x0f0f;
|
|
1102
|
+
q16[7] = (q2[8] >> 4) & 0x0f0f;
|
|
1103
|
+
for (int l = 0; l < n; ++l) {
|
|
1104
|
+
sum.x() +=
|
|
1105
|
+
y1[l + 0] * (q4[l + 0] + (qh[l + 0] & (hm1 << 0) ? 16 : 0)) +
|
|
1106
|
+
y1[l + 16] * (q4[l + 2] + (qh[l + 16] & (hm1 << 0) ? 16 : 0));
|
|
1107
|
+
sum.y() +=
|
|
1108
|
+
y1[l + 32] * (q4[l + 4] + (qh[l + 0] & (hm1 << 1) ? 16 : 0)) +
|
|
1109
|
+
y1[l + 48] * (q4[l + 6] + (qh[l + 16] & (hm1 << 1) ? 16 : 0));
|
|
1110
|
+
sum.z() +=
|
|
1111
|
+
y2[l + 0] * (q4[l + 8] + (qh[l + 0] & (hm2 << 0) ? 16 : 0)) +
|
|
1112
|
+
y2[l + 16] * (q4[l + 10] + (qh[l + 16] & (hm2 << 0) ? 16 : 0));
|
|
1113
|
+
sum.w() +=
|
|
1114
|
+
y2[l + 32] * (q4[l + 12] + (qh[l + 0] & (hm2 << 1) ? 16 : 0)) +
|
|
1115
|
+
y2[l + 48] * (q4[l + 14] + (qh[l + 16] & (hm2 << 1) ? 16 : 0));
|
|
1116
|
+
smin += (y1[l] + y1[l+16]) * sc[2] + (y1[l+32] + y1[l+48]) * sc[3]
|
|
1117
|
+
+ (y2[l] + y2[l+16]) * sc[6] + (y2[l+32] + y2[l+48]) * sc[7];
|
|
1118
|
+
}
|
|
1119
|
+
tmp += dall * (sum.x() * sc[0] + sum.y() * sc[1] + sum.z() * sc[4] +
|
|
1120
|
+
sum.w() * sc[5]) -
|
|
1121
|
+
dmin * smin;
|
|
1122
|
+
}
|
|
1123
|
+
#else
|
|
1124
|
+
// The reordered Q5_K layout is only produced for QK_K == 256.
|
|
1125
|
+
#endif
|
|
1126
|
+
|
|
1127
|
+
// sum up partial sums and write back result
|
|
1128
|
+
#pragma unroll
|
|
1129
|
+
for (int mask = QK_WARP_SIZE / 2; mask > 0; mask >>= 1) {
|
|
1130
|
+
tmp +=
|
|
1131
|
+
dpct::permute_sub_group_by_xor(item_ct1.get_sub_group(), tmp, mask);
|
|
1132
|
+
}
|
|
1133
|
+
|
|
1134
|
+
if (item_ct1.get_local_id(2) == 0) {
|
|
1135
|
+
dst[row] = tmp;
|
|
1136
|
+
}
|
|
1137
|
+
}
|
|
1138
|
+
|
|
1025
1139
|
static void dequantize_mul_mat_vec_q6_k(const void * __restrict__ vx, const float * __restrict__ yy, float * __restrict__ dst, const int ncols, int nrows,
|
|
1026
1140
|
const sycl::nd_item<3> &item_ct1) {
|
|
1027
1141
|
|
|
@@ -1599,6 +1713,19 @@ static void dequantize_mul_mat_vec_q4_K_sycl_reorder(const void *vx, const float
|
|
|
1599
1713
|
});
|
|
1600
1714
|
}
|
|
1601
1715
|
|
|
1716
|
+
static void dequantize_mul_mat_vec_q5_K_sycl_reorder(const void *vx, const float *y,
|
|
1717
|
+
float *dst, const int ncols,
|
|
1718
|
+
const int nrows,
|
|
1719
|
+
dpct::queue_ptr stream) {
|
|
1720
|
+
GGML_ASSERT(ncols % QK_K == 0);
|
|
1721
|
+
const sycl::range<3> block_dims(1, 1, QK_WARP_SIZE);
|
|
1722
|
+
stream->parallel_for(
|
|
1723
|
+
sycl::nd_range<3>(sycl::range<3>(1, 1, nrows) * block_dims, block_dims),
|
|
1724
|
+
[=](sycl::nd_item<3> item_ct1) [[sycl::reqd_sub_group_size(QK_WARP_SIZE)]] {
|
|
1725
|
+
dequantize_mul_mat_vec_q5_k_reorder(vx, y, dst, ncols, nrows, item_ct1);
|
|
1726
|
+
});
|
|
1727
|
+
}
|
|
1728
|
+
|
|
1602
1729
|
static void dequantize_mul_mat_vec_q6_K_sycl_reorder(const void *vx, const float *y,
|
|
1603
1730
|
float *dst, const int ncols,
|
|
1604
1731
|
const int nrows,
|
|
@@ -1695,7 +1822,12 @@ void ggml_sycl_op_dequantize_mul_mat_vec(
|
|
|
1695
1822
|
}
|
|
1696
1823
|
break;
|
|
1697
1824
|
case GGML_TYPE_Q5_K:
|
|
1698
|
-
|
|
1825
|
+
if ((ggml_tensor_extra_gpu *) dst->src[0]->extra &&
|
|
1826
|
+
((ggml_tensor_extra_gpu *) dst->src[0]->extra)->optimized_feature.reorder) {
|
|
1827
|
+
dequantize_mul_mat_vec_q5_K_sycl_reorder(src0_dd_i, src1_ddf_i, dst_dd_i, ne00, row_diff, stream);
|
|
1828
|
+
} else {
|
|
1829
|
+
dequantize_mul_mat_vec_q5_K_sycl(src0_dd_i, src1_ddf_i, dst_dd_i, ne00, row_diff, stream);
|
|
1830
|
+
}
|
|
1699
1831
|
break;
|
|
1700
1832
|
case GGML_TYPE_Q6_K:
|
|
1701
1833
|
if ((ggml_tensor_extra_gpu *) dst->src[0]->extra &&
|
{llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.cpp
RENAMED
|
@@ -124,6 +124,11 @@ static __dpct_inline__ T op_exp(T x) {
|
|
|
124
124
|
return sycl::exp(x);
|
|
125
125
|
}
|
|
126
126
|
|
|
127
|
+
template<typename T>
|
|
128
|
+
static __dpct_inline__ T op_expm1(T x) {
|
|
129
|
+
return sycl::expm1(x);
|
|
130
|
+
}
|
|
131
|
+
|
|
127
132
|
template<typename T>
|
|
128
133
|
static __dpct_inline__ T op_log(T x) {
|
|
129
134
|
if (x <= static_cast<T>(0)) {
|
|
@@ -266,13 +271,6 @@ static void unary_op_clamp_kernel(const T * x, T * dst, const int k, const sycl:
|
|
|
266
271
|
}
|
|
267
272
|
}
|
|
268
273
|
|
|
269
|
-
template<typename T>
|
|
270
|
-
static void unary_op_floor_kernel(const T * x, T * dst, const int k, const sycl::nd_item<1> &item_ct1) {
|
|
271
|
-
SYCL_GLOBAL_ID_LOOP(k, item_ct1) {
|
|
272
|
-
dst[i] = op_floor(x[i]);
|
|
273
|
-
}
|
|
274
|
-
}
|
|
275
|
-
|
|
276
274
|
template<typename T>
|
|
277
275
|
static void unary_op_ceil_kernel(const T * x, T * dst, const int k, const sycl::nd_item<1> &item_ct1) {
|
|
278
276
|
SYCL_GLOBAL_ID_LOOP(k, item_ct1) {
|
|
@@ -280,20 +278,6 @@ static void unary_op_ceil_kernel(const T * x, T * dst, const int k, const sycl::
|
|
|
280
278
|
}
|
|
281
279
|
}
|
|
282
280
|
|
|
283
|
-
template<typename T>
|
|
284
|
-
static void unary_op_round_kernel(const T * x, T * dst, const int k, const sycl::nd_item<1> &item_ct1) {
|
|
285
|
-
SYCL_GLOBAL_ID_LOOP(k, item_ct1) {
|
|
286
|
-
dst[i] = op_round(x[i]);
|
|
287
|
-
}
|
|
288
|
-
}
|
|
289
|
-
|
|
290
|
-
template<typename T>
|
|
291
|
-
static void unary_op_trunc_kernel(const T * x, T * dst, const int k, const sycl::nd_item<1> &item_ct1) {
|
|
292
|
-
SYCL_GLOBAL_ID_LOOP(k, item_ct1) {
|
|
293
|
-
dst[i] = op_trunc(x[i]);
|
|
294
|
-
}
|
|
295
|
-
}
|
|
296
|
-
|
|
297
281
|
template<typename T>
|
|
298
282
|
static void clamp(const T * x, T * dst, const float min, const float max, const int k,
|
|
299
283
|
const sycl::nd_item<1> &item_ct1) {
|
|
@@ -605,6 +589,12 @@ static inline void ggml_sycl_op_exp(ggml_backend_sycl_context & ctx, ggml_tensor
|
|
|
605
589
|
});
|
|
606
590
|
}
|
|
607
591
|
|
|
592
|
+
static inline void ggml_sycl_op_expm1(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
593
|
+
ggml_sycl_detail::ggml_sycl_op_unary(ctx, dst, [](auto x) {
|
|
594
|
+
return op_expm1(x);
|
|
595
|
+
});
|
|
596
|
+
}
|
|
597
|
+
|
|
608
598
|
static inline void ggml_sycl_op_log(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
609
599
|
ggml_sycl_detail::dispatch_ggml_sycl_op_unary(ctx, dst,
|
|
610
600
|
[](const auto* src, auto* dst_ptr, int k_elements, queue_ptr stream) {
|
|
@@ -728,16 +718,9 @@ static inline void ggml_sycl_op_clamp(ggml_backend_sycl_context & ctx, ggml_tens
|
|
|
728
718
|
}
|
|
729
719
|
|
|
730
720
|
static inline void ggml_sycl_op_floor(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
731
|
-
ggml_sycl_detail::
|
|
732
|
-
|
|
733
|
-
|
|
734
|
-
stream->parallel_for(
|
|
735
|
-
sycl::nd_range<1>(sycl::range<1>(num_blocks) * sycl::range<1>(256),
|
|
736
|
-
sycl::range<1>(256)),
|
|
737
|
-
[=](sycl::nd_item<1> item_ct1) {
|
|
738
|
-
unary_op_floor_kernel(src, dst_ptr, k_elements, item_ct1);
|
|
739
|
-
});
|
|
740
|
-
});
|
|
721
|
+
ggml_sycl_detail::ggml_sycl_op_unary(ctx, dst, [](auto x) {
|
|
722
|
+
return op_floor(x);
|
|
723
|
+
});
|
|
741
724
|
}
|
|
742
725
|
|
|
743
726
|
static inline void ggml_sycl_op_ceil(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
@@ -747,29 +730,15 @@ static inline void ggml_sycl_op_ceil(ggml_backend_sycl_context & ctx, ggml_tenso
|
|
|
747
730
|
}
|
|
748
731
|
|
|
749
732
|
static inline void ggml_sycl_op_round(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
750
|
-
ggml_sycl_detail::
|
|
751
|
-
|
|
752
|
-
|
|
753
|
-
stream->parallel_for(
|
|
754
|
-
sycl::nd_range<1>(sycl::range<1>(num_blocks) * sycl::range<1>(256),
|
|
755
|
-
sycl::range<1>(256)),
|
|
756
|
-
[=](sycl::nd_item<1> item_ct1) {
|
|
757
|
-
unary_op_round_kernel(src, dst_ptr, k_elements, item_ct1);
|
|
758
|
-
});
|
|
759
|
-
});
|
|
733
|
+
ggml_sycl_detail::ggml_sycl_op_unary(ctx, dst, [](auto x) {
|
|
734
|
+
return op_round(x);
|
|
735
|
+
});
|
|
760
736
|
}
|
|
761
737
|
|
|
762
738
|
static inline void ggml_sycl_op_trunc(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
763
|
-
ggml_sycl_detail::
|
|
764
|
-
|
|
765
|
-
|
|
766
|
-
stream->parallel_for(
|
|
767
|
-
sycl::nd_range<1>(sycl::range<1>(num_blocks) * sycl::range<1>(256),
|
|
768
|
-
sycl::range<1>(256)),
|
|
769
|
-
[=](sycl::nd_item<1> item_ct1) {
|
|
770
|
-
unary_op_trunc_kernel(src, dst_ptr, k_elements, item_ct1);
|
|
771
|
-
});
|
|
772
|
-
});
|
|
739
|
+
ggml_sycl_detail::ggml_sycl_op_unary(ctx, dst, [](auto x) {
|
|
740
|
+
return op_trunc(x);
|
|
741
|
+
});
|
|
773
742
|
}
|
|
774
743
|
|
|
775
744
|
static inline void ggml_sycl_op_acc(ggml_backend_sycl_context & ctx, ggml_tensor *dst) {
|
|
@@ -1018,6 +987,11 @@ void ggml_sycl_exp(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
|
1018
987
|
ggml_sycl_op_exp(ctx, dst);
|
|
1019
988
|
}
|
|
1020
989
|
|
|
990
|
+
void ggml_sycl_expm1(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
991
|
+
scope_op_debug_print scope_dbg_print(__func__, dst, /*num_src=*/1);
|
|
992
|
+
ggml_sycl_op_expm1(ctx, dst);
|
|
993
|
+
}
|
|
994
|
+
|
|
1021
995
|
void ggml_sycl_log(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
|
|
1022
996
|
scope_op_debug_print scope_dbg_print(__func__, dst, /*num_src=*/1);
|
|
1023
997
|
ggml_sycl_op_log(ctx, dst);
|
{llama_cpp_bin-9660.0.0 → llama_cpp_bin-9670.0.0}/llama.cpp/ggml/src/ggml-sycl/element_wise.hpp
RENAMED
|
@@ -59,6 +59,8 @@ void ggml_sycl_hardswish(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
|
|
|
59
59
|
|
|
60
60
|
void ggml_sycl_exp(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
|
|
61
61
|
|
|
62
|
+
void ggml_sycl_expm1(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
|
|
63
|
+
|
|
62
64
|
void ggml_sycl_log(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
|
|
63
65
|
|
|
64
66
|
void ggml_sycl_softplus(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
|