npm - @fugood/llama.node - Versions diffs - 1.3.6 → 1.3.7 - Mend

@fugood/llama.node 1.3.6 → 1.3.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/package.json +15 -15
package/scripts/llama.cpp.patch +2 -10
package/src/llama.cpp/src/llama-model.cpp +4 -2
package/src/llama.cpp/src/models/deepseek2.cpp +2 -1

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "@fugood/llama.node",
   "access": "public",
-  "version": "1.3.6",
+  "version": "1.3.7",
   "description": "An another Node binding of llama.cpp",
   "main": "lib/index.js",
   "scripts": {
@@ -72,20 +72,20 @@
     "CMakeLists.txt"
   ],
   "optionalDependencies": {
-    "@fugood/node-llama-linux-x64": "1.3.6",
-    "@fugood/node-llama-linux-x64-vulkan": "1.3.6",
-    "@fugood/node-llama-linux-x64-cuda": "1.3.6",
-    "@fugood/node-llama-linux-arm64-snapdragon": "1.3.6",
-    "@fugood/node-llama-linux-arm64": "1.3.6",
-    "@fugood/node-llama-linux-arm64-vulkan": "1.3.6",
-    "@fugood/node-llama-linux-arm64-cuda": "1.3.6",
-    "@fugood/node-llama-win32-x64": "1.3.6",
-    "@fugood/node-llama-win32-x64-vulkan": "1.3.6",
-    "@fugood/node-llama-win32-x64-cuda": "1.3.6",
-    "@fugood/node-llama-win32-arm64": "1.3.6",
-    "@fugood/node-llama-win32-arm64-vulkan": "1.3.6",
-    "@fugood/node-llama-darwin-x64": "1.3.6",
-    "@fugood/node-llama-darwin-arm64": "1.3.6"
+    "@fugood/node-llama-linux-x64": "1.3.7",
+    "@fugood/node-llama-linux-x64-vulkan": "1.3.7",
+    "@fugood/node-llama-linux-x64-cuda": "1.3.7",
+    "@fugood/node-llama-linux-arm64-snapdragon": "1.3.7",
+    "@fugood/node-llama-linux-arm64": "1.3.7",
+    "@fugood/node-llama-linux-arm64-vulkan": "1.3.7",
+    "@fugood/node-llama-linux-arm64-cuda": "1.3.7",
+    "@fugood/node-llama-win32-x64": "1.3.7",
+    "@fugood/node-llama-win32-x64-vulkan": "1.3.7",
+    "@fugood/node-llama-win32-x64-cuda": "1.3.7",
+    "@fugood/node-llama-win32-arm64": "1.3.7",
+    "@fugood/node-llama-win32-arm64-vulkan": "1.3.7",
+    "@fugood/node-llama-darwin-x64": "1.3.7",
+    "@fugood/node-llama-darwin-arm64": "1.3.7"
   },
   "devDependencies": {
     "@babel/preset-env": "^7.24.4",

package/scripts/llama.cpp.patch CHANGED Viewed

@@ -122,18 +122,10 @@ index d0cab0bcb..48d532838 100644
              check_cxx_compiler_flag(-mfp16-format=ieee GGML_COMPILER_SUPPORTS_FP16_FORMAT_I3E)
              if (NOT "${GGML_COMPILER_SUPPORTS_FP16_FORMAT_I3E}" STREQUAL "")
 diff --git a/src/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp b/src/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp
-index cabd301ad..31eec134c 100644
+index 72a82a891..7869ad323 100644
 --- a/src/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp
 +++ b/src/llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp
-@@ -9,6 +9,7 @@
- #include <chrono>
- #include <mutex>
- #include <string>
-+#include <stdexcept>
- #ifdef _WIN32
- #    include <sal.h>
-@@ -3682,6 +3683,8 @@ ggml_hexagon_registry::ggml_hexagon_registry(ggml_backend_reg_t reg) {
+@@ -3417,6 +3417,8 @@ ggml_hexagon_registry::ggml_hexagon_registry(ggml_backend_reg_t reg) {
          } catch (std::exception const &exc) {
              GGML_LOG_ERROR("ggml-hex: failed to create device/session %zu\n", i);
              devices[i].context = nullptr;

package/src/llama.cpp/src/llama-model.cpp CHANGED Viewed

@@ -1593,7 +1593,8 @@ void llama_model::load_hparams(llama_model_loader & ml) {
             } break;
         case LLM_ARCH_DEEPSEEK2:
             {
-                bool is_lite = (hparams.n_layer == 27);
+                // lite variants include DeepSeek-V2-Lite, GigaChat3-10B-A1.8B
+                bool is_lite = (hparams.n_layer == 27 || hparams.n_layer == 26);
                 ml.get_key(LLM_KV_ATTENTION_LAYERNORM_RMS_EPS, hparams.f_norm_rms_eps);
                 ml.get_key(LLM_KV_LEADING_DENSE_BLOCK_COUNT,   hparams.n_layer_dense_lead);
                 if (!is_lite) {
@@ -4581,7 +4582,8 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                 } break;
             case LLM_ARCH_DEEPSEEK2:
                 {
-                    const bool is_lite = (hparams.n_layer == 27);
+                    // lite variants include DeepSeek-V2-Lite, GigaChat3-10B-A1.8B
+                    const bool is_lite = (hparams.n_layer == 27 || hparams.n_layer == 26);
                     const bool is_mla = (hparams.n_embd_head_k_mla != 0 && hparams.n_embd_head_v_mla != 0);

package/src/llama.cpp/src/models/deepseek2.cpp CHANGED Viewed

@@ -4,7 +4,8 @@
 llm_build_deepseek2::llm_build_deepseek2(const llama_model & model, const llm_graph_params & params) :
     llm_graph_context(params) {
-    bool is_lite = (hparams.n_layer == 27);
+    // lite variants include DeepSeek-V2-Lite, GigaChat3-10B-A1.8B
+    bool is_lite = (hparams.n_layer == 27 || hparams.n_layer == 26);
     const bool is_mla = (hparams.n_embd_head_k_mla != 0 && hparams.n_embd_head_v_mla != 0);