npm - node-llama-cpp - Versions diffs - 3.0.0-beta.37 → 3.0.0-beta.39 - Mend

node-llama-cpp 3.0.0-beta.37 → 3.0.0-beta.39

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (167) hide show

package/bins/linux-arm64/_nlcBuildMetadata.json +1 -1
package/bins/linux-arm64/libggml.so +0 -0
package/bins/linux-arm64/libllama.so +0 -0
package/bins/linux-arm64/llama-addon.node +0 -0
package/bins/linux-armv7l/_nlcBuildMetadata.json +1 -1
package/bins/linux-armv7l/libggml.so +0 -0
package/bins/linux-armv7l/libllama.so +0 -0
package/bins/linux-armv7l/llama-addon.node +0 -0
package/bins/linux-x64/_nlcBuildMetadata.json +1 -1
package/bins/linux-x64/libggml.so +0 -0
package/bins/linux-x64/libllama.so +0 -0
package/bins/linux-x64/llama-addon.node +0 -0
package/bins/linux-x64-vulkan/_nlcBuildMetadata.json +1 -1
package/bins/linux-x64-vulkan/libggml.so +0 -0
package/bins/linux-x64-vulkan/libllama.so +0 -0
package/bins/linux-x64-vulkan/llama-addon.node +0 -0
package/bins/linux-x64-vulkan/vulkan-shaders-gen +0 -0
package/bins/mac-arm64-metal/_nlcBuildMetadata.json +1 -1
package/bins/mac-arm64-metal/ggml-common.h +24 -0
package/bins/mac-arm64-metal/ggml-metal.metal +181 -552
package/bins/mac-arm64-metal/libggml.dylib +0 -0
package/bins/mac-arm64-metal/libllama.dylib +0 -0
package/bins/mac-arm64-metal/llama-addon.node +0 -0
package/bins/mac-x64/_nlcBuildMetadata.json +1 -1
package/bins/mac-x64/libggml.dylib +0 -0
package/bins/mac-x64/libllama.dylib +0 -0
package/bins/mac-x64/llama-addon.node +0 -0
package/bins/win-arm64/_nlcBuildMetadata.json +1 -1
package/bins/win-arm64/ggml.dll +0 -0
package/bins/win-arm64/llama-addon.exp +0 -0
package/bins/win-arm64/llama-addon.lib +0 -0
package/bins/win-arm64/llama-addon.node +0 -0
package/bins/win-arm64/llama.dll +0 -0
package/bins/win-x64/_nlcBuildMetadata.json +1 -1
package/bins/win-x64/ggml.dll +0 -0
package/bins/win-x64/llama-addon.node +0 -0
package/bins/win-x64/llama.dll +0 -0
package/bins/win-x64-vulkan/_nlcBuildMetadata.json +1 -1
package/bins/win-x64-vulkan/ggml.dll +0 -0
package/bins/win-x64-vulkan/llama-addon.node +0 -0
package/bins/win-x64-vulkan/llama.dll +0 -0
package/bins/win-x64-vulkan/vulkan-shaders-gen.exe +0 -0
package/dist/ChatWrapper.d.ts +2 -1
package/dist/ChatWrapper.js +19 -5
package/dist/ChatWrapper.js.map +1 -1
package/dist/bindings/AddonTypes.d.ts +13 -2
package/dist/bindings/getLlama.d.ts +3 -2
package/dist/bindings/getLlama.js +1 -1
package/dist/bindings/getLlama.js.map +1 -1
package/dist/chatWrappers/FunctionaryChatWrapper.js +8 -5
package/dist/chatWrappers/FunctionaryChatWrapper.js.map +1 -1
package/dist/chatWrappers/GemmaChatWrapper.js +1 -1
package/dist/chatWrappers/GemmaChatWrapper.js.map +1 -1
package/dist/chatWrappers/Llama3ChatWrapper.js +5 -6
package/dist/chatWrappers/Llama3ChatWrapper.js.map +1 -1
package/dist/chatWrappers/Llama3_1ChatWrapper.d.ts +31 -0
package/dist/chatWrappers/Llama3_1ChatWrapper.js +223 -0
package/dist/chatWrappers/Llama3_1ChatWrapper.js.map +1 -0
package/dist/chatWrappers/generic/JinjaTemplateChatWrapper.d.ts +9 -0
package/dist/chatWrappers/generic/JinjaTemplateChatWrapper.js.map +1 -1
package/dist/chatWrappers/utils/ChatModelFunctionsDocumentationGenerator.d.ts +17 -2
package/dist/chatWrappers/utils/ChatModelFunctionsDocumentationGenerator.js +39 -2
package/dist/chatWrappers/utils/ChatModelFunctionsDocumentationGenerator.js.map +1 -1
package/dist/chatWrappers/utils/jsonDumps.d.ts +7 -0
package/dist/chatWrappers/utils/jsonDumps.js +18 -0
package/dist/chatWrappers/utils/jsonDumps.js.map +1 -0
package/dist/chatWrappers/utils/resolveChatWrapper.d.ts +5 -3
package/dist/chatWrappers/utils/resolveChatWrapper.js +50 -4
package/dist/chatWrappers/utils/resolveChatWrapper.js.map +1 -1
package/dist/cli/commands/ChatCommand.d.ts +1 -1
package/dist/cli/commands/ChatCommand.js +5 -5
package/dist/cli/commands/ChatCommand.js.map +1 -1
package/dist/cli/commands/CompleteCommand.js +5 -3
package/dist/cli/commands/CompleteCommand.js.map +1 -1
package/dist/cli/commands/InfillCommand.js +5 -3
package/dist/cli/commands/InfillCommand.js.map +1 -1
package/dist/cli/recommendedModels.js +43 -24
package/dist/cli/recommendedModels.js.map +1 -1
package/dist/cli/utils/interactivelyAskForModel.d.ts +2 -1
package/dist/cli/utils/interactivelyAskForModel.js +19 -9
package/dist/cli/utils/interactivelyAskForModel.js.map +1 -1
package/dist/cli/utils/resolveCommandGgufPath.d.ts +2 -1
package/dist/cli/utils/resolveCommandGgufPath.js +3 -2
package/dist/cli/utils/resolveCommandGgufPath.js.map +1 -1
package/dist/consts.d.ts +1 -0
package/dist/consts.js +1 -0
package/dist/consts.js.map +1 -1
package/dist/evaluator/LlamaChat/LlamaChat.d.ts +22 -0
package/dist/evaluator/LlamaChat/LlamaChat.js +65 -34
package/dist/evaluator/LlamaChat/LlamaChat.js.map +1 -1
package/dist/evaluator/LlamaChatSession/LlamaChatSession.d.ts +28 -6
package/dist/evaluator/LlamaChatSession/LlamaChatSession.js +22 -16
package/dist/evaluator/LlamaChatSession/LlamaChatSession.js.map +1 -1
package/dist/evaluator/LlamaChatSession/utils/LlamaChatSessionPromptCompletionEngine.js +4 -5
package/dist/evaluator/LlamaChatSession/utils/LlamaChatSessionPromptCompletionEngine.js.map +1 -1
package/dist/evaluator/LlamaCompletion.d.ts +13 -2
package/dist/evaluator/LlamaCompletion.js +10 -5
package/dist/evaluator/LlamaCompletion.js.map +1 -1
package/dist/evaluator/LlamaContext/LlamaContext.d.ts +1 -1
package/dist/evaluator/LlamaContext/LlamaContext.js +60 -0
package/dist/evaluator/LlamaContext/LlamaContext.js.map +1 -1
package/dist/evaluator/LlamaContext/types.d.ts +21 -0
package/dist/evaluator/LlamaGrammar.d.ts +6 -3
package/dist/evaluator/LlamaGrammar.js +2 -2
package/dist/evaluator/LlamaGrammar.js.map +1 -1
package/dist/evaluator/LlamaModel/LlamaModel.d.ts +16 -32
package/dist/evaluator/LlamaModel/LlamaModel.js +94 -53
package/dist/evaluator/LlamaModel/LlamaModel.js.map +1 -1
package/dist/gguf/consts.d.ts +1 -0
package/dist/gguf/consts.js +4 -0
package/dist/gguf/consts.js.map +1 -1
package/dist/gguf/insights/GgufInsights.js +4 -0
package/dist/gguf/insights/GgufInsights.js.map +1 -1
package/dist/gguf/parser/GgufV2Parser.js +3 -1
package/dist/gguf/parser/GgufV2Parser.js.map +1 -1
package/dist/gguf/types/GgufMetadataTypes.d.ts +16 -0
package/dist/gguf/types/GgufMetadataTypes.js.map +1 -1
package/dist/gguf/utils/convertMetadataKeyValueRecordToNestedObject.d.ts +3 -2
package/dist/gguf/utils/convertMetadataKeyValueRecordToNestedObject.js +44 -8
package/dist/gguf/utils/convertMetadataKeyValueRecordToNestedObject.js.map +1 -1
package/dist/index.d.ts +4 -2
package/dist/index.js +3 -1
package/dist/index.js.map +1 -1
package/dist/types.d.ts +15 -1
package/dist/types.js.map +1 -1
package/dist/utils/DeepPartialObject.d.ts +3 -0
package/dist/utils/DeepPartialObject.js +2 -0
package/dist/utils/DeepPartialObject.js.map +1 -0
package/dist/utils/StopGenerationDetector.d.ts +6 -3
package/dist/utils/StopGenerationDetector.js +22 -7
package/dist/utils/StopGenerationDetector.js.map +1 -1
package/dist/utils/TokenStreamRegulator.d.ts +1 -0
package/dist/utils/TokenStreamRegulator.js +23 -5
package/dist/utils/TokenStreamRegulator.js.map +1 -1
package/dist/utils/resolveLastTokens.d.ts +2 -0
package/dist/utils/resolveLastTokens.js +12 -0
package/dist/utils/resolveLastTokens.js.map +1 -0
package/llama/CMakeLists.txt +1 -1
package/llama/addon/AddonContext.cpp +772 -0
package/llama/addon/AddonContext.h +53 -0
package/llama/addon/AddonGrammar.cpp +44 -0
package/llama/addon/AddonGrammar.h +18 -0
package/llama/addon/AddonGrammarEvaluationState.cpp +28 -0
package/llama/addon/AddonGrammarEvaluationState.h +15 -0
package/llama/addon/AddonModel.cpp +681 -0
package/llama/addon/AddonModel.h +61 -0
package/llama/addon/AddonModelData.cpp +25 -0
package/llama/addon/AddonModelData.h +15 -0
package/llama/addon/AddonModelLora.cpp +107 -0
package/llama/addon/AddonModelLora.h +28 -0
package/llama/addon/addon.cpp +217 -0
package/llama/addon/addonGlobals.cpp +22 -0
package/llama/addon/addonGlobals.h +12 -0
package/llama/addon/globals/addonLog.cpp +135 -0
package/llama/addon/globals/addonLog.h +21 -0
package/llama/addon/globals/addonProgress.cpp +15 -0
package/llama/addon/globals/addonProgress.h +15 -0
package/llama/addon/globals/getGpuInfo.cpp +108 -0
package/llama/addon/globals/getGpuInfo.h +6 -0
package/llama/binariesGithubRelease.json +1 -1
package/llama/gitRelease.bundle +0 -0
package/llama/grammars/README.md +1 -1
package/llama/llama.cpp.info.json +1 -1
package/package.json +3 -3
package/templates/packed/electron-typescript-react.json +1 -1
package/templates/packed/node-typescript.json +1 -1
package/llama/addon.cpp +0 -2014

package/llama/addon/AddonModel.cpp ADDED Viewed

@@ -0,0 +1,681 @@
+#include <sstream>
+#include "addonGlobals.h"
+#include "globals/addonLog.h"
+#include "common.h"
+#include "llama.h"
+#include "AddonModel.h"
+#include "AddonModelData.h"
+#include "AddonModelLora.h"
+static Napi::Value getNapiToken(const Napi::CallbackInfo& info, llama_model* model, llama_token token) {
+    if (token < 0) {
+        return Napi::Number::From(info.Env(), -1);
+    }
+    auto tokenAttributes = llama_token_get_attr(model, token);
+    if (tokenAttributes & LLAMA_TOKEN_ATTR_UNDEFINED || tokenAttributes & LLAMA_TOKEN_ATTR_UNKNOWN) {
+        return Napi::Number::From(info.Env(), -1);
+    }
+    return Napi::Number::From(info.Env(), token);
+}
+static Napi::Value getNapiControlToken(const Napi::CallbackInfo& info, llama_model* model, llama_token token) {
+    if (token < 0) {
+        return Napi::Number::From(info.Env(), -1);
+    }
+    auto tokenAttributes = llama_token_get_attr(model, token);
+    if (!(tokenAttributes & LLAMA_TOKEN_ATTR_CONTROL) && !(tokenAttributes & LLAMA_TOKEN_ATTR_UNDEFINED)) {
+        return Napi::Number::From(info.Env(), -1);
+    }
+    return Napi::Number::From(info.Env(), token);
+}
+static bool llamaModelParamsProgressCallback(float progress, void * user_data) {
+    AddonModel* addonModel = (AddonModel *) user_data;
+    unsigned percentage = (unsigned) (100 * progress);
+    if (percentage > addonModel->modelLoadPercentage) {
+        addonModel->modelLoadPercentage = percentage;
+        // original llama.cpp logs
+        addonLlamaCppLogCallback(GGML_LOG_LEVEL_INFO, ".", nullptr);
+        if (percentage >= 100) {
+            addonLlamaCppLogCallback(GGML_LOG_LEVEL_INFO, "\n", nullptr);
+        }
+    }
+    if (progress > addonModel->rawModelLoadPercentage) {
+        addonModel->rawModelLoadPercentage = progress;
+        if (addonModel->onLoadProgressEventCallbackSet) {
+            addon_progress_event* data = new addon_progress_event {
+                progress
+            };
+            auto status = addonModel->addonThreadSafeOnLoadProgressEventCallback.NonBlockingCall(data);
+            if (status != napi_ok) {
+                delete data;
+            }
+        }
+    }
+    return !(addonModel->abortModelLoad);
+}
+class AddonModelLoadModelWorker : public Napi::AsyncWorker {
+    public:
+        AddonModel* model;
+        AddonModelLoadModelWorker(const Napi::Env& env, AddonModel* model)
+            : Napi::AsyncWorker(env, "AddonModelLoadModelWorker"),
+              model(model),
+              deferred(Napi::Promise::Deferred::New(env)) {
+            model->Ref();
+        }
+        ~AddonModelLoadModelWorker() {
+            model->Unref();
+        }
+        Napi::Promise GetPromise() {
+            return deferred.Promise();
+        }
+    protected:
+        Napi::Promise::Deferred deferred;
+        void Execute() {
+            try {
+                model->model = llama_load_model_from_file(model->modelPath.c_str(), model->model_params);
+                model->modelLoaded = model->model != nullptr && model->model != NULL;
+            } catch (const std::exception& e) {
+                SetError(e.what());
+            } catch(...) {
+                SetError("Unknown error when calling \"llama_load_model_from_file\"");
+            }
+        }
+        void OnOK() {
+            if (model->modelLoaded) {
+                uint64_t modelSize = llama_model_size(model->model);
+                adjustNapiExternalMemoryAdd(Env(), modelSize);
+                model->loadedModelSize = modelSize;
+            }
+            deferred.Resolve(Napi::Boolean::New(Env(), model->modelLoaded));
+            if (model->onLoadProgressEventCallbackSet) {
+                model->addonThreadSafeOnLoadProgressEventCallback.Release();
+            }
+        }
+        void OnError(const Napi::Error& err) {
+            deferred.Reject(err.Value());
+        }
+};
+class AddonModelUnloadModelWorker : public Napi::AsyncWorker {
+    public:
+        AddonModel* model;
+        AddonModelUnloadModelWorker(const Napi::Env& env, AddonModel* model)
+            : Napi::AsyncWorker(env, "AddonModelUnloadModelWorker"),
+              model(model),
+              deferred(Napi::Promise::Deferred::New(env)) {
+            model->Ref();
+        }
+        ~AddonModelUnloadModelWorker() {
+            model->Unref();
+        }
+        Napi::Promise GetPromise() {
+            return deferred.Promise();
+        }
+    protected:
+        Napi::Promise::Deferred deferred;
+        void Execute() {
+            try {
+                llama_free_model(model->model);
+                model->modelLoaded = false;
+                model->dispose();
+            } catch (const std::exception& e) {
+                SetError(e.what());
+            } catch(...) {
+                SetError("Unknown error when calling \"llama_free_model\"");
+            }
+        }
+        void OnOK() {
+            adjustNapiExternalMemorySubtract(Env(), model->loadedModelSize);
+            model->loadedModelSize = 0;
+            deferred.Resolve(Env().Undefined());
+        }
+        void OnError(const Napi::Error& err) {
+            deferred.Reject(err.Value());
+        }
+};
+class AddonModelLoadLoraWorker : public Napi::AsyncWorker {
+    public:
+        AddonModelLora* modelLora;
+        AddonModelLoadLoraWorker(
+            const Napi::Env& env,
+            AddonModelLora* modelLora
+        )
+            : Napi::AsyncWorker(env, "AddonModelLoadLoraWorker"),
+              modelLora(modelLora),
+              deferred(Napi::Promise::Deferred::New(env)) {
+            modelLora->model->Ref();
+            modelLora->Ref();
+        }
+        ~AddonModelLoadLoraWorker() {
+            modelLora->model->Unref();
+            modelLora->Unref();
+        }
+        Napi::Promise GetPromise() {
+            return deferred.Promise();
+        }
+    protected:
+        Napi::Promise::Deferred deferred;
+        void Execute() {
+            try {
+                const auto loraAdapter = llama_lora_adapter_init(modelLora->model->model, modelLora->loraFilePath.c_str());
+                if (loraAdapter == nullptr) {
+                    SetError(
+                        std::string(
+                            std::string("Failed to initialize LoRA adapter \"" + modelLora->loraFilePath + "\"")
+                        )
+                    );
+                    return;
+                }
+                modelLora->lora_adapter = loraAdapter;
+                modelLora->model->Ref();
+                if (modelLora->model->data != nullptr) {
+                    modelLora->model->data->loraAdapters.insert(modelLora);
+                } else {
+                    modelLora->dispose(true);
+                    SetError("Model data is not initialized");
+                }
+            } catch (const std::exception& e) {
+                SetError(e.what());
+            } catch(...) {
+                SetError("Unknown error when calling \"llama_lora_adapter_init\"");
+            }
+        }
+        void OnOK() {
+            deferred.Resolve(Env().Undefined());
+        }
+        void OnError(const Napi::Error& err) {
+            deferred.Reject(err.Value());
+        }
+};
+AddonModel::AddonModel(const Napi::CallbackInfo& info) : Napi::ObjectWrap<AddonModel>(info) {
+    loadedModelSize = 0;
+    hasAddonExportsRef = false;
+    modelLoaded = false;
+    abortModelLoad = false;
+    model_load_stopped = false;
+    rawModelLoadPercentage = 0;
+    modelLoadPercentage = 0;
+    onLoadProgressEventCallbackSet = false;
+    hasLoadAbortSignal = false;
+    disposed = false;
+    data = new AddonModelData();
+    model_params = llama_model_default_params();
+    // Get the model path
+    modelPath = info[0].As<Napi::String>().Utf8Value();
+    if (info.Length() > 1 && info[1].IsObject()) {
+        Napi::Object options = info[1].As<Napi::Object>();
+        if (options.Has("addonExports")) {
+            addonExportsRef = Napi::Persistent(options.Get("addonExports").As<Napi::Object>());
+            hasAddonExportsRef = true;
+        }
+        if (options.Has("gpuLayers")) {
+            model_params.n_gpu_layers = options.Get("gpuLayers").As<Napi::Number>().Int32Value();
+        }
+        if (options.Has("vocabOnly")) {
+            model_params.vocab_only = options.Get("vocabOnly").As<Napi::Boolean>().Value();
+        }
+        if (options.Has("useMmap")) {
+            model_params.use_mmap = options.Get("useMmap").As<Napi::Boolean>().Value();
+        }
+        if (options.Has("useMlock")) {
+            model_params.use_mlock = options.Get("useMlock").As<Napi::Boolean>().Value();
+        }
+        if (options.Has("checkTensors")) {
+            model_params.check_tensors = options.Get("checkTensors").As<Napi::Boolean>().Value();
+        }
+        if (options.Has("onLoadProgress")) {
+            auto onLoadProgressJSCallback = options.Get("onLoadProgress").As<Napi::Function>();
+            if (onLoadProgressJSCallback.IsFunction()) {
+                AddonThreadSafeProgressCallbackFunctionContext* context = new Napi::Reference<Napi::Value>(Napi::Persistent(info.This()));
+                addonThreadSafeOnLoadProgressEventCallback = AddonThreadSafeProgressEventCallbackFunction::New(
+                    info.Env(),
+                    onLoadProgressJSCallback,
+                    "onLoadProgressCallback",
+                    0,
+                    1,
+                    context,
+                    [](Napi::Env, AddonModel* addonModel, AddonThreadSafeProgressCallbackFunctionContext* ctx) {
+                        addonModel->onLoadProgressEventCallbackSet = false;
+                        delete ctx;
+                    },
+                    this
+                );
+                onLoadProgressEventCallbackSet = true;
+            }
+        }
+        if (options.Has("hasLoadAbortSignal")) {
+            hasLoadAbortSignal = options.Get("hasLoadAbortSignal").As<Napi::Boolean>().Value();
+        }
+        if (options.Has("overridesList")) {
+            Napi::Array overridesList = options.Get("overridesList").As<Napi::Array>();
+            kv_overrides.reserve(overridesList.Length());
+            for (uint32_t i = 0; i < overridesList.Length(); i++) {
+                Napi::Array overrideItem = overridesList.Get(i).As<Napi::Array>();
+                auto key = overrideItem.Get((uint32_t)0).As<Napi::String>().Utf8Value();
+                auto value = overrideItem.Get((uint32_t)1);
+                if (key.length() > 127) {
+                    continue;
+                }
+                llama_model_kv_override kvo;
+                std::strncpy(kvo.key, key.c_str(), key.length());
+                kvo.key[key.length()] = 0;
+                if (value.IsString()) {
+                    auto valueString = value.As<Napi::String>().Utf8Value();
+                    if (valueString.length() > 127) {
+                        continue;
+                    }
+                    kvo.tag = LLAMA_KV_OVERRIDE_TYPE_STR;
+                    std::strncpy(kvo.val_str, valueString.c_str(), valueString.length());
+                    kvo.val_str[valueString.length()] = 0;
+                    fputs(std::string("Override: " + key + " = " + valueString + "\n").c_str(), stdout);
+                    fflush(stdout);
+                } else if (value.IsNumber() || value.IsBigInt()) {
+                    auto numberType = overrideItem.Get((uint32_t)2).As<Napi::Number>().Int32Value();
+                    if (numberType == 0) {
+                        kvo.tag = LLAMA_KV_OVERRIDE_TYPE_INT;
+                        kvo.val_i64 = value.As<Napi::Number>().Int64Value();
+                    } else {
+                        kvo.tag = LLAMA_KV_OVERRIDE_TYPE_FLOAT;
+                        kvo.val_f64 = value.As<Napi::Number>().DoubleValue();
+                    }
+                    continue;
+                } else if (value.IsBoolean()) {
+                    kvo.tag = LLAMA_KV_OVERRIDE_TYPE_BOOL;
+                    kvo.val_bool = value.As<Napi::Boolean>().Value();
+                }
+                kv_overrides.emplace_back(std::move(kvo));
+            }
+            if (!kv_overrides.empty()) {
+                kv_overrides.emplace_back();
+                kv_overrides.back().key[0] = 0;
+            }
+            model_params.kv_overrides = kv_overrides.data();
+        }
+        if (onLoadProgressEventCallbackSet || hasLoadAbortSignal) {
+            model_params.progress_callback_user_data = &(*this);
+            model_params.progress_callback = llamaModelParamsProgressCallback;
+        }
+    }
+}
+AddonModel::~AddonModel() {
+    dispose();
+}
+void AddonModel::dispose() {
+    if (disposed) {
+        return;
+    }
+    disposed = true;
+    if (modelLoaded) {
+        modelLoaded = false;
+        llama_free_model(model);
+        adjustNapiExternalMemorySubtract(Env(), loadedModelSize);
+        loadedModelSize = 0;
+    }
+    if (data != nullptr) {
+        auto currentData = data;
+        data = nullptr;
+        delete currentData;
+    }
+    if (hasAddonExportsRef) {
+        addonExportsRef.Unref();
+        hasAddonExportsRef = false;
+    }
+}
+Napi::Value AddonModel::Init(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    AddonModelLoadModelWorker* worker = new AddonModelLoadModelWorker(this->Env(), this);
+    worker->Queue();
+    return worker->GetPromise();
+}
+Napi::Value AddonModel::LoadLora(const Napi::CallbackInfo& info) {
+    AddonModelLora* modelLora = Napi::ObjectWrap<AddonModelLora>::Unwrap(info[0].As<Napi::Object>());
+    AddonModelLoadLoraWorker* worker = new AddonModelLoadLoraWorker(this->Env(), modelLora);
+    worker->Queue();
+    return worker->GetPromise();
+}
+Napi::Value AddonModel::AbortActiveModelLoad(const Napi::CallbackInfo& info) {
+    abortModelLoad = true;
+    return info.Env().Undefined();
+}
+Napi::Value AddonModel::Dispose(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        return info.Env().Undefined();
+    }
+    if (modelLoaded) {
+        modelLoaded = false;
+        AddonModelUnloadModelWorker* worker = new AddonModelUnloadModelWorker(this->Env(), this);
+        worker->Queue();
+        return worker->GetPromise();
+    } else {
+        dispose();
+        Napi::Promise::Deferred deferred = Napi::Promise::Deferred::New(info.Env());
+        deferred.Resolve(info.Env().Undefined());
+        return deferred.Promise();
+    }
+}
+Napi::Value AddonModel::Tokenize(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    std::string text = info[0].As<Napi::String>().Utf8Value();
+    bool specialTokens = info[1].As<Napi::Boolean>().Value();
+    std::vector<llama_token> tokens = llama_tokenize(model, text, false, specialTokens);
+    Napi::Uint32Array result = Napi::Uint32Array::New(info.Env(), tokens.size());
+    for (size_t i = 0; i < tokens.size(); ++i) {
+        result[i] = static_cast<uint32_t>(tokens[i]);
+    }
+    return result;
+}
+Napi::Value AddonModel::Detokenize(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    Napi::Uint32Array tokens = info[0].As<Napi::Uint32Array>();
+    bool decodeSpecialTokens = info.Length() > 0
+        ? info[1].As<Napi::Boolean>().Value()
+        : false;
+    std::vector<char> result(8, 0);
+    const int n_length = llama_detokenize(model, (llama_token*)tokens.Data(), tokens.ElementLength(), result.data(), result.size(), false, decodeSpecialTokens);
+    if (n_length < 0) {
+        result.resize(-n_length);
+        int check = llama_detokenize(model, (llama_token*)tokens.Data(), tokens.ElementLength(), result.data(), result.size(), false, decodeSpecialTokens);
+        GGML_ASSERT(check == -n_length);
+    } else {
+        result.resize(n_length);
+    }
+    return Napi::String::New(info.Env(), result.data(), result.size());
+}
+Napi::Value AddonModel::GetTrainContextSize(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return Napi::Number::From(info.Env(), llama_n_ctx_train(model));
+}
+Napi::Value AddonModel::GetEmbeddingVectorSize(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return Napi::Number::From(info.Env(), llama_n_embd(model));
+}
+Napi::Value AddonModel::GetTotalSize(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return Napi::Number::From(info.Env(), llama_model_size(model));
+}
+Napi::Value AddonModel::GetTotalParameters(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return Napi::Number::From(info.Env(), llama_model_n_params(model));
+}
+Napi::Value AddonModel::GetModelDescription(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    char model_desc[128];
+    int actual_length = llama_model_desc(model, model_desc, sizeof(model_desc));
+    return Napi::String::New(info.Env(), model_desc, actual_length);
+}
+Napi::Value AddonModel::TokenBos(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_bos(model));
+}
+Napi::Value AddonModel::TokenEos(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_eos(model));
+}
+Napi::Value AddonModel::TokenNl(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiToken(info, model, llama_token_nl(model));
+}
+Napi::Value AddonModel::PrefixToken(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_prefix(model));
+}
+Napi::Value AddonModel::MiddleToken(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_middle(model));
+}
+Napi::Value AddonModel::SuffixToken(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_suffix(model));
+}
+Napi::Value AddonModel::EotToken(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    return getNapiControlToken(info, model, llama_token_eot(model));
+}
+Napi::Value AddonModel::GetTokenString(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    int token = info[0].As<Napi::Number>().Int32Value();
+    std::stringstream ss;
+    const char* str = llama_token_get_text(model, token);
+    if (str == nullptr) {
+        return info.Env().Undefined();
+    }
+    ss << str;
+    return Napi::String::New(info.Env(), ss.str());
+}
+Napi::Value AddonModel::GetTokenAttributes(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    if (info[0].IsNumber() == false) {
+        return Napi::Number::From(info.Env(), int32_t(LLAMA_TOKEN_ATTR_UNDEFINED));
+    }
+    int token = info[0].As<Napi::Number>().Int32Value();
+    auto tokenAttributes = llama_token_get_attr(model, token);
+    return Napi::Number::From(info.Env(), int32_t(tokenAttributes));
+}
+Napi::Value AddonModel::IsEogToken(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    if (info[0].IsNumber() == false) {
+        return Napi::Boolean::New(info.Env(), false);
+    }
+    int token = info[0].As<Napi::Number>().Int32Value();
+    return Napi::Boolean::New(info.Env(), llama_token_is_eog(model, token));
+}
+Napi::Value AddonModel::GetVocabularyType(const Napi::CallbackInfo& info) {
+    if (disposed) {
+        Napi::Error::New(info.Env(), "Model is disposed").ThrowAsJavaScriptException();
+        return info.Env().Undefined();
+    }
+    auto vocabularyType = llama_vocab_type(model);
+    return Napi::Number::From(info.Env(), int32_t(vocabularyType));
+}
+Napi::Value AddonModel::ShouldPrependBosToken(const Napi::CallbackInfo& info) {
+    const int addBos = llama_add_bos_token(model);
+    bool shouldPrependBos = addBos != -1 ? bool(addBos) : (llama_vocab_type(model) == LLAMA_VOCAB_TYPE_SPM);
+    return Napi::Boolean::New(info.Env(), shouldPrependBos);
+}
+Napi::Value AddonModel::GetModelSize(const Napi::CallbackInfo& info) {
+    return Napi::Number::From(info.Env(), llama_model_size(model));
+}
+void AddonModel::init(Napi::Object exports) {
+    exports.Set(
+        "AddonModel",
+        DefineClass(
+            exports.Env(),
+            "AddonModel",
+            {
+                InstanceMethod("init", &AddonModel::Init),
+                InstanceMethod("loadLora", &AddonModel::LoadLora),
+                InstanceMethod("abortActiveModelLoad", &AddonModel::AbortActiveModelLoad),
+                InstanceMethod("tokenize", &AddonModel::Tokenize),
+                InstanceMethod("detokenize", &AddonModel::Detokenize),
+                InstanceMethod("getTrainContextSize", &AddonModel::GetTrainContextSize),
+                InstanceMethod("getEmbeddingVectorSize", &AddonModel::GetEmbeddingVectorSize),
+                InstanceMethod("getTotalSize", &AddonModel::GetTotalSize),
+                InstanceMethod("getTotalParameters", &AddonModel::GetTotalParameters),
+                InstanceMethod("getModelDescription", &AddonModel::GetModelDescription),
+                InstanceMethod("tokenBos", &AddonModel::TokenBos),
+                InstanceMethod("tokenEos", &AddonModel::TokenEos),
+                InstanceMethod("tokenNl", &AddonModel::TokenNl),
+                InstanceMethod("prefixToken", &AddonModel::PrefixToken),
+                InstanceMethod("middleToken", &AddonModel::MiddleToken),
+                InstanceMethod("suffixToken", &AddonModel::SuffixToken),
+                InstanceMethod("eotToken", &AddonModel::EotToken),
+                InstanceMethod("getTokenString", &AddonModel::GetTokenString),
+                InstanceMethod("getTokenAttributes", &AddonModel::GetTokenAttributes),
+                InstanceMethod("isEogToken", &AddonModel::IsEogToken),
+                InstanceMethod("getVocabularyType", &AddonModel::GetVocabularyType),
+                InstanceMethod("shouldPrependBosToken", &AddonModel::ShouldPrependBosToken),
+                InstanceMethod("getModelSize", &AddonModel::GetModelSize),
+                InstanceMethod("dispose", &AddonModel::Dispose),
+            }
+        )
+    );
+}