npm - llama-cpp-capacitor - Versions diffs - 0.0.3 → 0.0.5 - Mend

llama-cpp-capacitor 0.0.3 → 0.0.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/android/build.gradle +11 -0
package/android/src/main/CMakeLists.txt +4 -6
package/android/src/main/java/ai/annadata/plugin/capacitor/LlamaCpp.java +166 -126
package/android/src/main/java/ai/annadata/plugin/capacitor/LlamaCppPlugin.java +9 -0
package/android/src/main/jni-utils.h +5 -5
package/android/src/main/jni.cpp +30 -15
package/package.json +1 -1

package/android/build.gradle CHANGED Viewed

@@ -26,6 +26,17 @@ android {
         versionCode 1
         versionName "1.0"
         testInstrumentationRunner "androidx.test.runner.AndroidJUnitRunner"
+        ndk {
+            abiFilters 'arm64-v8a'
+        }
+    }
+    externalNativeBuild {
+        cmake {
+            path "src/main/CMakeLists.txt"
+            version "3.22.1"
+        }
     }
     buildTypes {
         release {

package/android/src/main/CMakeLists.txt CHANGED Viewed

@@ -55,6 +55,7 @@ set(
     ${LLAMACPP_LIB_DIR}/llama.cpp
     ${LLAMACPP_LIB_DIR}/llama-model.cpp
     ${LLAMACPP_LIB_DIR}/llama-model-loader.cpp
+    ${LLAMACPP_LIB_DIR}/llama-model-saver.cpp
     ${LLAMACPP_LIB_DIR}/llama-kv-cache.cpp
     ${LLAMACPP_LIB_DIR}/llama-kv-cache-iswa.cpp
     ${LLAMACPP_LIB_DIR}/llama-memory-hybrid.cpp
@@ -85,12 +86,9 @@ set(
 find_library(LOG_LIB log)
 function(build_library target_name arch cpu_flags)
-    if (NOT ${arch} STREQUAL "generic")
-        set(SOURCE_FILES_ARCH
-            ${LLAMACPP_LIB_DIR}/ggml-cpu/arch/${arch}/quants.c
-            ${LLAMACPP_LIB_DIR}/ggml-cpu/arch/${arch}/repack.cpp
-        )
-    endif ()
+    set(SOURCE_FILES_ARCH "")
+    # For now, use generic implementation for all architectures
+    # This ensures we have all required functions
     add_library(
         ${target_name}

package/android/src/main/java/ai/annadata/plugin/capacitor/LlamaCpp.java CHANGED Viewed

@@ -51,6 +51,7 @@ class LlamaContext {
     private LlamaModel model;
     private boolean isMultimodalEnabled = false;
     private boolean isVocoderEnabled = false;
+    private long nativeContextId = -1;
     public LlamaContext(int id) {
         this.id = id;
@@ -83,6 +84,14 @@ class LlamaContext {
     public void setVocoderEnabled(boolean vocoderEnabled) {
         isVocoderEnabled = vocoderEnabled;
     }
+    public long getNativeContextId() {
+        return nativeContextId;
+    }
+    public void setNativeContextId(long nativeContextId) {
+        this.nativeContextId = nativeContextId;
+    }
 }
 class LlamaModel {
@@ -231,16 +240,39 @@ public class LlamaCpp {
     private int contextLimit = 10;
     private boolean nativeLogEnabled = false;
+    // Native method declarations
+    private native long initContextNative(String modelPath, JSObject params);
+    private native void releaseContextNative(long nativeContextId);
+    private native String completionNative(long contextId, String prompt);
+    private native void stopCompletionNative(long contextId);
+    private native String getFormattedChatNative(long contextId, String messages, String chatTemplate);
+    private native boolean toggleNativeLogNative(boolean enabled);
+    static {
+        try {
+            System.loadLibrary("llama-cpp");
+            Log.i(TAG, "Successfully loaded llama-cpp native library");
+        } catch (UnsatisfiedLinkError e) {
+            Log.e(TAG, "Failed to load llama-cpp native library: " + e.getMessage());
+            throw e;
+        }
+    }
     // MARK: - Core initialization and management
     public void toggleNativeLog(boolean enabled, LlamaCallback<Void> callback) {
-        nativeLogEnabled = enabled;
-        if (enabled) {
-            Log.i(TAG, "Native logging enabled");
-        } else {
-            Log.i(TAG, "Native logging disabled");
+        try {
+            boolean result = toggleNativeLogNative(enabled);
+            nativeLogEnabled = enabled;
+            if (enabled) {
+                Log.i(TAG, "Native logging enabled");
+            } else {
+                Log.i(TAG, "Native logging disabled");
+            }
+            callback.onResult(LlamaResult.success(null));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Failed to toggle native log: " + e.getMessage())));
         }
-        callback.onResult(LlamaResult.success(null));
     }
     public void setContextLimit(int limit, LlamaCallback<Void> callback) {
@@ -268,89 +300,70 @@ public class LlamaCpp {
             return;
         }
-        // Extract parameters
-        String modelPath = params.getString("model");
-        if (modelPath == null) {
-            callback.onResult(LlamaResult.failure(new LlamaError("Invalid parameters")));
-            return;
+        try {
+            // Extract parameters
+            String modelPath = params.getString("model");
+            if (modelPath == null || modelPath.isEmpty()) {
+                callback.onResult(LlamaResult.failure(new LlamaError("Model path is required")));
+                return;
+            }
+            // Call native initialization
+            long nativeContextId = initContextNative(modelPath, params);
+            if (nativeContextId < 0) {
+                callback.onResult(LlamaResult.failure(new LlamaError("Failed to initialize native context")));
+                return;
+            }
+            // Create Java context wrapper
+            LlamaContext context = new LlamaContext(contextId);
+            context.setNativeContextId(nativeContextId);
+            contexts.put(contextId, context);
+            // Return context info
+            Map<String, Object> contextInfo = new HashMap<>();
+            contextInfo.put("contextId", contextId);
+            contextInfo.put("gpu", false);
+            contextInfo.put("reasonNoGPU", "Currently not supported");
+            Map<String, Object> modelInfo = new HashMap<>();
+            modelInfo.put("desc", "Loaded model");
+            modelInfo.put("size", 0);
+            modelInfo.put("nEmbd", 0);
+            modelInfo.put("nParams", 0);
+            modelInfo.put("path", modelPath);
+            contextInfo.put("model", modelInfo);
+            contextInfo.put("androidLib", "llama-cpp");
+            callback.onResult(LlamaResult.success(contextInfo));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Context initialization failed: " + e.getMessage())));
         }
-        // Create context
-        LlamaContext context = new LlamaContext(contextId);
-        // Create model info (this would typically load from GGUF file)
-        MinjaCaps defaultCaps = new MinjaCaps(true, true, true, true, true, true);
-        MinjaCaps toolUseCaps = new MinjaCaps(true, true, true, true, true, true);
-        MinjaTemplates minja = new MinjaTemplates(true, defaultCaps, true, toolUseCaps);
-        ChatTemplates chatTemplates = new ChatTemplates(true, minja);
-        LlamaModel model = new LlamaModel(
-            modelPath,
-            "Sample model",
-            0,
-            0,
-            0,
-            chatTemplates,
-            new HashMap<>()
-        );
-        context.setModel(model);
-        contexts.put(contextId, context);
-        // Return context info
-        Map<String, Object> contextInfo = new HashMap<>();
-        contextInfo.put("contextId", contextId);
-        contextInfo.put("gpu", false);
-        contextInfo.put("reasonNoGPU", "Not implemented");
-        Map<String, Object> modelInfo = new HashMap<>();
-        modelInfo.put("desc", model.getDesc());
-        modelInfo.put("size", model.getSize());
-        modelInfo.put("nEmbd", model.getNEmbd());
-        modelInfo.put("nParams", model.getNParams());
-        Map<String, Object> chatTemplatesInfo = new HashMap<>();
-        chatTemplatesInfo.put("llamaChat", model.getChatTemplates().isLlamaChat());
-        Map<String, Object> minjaInfo = new HashMap<>();
-        minjaInfo.put("default", model.getChatTemplates().getMinja().isDefault());
-        Map<String, Object> defaultCapsInfo = new HashMap<>();
-        defaultCapsInfo.put("tools", model.getChatTemplates().getMinja().getDefaultCaps().isTools());
-        defaultCapsInfo.put("toolCalls", model.getChatTemplates().getMinja().getDefaultCaps().isToolCalls());
-        defaultCapsInfo.put("toolResponses", model.getChatTemplates().getMinja().getDefaultCaps().isToolResponses());
-        defaultCapsInfo.put("systemRole", model.getChatTemplates().getMinja().getDefaultCaps().isSystemRole());
-        defaultCapsInfo.put("parallelToolCalls", model.getChatTemplates().getMinja().getDefaultCaps().isParallelToolCalls());
-        defaultCapsInfo.put("toolCallId", model.getChatTemplates().getMinja().getDefaultCaps().isToolCallId());
-        Map<String, Object> toolUseCapsInfo = new HashMap<>();
-        toolUseCapsInfo.put("tools", model.getChatTemplates().getMinja().getToolUseCaps().isTools());
-        toolUseCapsInfo.put("toolCalls", model.getChatTemplates().getMinja().getToolUseCaps().isToolCalls());
-        toolUseCapsInfo.put("toolResponses", model.getChatTemplates().getMinja().getToolUseCaps().isToolResponses());
-        toolUseCapsInfo.put("systemRole", model.getChatTemplates().getMinja().getToolUseCaps().isSystemRole());
-        toolUseCapsInfo.put("parallelToolCalls", model.getChatTemplates().getMinja().getToolUseCaps().isParallelToolCalls());
-        toolUseCapsInfo.put("toolCallId", model.getChatTemplates().getMinja().getToolUseCaps().isToolCallId());
-        minjaInfo.put("defaultCaps", defaultCapsInfo);
-        minjaInfo.put("toolUse", model.getChatTemplates().getMinja().isToolUse());
-        minjaInfo.put("toolUseCaps", toolUseCapsInfo);
-        chatTemplatesInfo.put("minja", minjaInfo);
-        modelInfo.put("chatTemplates", chatTemplatesInfo);
-        modelInfo.put("metadata", model.getMetadata());
-        modelInfo.put("isChatTemplateSupported", true);
-        contextInfo.put("model", modelInfo);
-        callback.onResult(LlamaResult.success(contextInfo));
     }
     public void releaseContext(int contextId, LlamaCallback<Void> callback) {
-        if (contexts.remove(contextId) == null) {
+        LlamaContext context = contexts.get(contextId);
+        if (context == null) {
             callback.onResult(LlamaResult.failure(new LlamaError("Context not found")));
             return;
         }
-        callback.onResult(LlamaResult.success(null));
+        try {
+            // Release native context
+            if (context.getNativeContextId() >= 0) {
+                releaseContextNative(context.getNativeContextId());
+            }
+            // Remove from Java context map
+            contexts.remove(contextId);
+            callback.onResult(LlamaResult.success(null));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Failed to release context: " + e.getMessage())));
+        }
     }
     public void releaseAllContexts(LlamaCallback<Void> callback) {
@@ -367,15 +380,22 @@ public class LlamaCpp {
             return;
         }
-        // This would typically format the chat using the model's chat templates
-        // For now, return a basic formatted chat
-        Map<String, Object> formattedChat = new HashMap<>();
-        formattedChat.put("type", "llama-chat");
-        formattedChat.put("prompt", messages);
-        formattedChat.put("has_media", false);
-        formattedChat.put("media_paths", new String[0]);
-        callback.onResult(LlamaResult.success(formattedChat));
+        try {
+            // Call native formatted chat
+            String result = getFormattedChatNative(context.getNativeContextId(), messages, chatTemplate);
+            // Build formatted chat result
+            Map<String, Object> formattedChat = new HashMap<>();
+            formattedChat.put("type", "llama-chat");
+            formattedChat.put("prompt", result);
+            formattedChat.put("has_media", false);
+            formattedChat.put("media_paths", new String[0]);
+            callback.onResult(LlamaResult.success(formattedChat));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Failed to format chat: " + e.getMessage())));
+        }
     }
     public void completion(int contextId, JSObject params, LlamaCallback<Map<String, Object>> callback) {
@@ -385,48 +405,68 @@ public class LlamaCpp {
             return;
         }
-        // This would typically perform the completion using llama.cpp
-        // For now, return a basic completion result
-        Map<String, Object> completionResult = new HashMap<>();
-        completionResult.put("text", "Sample completion text");
-        completionResult.put("reasoning_content", "");
-        completionResult.put("tool_calls", new Object[0]);
-        completionResult.put("content", "Sample completion text");
-        completionResult.put("chat_format", 0);
-        completionResult.put("tokens_predicted", 0);
-        completionResult.put("tokens_evaluated", 0);
-        completionResult.put("truncated", false);
-        completionResult.put("stopped_eos", false);
-        completionResult.put("stopped_word", "");
-        completionResult.put("stopped_limit", 0);
-        completionResult.put("stopping_word", "");
-        completionResult.put("context_full", false);
-        completionResult.put("interrupted", false);
-        completionResult.put("tokens_cached", 0);
-        Map<String, Object> timings = new HashMap<>();
-        timings.put("prompt_n", 0);
-        timings.put("prompt_ms", 0);
-        timings.put("prompt_per_token_ms", 0);
-        timings.put("prompt_per_second", 0);
-        timings.put("predicted_n", 0);
-        timings.put("predicted_ms", 0);
-        timings.put("predicted_per_token_ms", 0);
-        timings.put("predicted_per_second", 0);
-        completionResult.put("timings", timings);
-        callback.onResult(LlamaResult.success(completionResult));
+        try {
+            // Extract parameters from JSObject
+            String prompt = params.getString("prompt", "");
+            int nPredict = params.getInteger("n_predict", 128);
+            float temperature = params.has("temp") ? (float) params.getDouble("temp") : 0.8f;
+            float topP = params.has("top_p") ? (float) params.getDouble("top_p") : 0.95f;
+            int topK = params.getInteger("top_k", 40);
+            float repeatPenalty = params.has("repeat_penalty") ? (float) params.getDouble("repeat_penalty") : 1.1f;
+            // Call native completion
+            String result = completionNative(context.getNativeContextId(), prompt);
+            // Build completion result
+            Map<String, Object> completionResult = new HashMap<>();
+            completionResult.put("text", result);
+            completionResult.put("reasoning_content", "");
+            completionResult.put("tool_calls", new Object[0]);
+            completionResult.put("content", result);
+            completionResult.put("chat_format", 0);
+            completionResult.put("tokens_predicted", nPredict);
+            completionResult.put("tokens_evaluated", 0);
+            completionResult.put("truncated", false);
+            completionResult.put("stopped_eos", false);
+            completionResult.put("stopped_word", "");
+            completionResult.put("stopped_limit", 0);
+            completionResult.put("stopping_word", "");
+            completionResult.put("context_full", false);
+            completionResult.put("interrupted", false);
+            completionResult.put("tokens_cached", 0);
+            Map<String, Object> timings = new HashMap<>();
+            timings.put("prompt_n", 0);
+            timings.put("prompt_ms", 0);
+            timings.put("prompt_per_token_ms", 0);
+            timings.put("prompt_per_second", 0);
+            timings.put("predicted_n", nPredict);
+            timings.put("predicted_ms", 0);
+            timings.put("predicted_per_token_ms", 0);
+            timings.put("predicted_per_second", 0);
+            completionResult.put("timings", timings);
+            callback.onResult(LlamaResult.success(completionResult));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Completion failed: " + e.getMessage())));
+        }
     }
     public void stopCompletion(int contextId, LlamaCallback<Void> callback) {
-        if (contexts.get(contextId) == null) {
+        LlamaContext context = contexts.get(contextId);
+        if (context == null) {
             callback.onResult(LlamaResult.failure(new LlamaError("Context not found")));
             return;
         }
-        // This would typically stop any ongoing completion
-        callback.onResult(LlamaResult.success(null));
+        try {
+            stopCompletionNative(context.getNativeContextId());
+            callback.onResult(LlamaResult.success(null));
+        } catch (Exception e) {
+            callback.onResult(LlamaResult.failure(new LlamaError("Failed to stop completion: " + e.getMessage())));
+        }
     }
     // MARK: - Session management

package/android/src/main/java/ai/annadata/plugin/capacitor/LlamaCppPlugin.java CHANGED Viewed

@@ -1,5 +1,6 @@
 package ai.annadata.plugin.capacitor;
+import android.util.Log;
 import com.getcapacitor.JSObject;
 import com.getcapacitor.JSArray;
 import com.getcapacitor.Plugin;
@@ -11,9 +12,16 @@ import org.json.JSONException;
 @CapacitorPlugin(name = "LlamaCpp")
 public class LlamaCppPlugin extends Plugin {
+    private static final String TAG = "LlamaCppPlugin";
     private LlamaCpp implementation = new LlamaCpp();
+    @Override
+    public void load() {
+        super.load();
+        Log.i(TAG, "LlamaCppPlugin loaded successfully");
+    }
     // MARK: - Core initialization and management
     @PluginMethod
@@ -72,6 +80,7 @@ public class LlamaCppPlugin extends Plugin {
     @PluginMethod
     public void initContext(PluginCall call) {
+        Log.i(TAG, "initContext called with contextId: " + call.getInt("contextId", 0));
         int contextId = call.getInt("contextId", 0);
         JSObject params = call.getObject("params", new JSObject());

package/android/src/main/jni-utils.h CHANGED Viewed

@@ -87,16 +87,16 @@ void set_static_field(JNIEnv* env, jclass clazz, jfieldID field, ...);
 jobject get_static_field(JNIEnv* env, jclass clazz, jfieldID field);
 // Convert llama_rn_context to jobject
-jobject llama_context_to_jobject(JNIEnv* env, const llama_rn_context* context);
+jobject llama_context_to_jobject(JNIEnv* env, const rnllama::llama_rn_context* context);
 // Convert jobject to llama_rn_context
-llama_rn_context* jobject_to_llama_context(JNIEnv* env, jobject obj);
+rnllama::llama_rn_context* jobject_to_llama_context(JNIEnv* env, jobject obj);
 // Convert completion result to jobject
-jobject completion_result_to_jobject(JNIEnv* env, const completion_token_output& result);
+jobject completion_result_to_jobject(JNIEnv* env, const rnllama::completion_token_output& result);
 // Convert jobject to completion parameters
-completion_params jobject_to_completion_params(JNIEnv* env, jobject obj);
+common_params jobject_to_completion_params(JNIEnv* env, jobject obj);
 // Convert chat parameters to jobject
 jobject chat_params_to_jobject(JNIEnv* env, const common_chat_params& params);
@@ -105,7 +105,7 @@ jobject chat_params_to_jobject(JNIEnv* env, const common_chat_params& params);
 common_chat_params jobject_to_chat_params(JNIEnv* env, jobject obj);
 // Convert tokenize result to jobject
-jobject tokenize_result_to_jobject(JNIEnv* env, const llama_rn_tokenize_result& result);
+jobject tokenize_result_to_jobject(JNIEnv* env, const rnllama::llama_rn_tokenize_result& result);
 // Convert embedding result to jobject
 jobject embedding_result_to_jobject(JNIEnv* env, const std::vector<float>& embedding);

package/android/src/main/jni.cpp CHANGED Viewed

@@ -4,6 +4,11 @@
 #include <cstring>
 #include <memory>
+// Add missing symbol
+namespace rnllama {
+    bool rnllama_verbose = false;
+}
 #define LOG_TAG "LlamaCpp"
 #define LOGI(...) __android_log_print(ANDROID_LOG_INFO, LOG_TAG, __VA_ARGS__)
 #define LOGE(...) __android_log_print(ANDROID_LOG_ERROR, LOG_TAG, __VA_ARGS__)
@@ -123,7 +128,7 @@ jclass find_class(JNIEnv* env, const char* name) {
 }
 // Global context storage
-static std::map<jlong, std::unique_ptr<llama_rn_context>> contexts;
+static std::map<jlong, std::unique_ptr<rnllama::llama_rn_context>> contexts;
 static jlong next_context_id = 1;
 extern "C" {
@@ -136,15 +141,19 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_initContext(
         std::string model_path_str = jstring_to_string(env, model_path);
         // Create new context
-        auto context = std::make_unique<llama_rn_context>();
+        auto context = std::make_unique<rnllama::llama_rn_context>();
-        // Initialize common parameters (simplified)
+        // Initialize common parameters
         common_params cparams;
-        cparams.model = model_path_str;
+        cparams.model.path = model_path_str;
         cparams.n_ctx = 2048;
         cparams.n_batch = 512;
-        cparams.n_threads = 4;
         cparams.n_gpu_layers = 0;
+        cparams.rope_freq_base = 10000.0f;
+        cparams.rope_freq_scale = 1.0f;
+        cparams.use_mmap = true;
+        cparams.use_mlock = false;
+        cparams.numa = LM_GGML_NUMA_STRATEGY_DISABLED;
         // Load model
         if (!context->loadModel(cparams)) {
@@ -156,7 +165,7 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_initContext(
         jlong context_id = next_context_id++;
         contexts[context_id] = std::move(context);
-        LOGI("Initialized context %lld with model: %s", context_id, model_path_str.c_str());
+        LOGI("Initialized context %ld with model: %s", context_id, model_path_str.c_str());
         return context_id;
     } catch (const std::exception& e) {
@@ -174,7 +183,7 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_releaseContext(
         auto it = contexts.find(context_id);
         if (it != contexts.end()) {
             contexts.erase(it);
-            LOGI("Released context %lld", context_id);
+            LOGI("Released context %ld", context_id);
         }
     } catch (const std::exception& e) {
         LOGE("Exception in releaseContext: %s", e.what());
@@ -195,10 +204,14 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_completion(
         std::string prompt_str = jstring_to_string(env, prompt);
-        // Simplified completion (placeholder implementation)
-        std::string result = "Generated text for: " + prompt_str;
+        // Get the context
+        rnllama::llama_rn_context* context = it->second.get();
-        LOGI("Completion for context %lld: %s", context_id, prompt_str.c_str());
+        // For now, return a simple completion
+        // In a full implementation, this would use the actual llama.cpp completion logic
+        std::string result = "Generated response for: " + prompt_str;
+        LOGI("Completion for context %ld: %s", context_id, prompt_str.c_str());
         return string_to_jstring(env, result);
     } catch (const std::exception& e) {
@@ -216,7 +229,7 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_stopCompletion(
         auto it = contexts.find(context_id);
         if (it != contexts.end()) {
             // Stop completion logic would go here
-            LOGI("Stopped completion for context %lld", context_id);
+            LOGI("Stopped completion for context %ld", context_id);
         }
     } catch (const std::exception& e) {
         LOGE("Exception in stopCompletion: %s", e.what());
@@ -238,10 +251,12 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_getFormattedChat(
         std::string messages_str = jstring_to_string(env, messages);
         std::string template_str = jstring_to_string(env, chat_template);
-        // Simplified chat formatting (placeholder implementation)
-        std::string result = "Formatted chat: " + messages_str;
+        rnllama::llama_rn_context* context = it->second.get();
+        // Format chat using the context's method
+        std::string result = context->getFormattedChat(messages_str, template_str);
-        LOGI("Formatted chat for context %lld", context_id);
+        LOGI("Formatted chat for context %ld", context_id);
         return string_to_jstring(env, result);
     } catch (const std::exception& e) {
@@ -256,7 +271,7 @@ Java_ai_annadata_plugin_capacitor_LlamaCpp_toggleNativeLog(
     JNIEnv* env, jobject thiz, jboolean enabled) {
     try {
-        rnllama_verbose = jboolean_to_bool(enabled);
+        rnllama::rnllama_verbose = jboolean_to_bool(enabled);
         LOGI("Native logging %s", enabled ? "enabled" : "disabled");
         return bool_to_jboolean(true);
     } catch (const std::exception& e) {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "llama-cpp-capacitor",
-  "version": "0.0.3",
+  "version": "0.0.5",
   "description": "A native Capacitor plugin that embeds llama.cpp directly into mobile apps, enabling offline AI inference with comprehensive support for text generation, multimodal processing, TTS, LoRA adapters, and more.",
   "main": "dist/plugin.cjs.js",
   "module": "dist/esm/index.js",