npm - cui-llama.rn - Versions diffs - 1.5.0 → 1.6.1 - Mend

cui-llama.rn 1.5.0 → 1.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (324) hide show

package/ios/RNLlama.mm CHANGED Viewed

@@ -1,405 +1,423 @@
-#import "RNLlama.h"
-#import "RNLlamaContext.h"
-#ifdef RCT_NEW_ARCH_ENABLED
-#import "RNLlamaSpec.h"
-#endif
-@implementation RNLlama
-NSMutableDictionary *llamaContexts;
-double llamaContextLimit = -1;
-dispatch_queue_t llamaDQueue;
-RCT_EXPORT_MODULE()
-RCT_EXPORT_METHOD(toggleNativeLog:(BOOL)enabled) {
-    void (^onEmitLog)(NSString *level, NSString *text) = nil;
-    if (enabled) {
-        onEmitLog = ^(NSString *level, NSString *text) {
-            [self sendEventWithName:@"@RNLlama_onNativeLog" body:@{ @"level": level, @"text": text }];
-        };
-    }
-    [RNLlamaContext toggleNativeLog:enabled onEmitLog:onEmitLog];
-}
-RCT_EXPORT_METHOD(setContextLimit:(double)limit
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    llamaContextLimit = limit;
-    resolve(nil);
-}
-RCT_EXPORT_METHOD(modelInfo:(NSString *)path
-                 withSkip:(NSArray *)skip
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    resolve([RNLlamaContext modelInfo:path skip:skip]);
-}
-RCT_EXPORT_METHOD(initContext:(double)contextId
-                 withContextParams:(NSDictionary *)contextParams
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    NSNumber *contextIdNumber = [NSNumber numberWithDouble:contextId];
-    if (llamaContexts[contextIdNumber] != nil) {
-        reject(@"llama_error", @"Context already exists", nil);
-        return;
-    }
-    if (llamaDQueue == nil) {
-        llamaDQueue = dispatch_queue_create("com.rnllama", DISPATCH_QUEUE_SERIAL);
-    }
-    if (llamaContexts == nil) {
-        llamaContexts = [[NSMutableDictionary alloc] init];
-    }
-    if (llamaContextLimit > -1 && [llamaContexts count] >= llamaContextLimit) {
-        reject(@"llama_error", @"Context limit reached", nil);
-        return;
-    }
-    @try {
-      RNLlamaContext *context = [RNLlamaContext initWithParams:contextParams onProgress:^(unsigned int progress) {
-          dispatch_async(dispatch_get_main_queue(), ^{
-              [self sendEventWithName:@"@RNLlama_onInitContextProgress" body:@{ @"contextId": @(contextId), @"progress": @(progress) }];
-          });
-      }];
-      if (![context isModelLoaded]) {
-          reject(@"llama_cpp_error", @"Failed to load the model", nil);
-          return;
-      }
-      [llamaContexts setObject:context forKey:contextIdNumber];
-      resolve(@{
-          @"gpu": @([context isMetalEnabled]),
-          @"reasonNoGPU": [context reasonNoMetal],
-          @"model": [context modelInfo],
-      });
-    } @catch (NSException *exception) {
-      reject(@"llama_cpp_error", exception.reason, nil);
-    }
-}
-RCT_EXPORT_METHOD(getFormattedChat:(double)contextId
-                 withMessages:(NSString *)messages
-                 withTemplate:(NSString *)chatTemplate
-                 withParams:(NSDictionary *)params
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    try {
-        if ([params[@"jinja"] boolValue]) {
-            NSString *jsonSchema = params[@"json_schema"];
-            NSString *tools = params[@"tools"];
-            bool parallelToolCalls = [params[@"parallel_tool_calls"] boolValue];
-            NSString *toolChoice = params[@"tool_choice"];
-            resolve([context getFormattedChatWithJinja:messages withChatTemplate:chatTemplate withJsonSchema:jsonSchema withTools:tools withParallelToolCalls:parallelToolCalls withToolChoice:toolChoice]);
-        } else {
-            resolve([context getFormattedChat:messages withChatTemplate:chatTemplate]);
-        }
-    } catch (const std::exception& e) { // catch cpp exceptions
-        reject(@"llama_error", [NSString stringWithUTF8String:e.what()], nil);
-    }
-}
-RCT_EXPORT_METHOD(loadSession:(double)contextId
-                 withFilePath:(NSString *)filePath
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if ([context isPredicting]) {
-        reject(@"llama_error", @"Context is busy", nil);
-        return;
-    }
-    dispatch_async(llamaDQueue, ^{
-        @try {
-            @autoreleasepool {
-                resolve([context loadSession:filePath]);
-            }
-        } @catch (NSException *exception) {
-            reject(@"llama_cpp_error", exception.reason, nil);
-        }
-    });
-}
-RCT_EXPORT_METHOD(saveSession:(double)contextId
-                 withFilePath:(NSString *)filePath
-                 withSize:(double)size
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if ([context isPredicting]) {
-        reject(@"llama_error", @"Context is busy", nil);
-        return;
-    }
-    dispatch_async(llamaDQueue, ^{
-        @try {
-            @autoreleasepool {
-                int count = [context saveSession:filePath size:(int)size];
-                resolve(@(count));
-            }
-        } @catch (NSException *exception) {
-            reject(@"llama_cpp_error", exception.reason, nil);
-        }
-    });
-}
-- (NSArray *)supportedEvents {
-  return@[
-    @"@RNLlama_onInitContextProgress",
-    @"@RNLlama_onToken",
-    @"@RNLlama_onNativeLog",
-  ];
-}
-RCT_EXPORT_METHOD(completion:(double)contextId
-                 withCompletionParams:(NSDictionary *)completionParams
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if ([context isPredicting]) {
-        reject(@"llama_error", @"Context is busy", nil);
-        return;
-    }
-    dispatch_async(llamaDQueue, ^{
-        @try {
-            @autoreleasepool {
-                NSDictionary* completionResult = [context completion:completionParams
-                    onToken:^(NSMutableDictionary *tokenResult) {
-                        if (![completionParams[@"emit_partial_completion"] boolValue]) return;
-                        dispatch_async(dispatch_get_main_queue(), ^{
-                            [self sendEventWithName:@"@RNLlama_onToken"
-                                body:@{
-                                    @"contextId": [NSNumber numberWithDouble:contextId],
-                                    @"tokenResult": tokenResult
-                                }
-                            ];
-                            [tokenResult release];
-                        });
-                    }
-                ];
-                resolve(completionResult);
-            }
-        } @catch (NSException *exception) {
-            reject(@"llama_cpp_error", exception.reason, nil);
-            [context stopCompletion];
-        }
-    });
-}
-RCT_EXPORT_METHOD(stopCompletion:(double)contextId
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    [context stopCompletion];
-    resolve(nil);
-}
-RCT_EXPORT_METHOD(tokenize:(double)contextId
-                  text:(NSString *)text
-                  withResolver:(RCTPromiseResolveBlock)resolve
-                  withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    NSMutableArray *tokens = [context tokenize:text];
-    resolve(@{ @"tokens": tokens });
-    [tokens release];
-}
-RCT_EXPORT_METHOD(detokenize:(double)contextId
-                  tokens:(NSArray *)tokens
-                  withResolver:(RCTPromiseResolveBlock)resolve
-                  withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    resolve([context detokenize:tokens]);
-}
-RCT_EXPORT_METHOD(embedding:(double)contextId
-                  text:(NSString *)text
-                  params:(NSDictionary *)params
-                  withResolver:(RCTPromiseResolveBlock)resolve
-                  withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    @try {
-        NSDictionary *embedding = [context embedding:text params:params];
-        resolve(embedding);
-    } @catch (NSException *exception) {
-        reject(@"llama_cpp_error", exception.reason, nil);
-    }
-}
-RCT_EXPORT_METHOD(bench:(double)contextId
-                  pp:(int)pp
-                  tg:(int)tg
-                  pl:(int)pl
-                  nr:(int)nr
-                  withResolver:(RCTPromiseResolveBlock)resolve
-                  withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    @try {
-        NSString *benchResults = [context bench:pp tg:tg pl:pl nr:nr];
-        resolve(benchResults);
-    } @catch (NSException *exception) {
-        reject(@"llama_cpp_error", exception.reason, nil);
-    }
-}
-RCT_EXPORT_METHOD(applyLoraAdapters:(double)contextId
-                 withLoraAdapters:(NSArray *)loraAdapters
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if ([context isPredicting]) {
-        reject(@"llama_error", @"Context is busy", nil);
-        return;
-    }
-    [context applyLoraAdapters:loraAdapters];
-    resolve(nil);
-}
-RCT_EXPORT_METHOD(removeLoraAdapters:(double)contextId
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if ([context isPredicting]) {
-        reject(@"llama_error", @"Context is busy", nil);
-        return;
-    }
-    [context removeLoraAdapters];
-    resolve(nil);
-}
-RCT_EXPORT_METHOD(getLoadedLoraAdapters:(double)contextId
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    resolve([context getLoadedLoraAdapters]);
-}
-RCT_EXPORT_METHOD(releaseContext:(double)contextId
-                 withResolver:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
-    if (context == nil) {
-        reject(@"llama_error", @"Context not found", nil);
-        return;
-    }
-    if (![context isModelLoaded]) {
-      [context interruptLoad];
-    }
-    [context stopCompletion];
-    dispatch_barrier_sync(llamaDQueue, ^{});
-    [context invalidate];
-    [llamaContexts removeObjectForKey:[NSNumber numberWithDouble:contextId]];
-    resolve(nil);
-}
-RCT_EXPORT_METHOD(releaseAllContexts:(RCTPromiseResolveBlock)resolve
-                 withRejecter:(RCTPromiseRejectBlock)reject)
-{
-    [self invalidate];
-    resolve(nil);
-}
-- (void)invalidate {
-    if (llamaContexts == nil) {
-        return;
-    }
-    for (NSNumber *contextId in llamaContexts) {
-        RNLlamaContext *context = llamaContexts[contextId];
-        [context stopCompletion];
-        dispatch_barrier_sync(llamaDQueue, ^{});
-        [context invalidate];
-    }
-    [llamaContexts removeAllObjects];
-    [llamaContexts release];
-    llamaContexts = nil;
-    if (llamaDQueue != nil) {
-        dispatch_release(llamaDQueue);
-        llamaDQueue = nil;
-    }
-    [super invalidate];
-}
-// Don't compile this code when we build for the old architecture.
-#ifdef RCT_NEW_ARCH_ENABLED
-- (std::shared_ptr<facebook::react::TurboModule>)getTurboModule:
-    (const facebook::react::ObjCTurboModule::InitParams &)params
-{
-    return std::make_shared<facebook::react::NativeRNLlamaSpecJSI>(params);
-}
-#endif
-@end
+#import "RNLlama.h"
+#import "RNLlamaContext.h"
+#ifdef RCT_NEW_ARCH_ENABLED
+#import "RNLlamaSpec.h"
+#endif
+@implementation RNLlama
+NSMutableDictionary *llamaContexts;
+double llamaContextLimit = -1;
+dispatch_queue_t llamaDQueue;
+RCT_EXPORT_MODULE()
+RCT_EXPORT_METHOD(toggleNativeLog:(BOOL)enabled) {
+    void (^onEmitLog)(NSString *level, NSString *text) = nil;
+    if (enabled) {
+        onEmitLog = ^(NSString *level, NSString *text) {
+            [self sendEventWithName:@"@RNLlama_onNativeLog" body:@{ @"level": level, @"text": text }];
+        };
+    }
+    [RNLlamaContext toggleNativeLog:enabled onEmitLog:onEmitLog];
+}
+RCT_EXPORT_METHOD(setContextLimit:(double)limit
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    llamaContextLimit = limit;
+    resolve(nil);
+}
+RCT_EXPORT_METHOD(modelInfo:(NSString *)path
+                 withSkip:(NSArray *)skip
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    resolve([RNLlamaContext modelInfo:path skip:skip]);
+}
+RCT_EXPORT_METHOD(initContext:(double)contextId
+                 withContextParams:(NSDictionary *)contextParams
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    NSNumber *contextIdNumber = [NSNumber numberWithDouble:contextId];
+    if (llamaContexts[contextIdNumber] != nil) {
+        reject(@"llama_error", @"Context already exists", nil);
+        return;
+    }
+    if (llamaDQueue == nil) {
+        llamaDQueue = dispatch_queue_create("com.rnllama", DISPATCH_QUEUE_SERIAL);
+    }
+    if (llamaContexts == nil) {
+        llamaContexts = [[NSMutableDictionary alloc] init];
+    }
+    if (llamaContextLimit > -1 && [llamaContexts count] >= llamaContextLimit) {
+        reject(@"llama_error", @"Context limit reached", nil);
+        return;
+    }
+    @try {
+      RNLlamaContext *context = [RNLlamaContext initWithParams:contextParams onProgress:^(unsigned int progress) {
+          dispatch_async(dispatch_get_main_queue(), ^{
+              [self sendEventWithName:@"@RNLlama_onInitContextProgress" body:@{ @"contextId": @(contextId), @"progress": @(progress) }];
+          });
+      }];
+      if (![context isModelLoaded]) {
+          reject(@"llama_cpp_error", @"Failed to load the model", nil);
+          return;
+      }
+      [llamaContexts setObject:context forKey:contextIdNumber];
+      resolve(@{
+          @"gpu": @([context isMetalEnabled]),
+          @"reasonNoGPU": [context reasonNoMetal],
+          @"model": [context modelInfo],
+      });
+    } @catch (NSException *exception) {
+      reject(@"llama_cpp_error", exception.reason, nil);
+    }
+}
+RCT_EXPORT_METHOD(getFormattedChat:(double)contextId
+                 withMessages:(NSString *)messages
+                 withTemplate:(NSString *)chatTemplate
+                 withParams:(NSDictionary *)params
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    try {
+        if ([params[@"jinja"] boolValue]) {
+            NSString *jsonSchema = params[@"json_schema"];
+            NSString *tools = params[@"tools"];
+            bool parallelToolCalls = [params[@"parallel_tool_calls"] boolValue];
+            NSString *toolChoice = params[@"tool_choice"];
+            resolve([context getFormattedChatWithJinja:messages withChatTemplate:chatTemplate withJsonSchema:jsonSchema withTools:tools withParallelToolCalls:parallelToolCalls withToolChoice:toolChoice]);
+        } else {
+            resolve([context getFormattedChat:messages withChatTemplate:chatTemplate]);
+        }
+    } catch (const nlohmann::json_abi_v3_11_3::detail::parse_error& e) {
+        NSString *errorMessage = [NSString stringWithUTF8String:e.what()];
+        reject(@"llama_error", [NSString stringWithFormat:@"JSON parse error in getFormattedChat: %@", errorMessage], nil);
+    } catch (const std::exception& e) { // catch cpp exceptions
+        reject(@"llama_error", [NSString stringWithUTF8String:e.what()], nil);
+    } catch (...) {
+        reject(@"llama_error", @"Unknown error in getFormattedChat", nil);
+    }
+}
+RCT_EXPORT_METHOD(loadSession:(double)contextId
+                 withFilePath:(NSString *)filePath
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if ([context isPredicting]) {
+        reject(@"llama_error", @"Context is busy", nil);
+        return;
+    }
+    dispatch_async(llamaDQueue, ^{
+        @try {
+            @autoreleasepool {
+                resolve([context loadSession:filePath]);
+            }
+        } @catch (NSException *exception) {
+            reject(@"llama_cpp_error", exception.reason, nil);
+        }
+    });
+}
+RCT_EXPORT_METHOD(saveSession:(double)contextId
+                 withFilePath:(NSString *)filePath
+                 withSize:(double)size
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if ([context isPredicting]) {
+        reject(@"llama_error", @"Context is busy", nil);
+        return;
+    }
+    dispatch_async(llamaDQueue, ^{
+        @try {
+            @autoreleasepool {
+                int count = [context saveSession:filePath size:(int)size];
+                resolve(@(count));
+            }
+        } @catch (NSException *exception) {
+            reject(@"llama_cpp_error", exception.reason, nil);
+        }
+    });
+}
+- (NSArray *)supportedEvents {
+  return@[
+    @"@RNLlama_onInitContextProgress",
+    @"@RNLlama_onToken",
+    @"@RNLlama_onNativeLog",
+  ];
+}
+RCT_EXPORT_METHOD(completion:(double)contextId
+                 withCompletionParams:(NSDictionary *)completionParams
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if ([context isPredicting]) {
+        reject(@"llama_error", @"Context is busy", nil);
+        return;
+    }
+    dispatch_async(llamaDQueue, ^{
+        @try {
+            @autoreleasepool {
+                NSDictionary* completionResult = [context completion:completionParams
+                    onToken:^(NSMutableDictionary *tokenResult) {
+                        if (![completionParams[@"emit_partial_completion"] boolValue]) return;
+                        dispatch_async(dispatch_get_main_queue(), ^{
+                            [self sendEventWithName:@"@RNLlama_onToken"
+                                body:@{
+                                    @"contextId": [NSNumber numberWithDouble:contextId],
+                                    @"tokenResult": tokenResult
+                                }
+                            ];
+                            [tokenResult release];
+                        });
+                    }
+                ];
+                resolve(completionResult);
+            }
+        } @catch (NSException *exception) {
+            reject(@"llama_cpp_error", exception.reason, nil);
+            [context stopCompletion];
+        }
+    });
+}
+RCT_EXPORT_METHOD(stopCompletion:(double)contextId
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    [context stopCompletion];
+    resolve(nil);
+}
+RCT_EXPORT_METHOD(tokenizeASync:(double)contextId
+                  text:(NSString *)text
+                  withResolver:(RCTPromiseResolveBlock)resolve
+                  withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    NSMutableArray *tokens = [context tokenize:text];
+    resolve(@{ @"tokens": tokens });
+    [tokens release];
+}
+RCT_EXPORT_BLOCKING_SYNCHRONOUS_METHOD(tokenizeSync:(double)contextId
+                                       text:(NSString *)text)
+{
+   RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+   if (context == nil) {
+          return @{ @"error": @"Context not found" };
+   }
+   NSMutableArray *tokens = [context tokenize:text];
+   NSDictionary *result = @{ @"tokens": tokens };
+   [tokens release];
+   return result;
+}
+RCT_EXPORT_METHOD(detokenize:(double)contextId
+                  tokens:(NSArray *)tokens
+                  withResolver:(RCTPromiseResolveBlock)resolve
+                  withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    resolve([context detokenize:tokens]);
+}
+RCT_EXPORT_METHOD(embedding:(double)contextId
+                  text:(NSString *)text
+                  params:(NSDictionary *)params
+                  withResolver:(RCTPromiseResolveBlock)resolve
+                  withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    @try {
+        NSDictionary *embedding = [context embedding:text params:params];
+        resolve(embedding);
+    } @catch (NSException *exception) {
+        reject(@"llama_cpp_error", exception.reason, nil);
+    }
+}
+RCT_EXPORT_METHOD(bench:(double)contextId
+                  pp:(int)pp
+                  tg:(int)tg
+                  pl:(int)pl
+                  nr:(int)nr
+                  withResolver:(RCTPromiseResolveBlock)resolve
+                  withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    @try {
+        NSString *benchResults = [context bench:pp tg:tg pl:pl nr:nr];
+        resolve(benchResults);
+    } @catch (NSException *exception) {
+        reject(@"llama_cpp_error", exception.reason, nil);
+    }
+}
+RCT_EXPORT_METHOD(applyLoraAdapters:(double)contextId
+                 withLoraAdapters:(NSArray *)loraAdapters
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if ([context isPredicting]) {
+        reject(@"llama_error", @"Context is busy", nil);
+        return;
+    }
+    [context applyLoraAdapters:loraAdapters];
+    resolve(nil);
+}
+RCT_EXPORT_METHOD(removeLoraAdapters:(double)contextId
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if ([context isPredicting]) {
+        reject(@"llama_error", @"Context is busy", nil);
+        return;
+    }
+    [context removeLoraAdapters];
+    resolve(nil);
+}
+RCT_EXPORT_METHOD(getLoadedLoraAdapters:(double)contextId
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    resolve([context getLoadedLoraAdapters]);
+}
+RCT_EXPORT_METHOD(releaseContext:(double)contextId
+                 withResolver:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    RNLlamaContext *context = llamaContexts[[NSNumber numberWithDouble:contextId]];
+    if (context == nil) {
+        reject(@"llama_error", @"Context not found", nil);
+        return;
+    }
+    if (![context isModelLoaded]) {
+      [context interruptLoad];
+    }
+    [context stopCompletion];
+    dispatch_barrier_sync(llamaDQueue, ^{});
+    [context invalidate];
+    [llamaContexts removeObjectForKey:[NSNumber numberWithDouble:contextId]];
+    resolve(nil);
+}
+RCT_EXPORT_METHOD(releaseAllContexts:(RCTPromiseResolveBlock)resolve
+                 withRejecter:(RCTPromiseRejectBlock)reject)
+{
+    [self invalidate];
+    resolve(nil);
+}
+- (void)invalidate {
+    if (llamaContexts == nil) {
+        return;
+    }
+    for (NSNumber *contextId in llamaContexts) {
+        RNLlamaContext *context = llamaContexts[contextId];
+        [context stopCompletion];
+        dispatch_barrier_sync(llamaDQueue, ^{});
+        [context invalidate];
+    }
+    [llamaContexts removeAllObjects];
+    [llamaContexts release];
+    llamaContexts = nil;
+    if (llamaDQueue != nil) {
+        dispatch_release(llamaDQueue);
+        llamaDQueue = nil;
+    }
+    [super invalidate];
+}
+// Don't compile this code when we build for the old architecture.
+#ifdef RCT_NEW_ARCH_ENABLED
+- (std::shared_ptr<facebook::react::TurboModule>)getTurboModule:
+    (const facebook::react::ObjCTurboModule::InitParams &)params
+{
+    return std::make_shared<facebook::react::NativeRNLlamaSpecJSI>(params);
+}
+#endif
+@end