npm - react-native-nitro-mlx - Versions diffs - 0.2.1 → 0.2.2 - Mend

react-native-nitro-mlx 0.2.1 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/ios/Sources/HybridLLM.swift +49 -37
package/package.json +1 -1

package/ios/Sources/HybridLLM.swift CHANGED Viewed

@@ -17,6 +17,7 @@ class HybridLLM: HybridLLMSpec {
     private var modelFactory: ModelFactory = LLMModelFactory.shared
     private var manageHistory: Bool = false
     private var messageHistory: [LLMMessage] = []
+    private var loadTask: Task<Void, Error>?
     var isLoaded: Bool { session != nil }
     var isGenerating: Bool { currentTask != nil }
@@ -61,50 +62,58 @@ class HybridLLM: HybridLLMSpec {
     }
     func load(modelId: String, options: LLMLoadOptions?) throws -> Promise<Void> {
+        self.loadTask?.cancel()
         return Promise.async { [self] in
-            MLX.GPU.set(cacheLimit: 2000000)
-            self.currentTask?.cancel()
-            self.currentTask = nil
-            self.session = nil
-            self.container = nil
-            MLX.GPU.clearCache()
-            let memoryAfterCleanup = self.getMemoryUsage()
-            let gpuAfterCleanup = self.getGPUMemoryUsage()
-            log("After cleanup - Host: \(memoryAfterCleanup), GPU: \(gpuAfterCleanup)")
-            let modelDir = await ModelDownloader.shared.getModelDirectory(modelId: modelId)
-            log("Loading from directory: \(modelDir.path)")
-            let config = ModelConfiguration(directory: modelDir)
-            let loadedContainer = try await modelFactory.loadContainer(
-                configuration: config
-            ) { progress in
-                options?.onProgress?(progress.fractionCompleted)
-            }
+            let task = Task { @MainActor in
+                MLX.GPU.set(cacheLimit: 2000000)
-            let memoryAfterContainer = self.getMemoryUsage()
-            let gpuAfterContainer = self.getGPUMemoryUsage()
-            log("Model loaded - Host: \(memoryAfterContainer), GPU: \(gpuAfterContainer)")
+                self.currentTask?.cancel()
+                self.currentTask = nil
+                self.session = nil
+                self.container = nil
+                MLX.GPU.clearCache()
+                let memoryAfterCleanup = self.getMemoryUsage()
+                let gpuAfterCleanup = self.getGPUMemoryUsage()
+                log("After cleanup - Host: \(memoryAfterCleanup), GPU: \(gpuAfterCleanup)")
+                let modelDir = await ModelDownloader.shared.getModelDirectory(modelId: modelId)
+                log("Loading from directory: \(modelDir.path)")
+                let config = ModelConfiguration(directory: modelDir)
+                let loadedContainer = try await self.modelFactory.loadContainer(
+                    configuration: config
+                ) { progress in
+                    options?.onProgress?(progress.fractionCompleted)
+                }
-            // Convert [LLMMessage]? to [String: Any]?
-            let additionalContextDict: [String: Any]? = if let messages = options?.additionalContext {
-                ["messages": messages.map { ["role": $0.role, "content": $0.content] }]
-            } else {
-                nil
-            }
+                try Task.checkCancellation()
-            self.container = loadedContainer
-            self.session = ChatSession(loadedContainer, instructions: self.systemPrompt, additionalContext: additionalContextDict)
-            self.modelId = modelId
+                let memoryAfterContainer = self.getMemoryUsage()
+                let gpuAfterContainer = self.getGPUMemoryUsage()
+                log("Model loaded - Host: \(memoryAfterContainer), GPU: \(gpuAfterContainer)")
-            self.manageHistory = options?.manageHistory ?? false
-            self.messageHistory = options?.additionalContext ?? []
+                let additionalContextDict: [String: Any]? = if let messages = options?.additionalContext {
+                    ["messages": messages.map { ["role": $0.role, "content": $0.content] }]
+                } else {
+                    nil
+                }
-            if self.manageHistory {
-                log("History management enabled with \(self.messageHistory.count) initial messages")
+                self.container = loadedContainer
+                self.session = ChatSession(loadedContainer, instructions: self.systemPrompt, additionalContext: additionalContextDict)
+                self.modelId = modelId
+                self.manageHistory = options?.manageHistory ?? false
+                self.messageHistory = options?.additionalContext ?? []
+                if self.manageHistory {
+                    log("History management enabled with \(self.messageHistory.count) initial messages")
+                }
             }
+            self.loadTask = task
+            try await task.value
         }
     }
@@ -211,6 +220,9 @@ class HybridLLM: HybridLLMSpec {
     }
     func unload() throws {
+        loadTask?.cancel()
+        loadTask = nil
         let memoryBefore = getMemoryUsage()
         let gpuBefore = getGPUMemoryUsage()
         log("Before unload - Host: \(memoryBefore), GPU: \(gpuBefore)")

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "react-native-nitro-mlx",
-  "version": "0.2.1",
+  "version": "0.2.2",
   "description": "Nitro module package",
   "main": "./lib/module/index.js",
   "module": "./lib/module/index.js",