npm - @inferrlm/react-native-mlx - Versions diffs - 0.4.0 → 0.4.1 - Mend

@inferrlm/react-native-mlx 0.4.0 → 0.4.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (49) hide show

package/MLXReactNative.podspec +1 -1
package/lib/module/index.js +9 -0
package/lib/module/index.js.map +1 -0
package/lib/module/llm.js +193 -0
package/lib/module/llm.js.map +1 -0
package/lib/module/modelManager.js +79 -0
package/lib/module/modelManager.js.map +1 -0
package/lib/module/models.js +360 -0
package/lib/module/models.js.map +1 -0
package/lib/module/package.json +1 -0
package/lib/module/specs/LLM.nitro.js +4 -0
package/lib/module/specs/LLM.nitro.js.map +1 -0
package/lib/module/specs/ModelManager.nitro.js +4 -0
package/lib/module/specs/ModelManager.nitro.js.map +1 -0
package/lib/module/specs/STT.nitro.js +4 -0
package/lib/module/specs/STT.nitro.js.map +1 -0
package/lib/module/specs/TTS.nitro.js +4 -0
package/lib/module/specs/TTS.nitro.js.map +1 -0
package/lib/module/stt.js +49 -0
package/lib/module/stt.js.map +1 -0
package/lib/module/tool-utils.js +56 -0
package/lib/module/tool-utils.js.map +1 -0
package/lib/module/tts.js +40 -0
package/lib/module/tts.js.map +1 -0
package/lib/typescript/package.json +1 -0
package/lib/typescript/src/index.d.ts +11 -0
package/lib/typescript/src/index.d.ts.map +1 -0
package/lib/typescript/src/llm.d.ts +129 -0
package/lib/typescript/src/llm.d.ts.map +1 -0
package/lib/typescript/src/modelManager.d.ts +53 -0
package/lib/typescript/src/modelManager.d.ts.map +1 -0
package/lib/typescript/src/models.d.ts +67 -0
package/lib/typescript/src/models.d.ts.map +1 -0
package/lib/typescript/src/specs/LLM.nitro.d.ts +160 -0
package/lib/typescript/src/specs/LLM.nitro.d.ts.map +1 -0
package/lib/typescript/src/specs/ModelManager.nitro.d.ts +41 -0
package/lib/typescript/src/specs/ModelManager.nitro.d.ts.map +1 -0
package/lib/typescript/src/specs/STT.nitro.d.ts +28 -0
package/lib/typescript/src/specs/STT.nitro.d.ts.map +1 -0
package/lib/typescript/src/specs/TTS.nitro.d.ts +22 -0
package/lib/typescript/src/specs/TTS.nitro.d.ts.map +1 -0
package/lib/typescript/src/stt.d.ts +16 -0
package/lib/typescript/src/stt.d.ts.map +1 -0
package/lib/typescript/src/tool-utils.d.ts +13 -0
package/lib/typescript/src/tool-utils.d.ts.map +1 -0
package/lib/typescript/src/tts.d.ts +13 -0
package/lib/typescript/src/tts.d.ts.map +1 -0
package/package.json +1 -1
package/src/models.ts +24 -0

package/MLXReactNative.podspec CHANGED Viewed

@@ -24,7 +24,7 @@ Pod::Spec.new do |s|
   spm_dependency(s,
     url: "https://github.com/ml-explore/mlx-swift-lm.git",
-    requirement: {kind: "upToNextMinorVersion", minimumVersion: "2.30.3"},
+    requirement: {kind: "branch", branch: "main"},
     products: ["MLXLLM", "MLXLMCommon"]
   )

package/lib/module/index.js ADDED Viewed

@@ -0,0 +1,9 @@
+"use strict";
+export { LLM } from "./llm.js";
+export { ModelManager } from "./modelManager.js";
+export { MLXModel, MLXModels, ModelFamily, ModelProvider } from "./models.js";
+export { createTool } from "./tool-utils.js";
+export { TTS } from "./tts.js";
+export { STT } from "./stt.js";
+//# sourceMappingURL=index.js.map

package/lib/module/index.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"names":["LLM","ModelManager","MLXModel","MLXModels","ModelFamily","ModelProvider","createTool","TTS","STT"],"sourceRoot":"../../src","sources":["index.ts"],"mappings":";;AAAA,SACEA,GAAG,QAKE,UAAO;AACd,SAASC,YAAY,QAAQ,mBAAgB;AAC7C,SACEC,QAAQ,EACRC,SAAS,EACTC,WAAW,EAEXC,aAAa,QAGR,aAAU;AAqBjB,SAASC,UAAU,QAAqC,iBAAc;AACtE,SAASC,GAAG,QAAQ,UAAO;AAM3B,SAASC,GAAG,QAAQ,UAAO","ignoreList":[]}

package/lib/module/llm.js ADDED Viewed

@@ -0,0 +1,193 @@
+"use strict";
+import { NitroModules } from 'react-native-nitro-modules';
+let instance = null;
+function getInstance() {
+  if (!instance) {
+    instance = NitroModules.createHybridObject('LLM');
+  }
+  return instance;
+}
+/**
+ * LLM text generation using MLX on Apple Silicon.
+ *
+ * @example
+ * ```ts
+ * import { LLM } from 'react-native-nitro-mlx'
+ *
+ * // Load a model
+ * await LLM.load('mlx-community/Qwen3-0.6B-4bit', progress => {
+ *   console.log(`Loading: ${(progress * 100).toFixed(0)}%`)
+ * })
+ *
+ * // Stream a response
+ * await LLM.stream('Hello!', token => {
+ *   process.stdout.write(token)
+ * })
+ *
+ * // Get generation stats
+ * const stats = LLM.getLastGenerationStats()
+ * console.log(`${stats.tokensPerSecond} tokens/sec`)
+ * ```
+ */
+export const LLM = {
+  /**
+   * Load a model into memory. Downloads the model from HuggingFace if not already cached.
+   * @param modelId - HuggingFace model ID (e.g., 'mlx-community/Qwen3-0.6B-4bit')
+   * @param options - Callback invoked with loading progress (0-1)
+   */
+  load(modelId, options) {
+    return getInstance().load(modelId, options);
+  },
+  /**
+   * Generate a complete response for a prompt. Blocks until generation is complete.
+   * For streaming responses, use `stream()` instead.
+   * @param prompt - The input text to generate a response for
+   * @returns The complete generated text
+   */
+  generate(prompt) {
+    return getInstance().generate(prompt);
+  },
+  /**
+   * Stream a response token by token with optional tool calling support.
+   * Tools must be provided when loading the model via `load()` options.
+   * Tools are automatically executed when the model calls them.
+   * @param prompt - The input text to generate a response for
+   * @param onToken - Callback invoked for each generated token
+   * @param onToolCall - Optional callback invoked when a tool is called.
+   *   Receives the current tool call and an accumulated array of all tool calls so far.
+   * @returns The complete generated text
+   */
+  stream(prompt, onToken, onToolCall) {
+    const accumulatedToolCalls = [];
+    return getInstance().stream(prompt, onToken, (name, argsJson) => {
+      if (onToolCall) {
+        try {
+          const args = JSON.parse(argsJson);
+          const toolCall = {
+            name,
+            arguments: args
+          };
+          accumulatedToolCalls.push(toolCall);
+          onToolCall({
+            toolCall,
+            allToolCalls: [...accumulatedToolCalls]
+          });
+        } catch {
+          const toolCall = {
+            name,
+            arguments: {}
+          };
+          accumulatedToolCalls.push(toolCall);
+          onToolCall({
+            toolCall,
+            allToolCalls: [...accumulatedToolCalls]
+          });
+        }
+      }
+    });
+  },
+  /**
+   * Stream with typed events for thinking blocks and tool calls.
+   * Provides granular lifecycle events for UI updates.
+   *
+   * @param prompt - The input text
+   * @param onEvent - Callback receiving typed StreamEvent objects
+   * @returns Promise resolving to final content string (thinking content stripped)
+   *
+   * @example
+   * ```ts
+   * await LLM.streamWithEvents(prompt, (event) => {
+   *   switch (event.type) {
+   *     case 'token':
+   *       appendToContent(event.token)
+   *       break
+   *     case 'thinking_start':
+   *       showThinkingIndicator()
+   *       break
+   *     case 'thinking_chunk':
+   *       appendToThinking(event.chunk)
+   *       break
+   *     case 'tool_call_start':
+   *       showToolCallCard(event.name, event.arguments)
+   *       break
+   *   }
+   * })
+   * ```
+   */
+  streamWithEvents(prompt, onEvent) {
+    return getInstance().streamWithEvents(prompt, eventJson => {
+      try {
+        const event = JSON.parse(eventJson);
+        onEvent(event);
+      } catch {
+        // Silently ignore malformed events
+      }
+    });
+  },
+  /**
+   * Stop the current generation. Safe to call even if not generating.
+   */
+  stop() {
+    getInstance().stop();
+  },
+  /**
+   * Unload the current model and release memory.
+   * Call this when you're done with the model to free up memory.
+   */
+  unload() {
+    getInstance().unload();
+  },
+  /**
+   * Get statistics from the last generation.
+   * @returns Statistics including token count, tokens/sec (excluding tool execution), TTFT, total time, and tool execution time
+   */
+  getLastGenerationStats() {
+    return getInstance().getLastGenerationStats();
+  },
+  /**
+   * Get the message history if management is enabled.
+   * @returns Array of messages in the history
+   */
+  getHistory() {
+    return getInstance().getHistory();
+  },
+  /**
+   * Clear the message history.
+   */
+  clearHistory() {
+    getInstance().clearHistory();
+  },
+  /** Whether a model is currently loaded and ready for generation */
+  get isLoaded() {
+    return getInstance().isLoaded;
+  },
+  /** Whether text is currently being generated */
+  get isGenerating() {
+    return getInstance().isGenerating;
+  },
+  /** The ID of the currently loaded model, or empty string if none */
+  get modelId() {
+    return getInstance().modelId;
+  },
+  /** Enable debug logging to console */
+  get debug() {
+    return getInstance().debug;
+  },
+  set debug(value) {
+    getInstance().debug = value;
+  },
+  /**
+   * System prompt used when loading the model.
+   * Set this before calling `load()`. Changes require reloading the model.
+   * @default "You are a helpful assistant."
+   */
+  get systemPrompt() {
+    return getInstance().systemPrompt;
+  },
+  set systemPrompt(value) {
+    getInstance().systemPrompt = value;
+  }
+};
+//# sourceMappingURL=llm.js.map

package/lib/module/llm.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"names":["NitroModules","instance","getInstance","createHybridObject","LLM","load","modelId","options","generate","prompt","stream","onToken","onToolCall","accumulatedToolCalls","name","argsJson","args","JSON","parse","toolCall","arguments","push","allToolCalls","streamWithEvents","onEvent","eventJson","event","stop","unload","getLastGenerationStats","getHistory","clearHistory","isLoaded","isGenerating","debug","value","systemPrompt"],"sourceRoot":"../../src","sources":["llm.ts"],"mappings":";;AAAA,SAASA,YAAY,QAAQ,4BAA4B;AAUzD,IAAIC,QAAwB,GAAG,IAAI;AAiBnC,SAASC,WAAWA,CAAA,EAAY;EAC9B,IAAI,CAACD,QAAQ,EAAE;IACbA,QAAQ,GAAGD,YAAY,CAACG,kBAAkB,CAAU,KAAK,CAAC;EAC5D;EACA,OAAOF,QAAQ;AACjB;;AAEA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA,OAAO,MAAMG,GAAG,GAAG;EACjB;AACF;AACA;AACA;AACA;EACEC,IAAIA,CAACC,OAAe,EAAEC,OAAuB,EAAiB;IAC5D,OAAOL,WAAW,CAAC,CAAC,CAACG,IAAI,CAACC,OAAO,EAAEC,OAAO,CAAC;EAC7C,CAAC;EAED;AACF;AACA;AACA;AACA;AACA;EACEC,QAAQA,CAACC,MAAc,EAAmB;IACxC,OAAOP,WAAW,CAAC,CAAC,CAACM,QAAQ,CAACC,MAAM,CAAC;EACvC,CAAC;EAED;AACF;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;EACEC,MAAMA,CACJD,MAAc,EACdE,OAAgC,EAChCC,UAA6C,EAC5B;IACjB,MAAMC,oBAAoC,GAAG,EAAE;IAE/C,OAAOX,WAAW,CAAC,CAAC,CAACQ,MAAM,CAACD,MAAM,EAAEE,OAAO,EAAE,CAACG,IAAY,EAAEC,QAAgB,KAAK;MAC/E,IAAIH,UAAU,EAAE;QACd,IAAI;UACF,MAAMI,IAAI,GAAGC,IAAI,CAACC,KAAK,CAACH,QAAQ,CAA4B;UAC5D,MAAMI,QAAQ,GAAG;YAAEL,IAAI;YAAEM,SAAS,EAAEJ;UAAK,CAAC;UAC1CH,oBAAoB,CAACQ,IAAI,CAACF,QAAQ,CAAC;UACnCP,UAAU,CAAC;YACTO,QAAQ;YACRG,YAAY,EAAE,CAAC,GAAGT,oBAAoB;UACxC,CAAC,CAAC;QACJ,CAAC,CAAC,MAAM;UACN,MAAMM,QAAQ,GAAG;YAAEL,IAAI;YAAEM,SAAS,EAAE,CAAC;UAAE,CAAC;UACxCP,oBAAoB,CAACQ,IAAI,CAACF,QAAQ,CAAC;UACnCP,UAAU,CAAC;YACTO,QAAQ;YACRG,YAAY,EAAE,CAAC,GAAGT,oBAAoB;UACxC,CAAC,CAAC;QACJ;MACF;IACF,CAAC,CAAC;EACJ,CAAC;EAED;AACF;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;EACEU,gBAAgBA,CAACd,MAAc,EAAEe,OAAsB,EAAmB;IACxE,OAAOtB,WAAW,CAAC,CAAC,CAACqB,gBAAgB,CAACd,MAAM,EAAGgB,SAAiB,IAAK;MACnE,IAAI;QACF,MAAMC,KAAK,GAAGT,IAAI,CAACC,KAAK,CAACO,SAAS,CAAgB;QAClDD,OAAO,CAACE,KAAK,CAAC;MAChB,CAAC,CAAC,MAAM;QACN;MAAA;IAEJ,CAAC,CAAC;EACJ,CAAC;EAED;AACF;AACA;EACEC,IAAIA,CAAA,EAAS;IACXzB,WAAW,CAAC,CAAC,CAACyB,IAAI,CAAC,CAAC;EACtB,CAAC;EAED;AACF;AACA;AACA;EACEC,MAAMA,CAAA,EAAS;IACb1B,WAAW,CAAC,CAAC,CAAC0B,MAAM,CAAC,CAAC;EACxB,CAAC;EAED;AACF;AACA;AACA;EACEC,sBAAsBA,CAAA,EAAoB;IACxC,OAAO3B,WAAW,CAAC,CAAC,CAAC2B,sBAAsB,CAAC,CAAC;EAC/C,CAAC;EAED;AACF;AACA;AACA;EACEC,UAAUA,CAAA,EAAc;IACtB,OAAO5B,WAAW,CAAC,CAAC,CAAC4B,UAAU,CAAC,CAAC;EACnC,CAAC;EAED;AACF;AACA;EACEC,YAAYA,CAAA,EAAS;IACnB7B,WAAW,CAAC,CAAC,CAAC6B,YAAY,CAAC,CAAC;EAC9B,CAAC;EAED;EACA,IAAIC,QAAQA,CAAA,EAAY;IACtB,OAAO9B,WAAW,CAAC,CAAC,CAAC8B,QAAQ;EAC/B,CAAC;EAED;EACA,IAAIC,YAAYA,CAAA,EAAY;IAC1B,OAAO/B,WAAW,CAAC,CAAC,CAAC+B,YAAY;EACnC,CAAC;EAED;EACA,IAAI3B,OAAOA,CAAA,EAAW;IACpB,OAAOJ,WAAW,CAAC,CAAC,CAACI,OAAO;EAC9B,CAAC;EAED;EACA,IAAI4B,KAAKA,CAAA,EAAY;IACnB,OAAOhC,WAAW,CAAC,CAAC,CAACgC,KAAK;EAC5B,CAAC;EAED,IAAIA,KAAKA,CAACC,KAAc,EAAE;IACxBjC,WAAW,CAAC,CAAC,CAACgC,KAAK,GAAGC,KAAK;EAC7B,CAAC;EAED;AACF;AACA;AACA;AACA;EACE,IAAIC,YAAYA,CAAA,EAAW;IACzB,OAAOlC,WAAW,CAAC,CAAC,CAACkC,YAAY;EACnC,CAAC;EAED,IAAIA,YAAYA,CAACD,KAAa,EAAE;IAC9BjC,WAAW,CAAC,CAAC,CAACkC,YAAY,GAAGD,KAAK;EACpC;AACF,CAAC","ignoreList":[]}

package/lib/module/modelManager.js ADDED Viewed

@@ -0,0 +1,79 @@
+"use strict";
+import { NitroModules } from 'react-native-nitro-modules';
+let instance = null;
+function getInstance() {
+  if (!instance) {
+    instance = NitroModules.createHybridObject('ModelManager');
+  }
+  return instance;
+}
+/**
+ * Manage MLX model downloads from HuggingFace.
+ *
+ * @example
+ * ```ts
+ * import { ModelManager } from 'react-native-nitro-mlx'
+ *
+ * // Download a model
+ * await ModelManager.download('mlx-community/Qwen3-0.6B-4bit', progress => {
+ *   console.log(`Downloading: ${(progress * 100).toFixed(0)}%`)
+ * })
+ *
+ * // Check if downloaded
+ * const isReady = await ModelManager.isDownloaded('mlx-community/Qwen3-0.6B-4bit')
+ *
+ * // List all downloaded models
+ * const models = await ModelManager.getDownloadedModels()
+ * ```
+ */
+export const ModelManager = {
+  /**
+   * Download a model from HuggingFace.
+   * @param modelId - HuggingFace model ID (e.g., 'mlx-community/Qwen3-0.6B-4bit')
+   * @param progressCallback - Callback invoked with download progress (0-1)
+   * @returns Path to the downloaded model directory
+   */
+  download(modelId, progressCallback) {
+    return getInstance().download(modelId, progressCallback);
+  },
+  /**
+   * Check if a model is already downloaded.
+   * @param modelId - HuggingFace model ID
+   * @returns True if the model is fully downloaded
+   */
+  isDownloaded(modelId) {
+    return getInstance().isDownloaded(modelId);
+  },
+  /**
+   * Get a list of all downloaded model IDs.
+   * @returns Array of model IDs that are available locally
+   */
+  getDownloadedModels() {
+    return getInstance().getDownloadedModels();
+  },
+  /**
+   * Delete a downloaded model to free up disk space.
+   * @param modelId - HuggingFace model ID
+   */
+  deleteModel(modelId) {
+    return getInstance().deleteModel(modelId);
+  },
+  /**
+   * Get the local filesystem path for a downloaded model.
+   * @param modelId - HuggingFace model ID
+   * @returns Absolute path to the model directory
+   */
+  getModelPath(modelId) {
+    return getInstance().getModelPath(modelId);
+  },
+  /** Enable debug logging to console */
+  get debug() {
+    return getInstance().debug;
+  },
+  set debug(value) {
+    getInstance().debug = value;
+  }
+};
+//# sourceMappingURL=modelManager.js.map

package/lib/module/modelManager.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"names":["NitroModules","instance","getInstance","createHybridObject","ModelManager","download","modelId","progressCallback","isDownloaded","getDownloadedModels","deleteModel","getModelPath","debug","value"],"sourceRoot":"../../src","sources":["modelManager.ts"],"mappings":";;AAAA,SAASA,YAAY,QAAQ,4BAA4B;AAGzD,IAAIC,QAAiC,GAAG,IAAI;AAE5C,SAASC,WAAWA,CAAA,EAAqB;EACvC,IAAI,CAACD,QAAQ,EAAE;IACbA,QAAQ,GAAGD,YAAY,CAACG,kBAAkB,CAAmB,cAAc,CAAC;EAC9E;EACA,OAAOF,QAAQ;AACjB;;AAEA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA,OAAO,MAAMG,YAAY,GAAG;EAC1B;AACF;AACA;AACA;AACA;AACA;EACEC,QAAQA,CACNC,OAAe,EACfC,gBAA4C,EAC3B;IACjB,OAAOL,WAAW,CAAC,CAAC,CAACG,QAAQ,CAACC,OAAO,EAAEC,gBAAgB,CAAC;EAC1D,CAAC;EAED;AACF;AACA;AACA;AACA;EACEC,YAAYA,CAACF,OAAe,EAAoB;IAC9C,OAAOJ,WAAW,CAAC,CAAC,CAACM,YAAY,CAACF,OAAO,CAAC;EAC5C,CAAC;EAED;AACF;AACA;AACA;EACEG,mBAAmBA,CAAA,EAAsB;IACvC,OAAOP,WAAW,CAAC,CAAC,CAACO,mBAAmB,CAAC,CAAC;EAC5C,CAAC;EAED;AACF;AACA;AACA;EACEC,WAAWA,CAACJ,OAAe,EAAiB;IAC1C,OAAOJ,WAAW,CAAC,CAAC,CAACQ,WAAW,CAACJ,OAAO,CAAC;EAC3C,CAAC;EAED;AACF;AACA;AACA;AACA;EACEK,YAAYA,CAACL,OAAe,EAAmB;IAC7C,OAAOJ,WAAW,CAAC,CAAC,CAACS,YAAY,CAACL,OAAO,CAAC;EAC5C,CAAC;EAED;EACA,IAAIM,KAAKA,CAAA,EAAY;IACnB,OAAOV,WAAW,CAAC,CAAC,CAACU,KAAK;EAC5B,CAAC;EAED,IAAIA,KAAKA,CAACC,KAAc,EAAE;IACxBX,WAAW,CAAC,CAAC,CAACU,KAAK,GAAGC,KAAK;EAC7B;AACF,CAAC","ignoreList":[]}

package/lib/module/models.js ADDED Viewed

@@ -0,0 +1,360 @@
+"use strict";
+export let ModelFamily = /*#__PURE__*/function (ModelFamily) {
+  ModelFamily["Llama"] = "Llama";
+  ModelFamily["Qwen"] = "Qwen";
+  ModelFamily["Gemma"] = "Gemma";
+  ModelFamily["Phi"] = "Phi";
+  ModelFamily["SmolLM"] = "SmolLM";
+  ModelFamily["OpenELM"] = "OpenELM";
+  ModelFamily["PocketTTS"] = "PocketTTS";
+  ModelFamily["GLMASR"] = "GLMASR";
+  return ModelFamily;
+}({});
+export let ModelProvider = /*#__PURE__*/function (ModelProvider) {
+  ModelProvider["Meta"] = "Meta";
+  ModelProvider["Alibaba"] = "Alibaba";
+  ModelProvider["Google"] = "Google";
+  ModelProvider["Microsoft"] = "Microsoft";
+  ModelProvider["HuggingFace"] = "HuggingFace";
+  ModelProvider["Apple"] = "Apple";
+  ModelProvider["Kyutai"] = "Kyutai";
+  return ModelProvider;
+}({});
+export let MLXModel = /*#__PURE__*/function (MLXModel) {
+  // Llama 3.2 (Meta) - 1B and 3B variants
+  MLXModel["Llama_3_2_1B_Instruct_4bit"] = "mlx-community/Llama-3.2-1B-Instruct-4bit";
+  MLXModel["Llama_3_2_1B_Instruct_8bit"] = "mlx-community/Llama-3.2-1B-Instruct-8bit";
+  MLXModel["Llama_3_2_3B_Instruct_4bit"] = "mlx-community/Llama-3.2-3B-Instruct-4bit";
+  MLXModel["Llama_3_2_3B_Instruct_8bit"] = "mlx-community/Llama-3.2-3B-Instruct-8bit";
+  // Qwen 2.5 (Alibaba) - 0.5B, 1.5B, 3B variants
+  MLXModel["Qwen2_5_0_5B_Instruct_4bit"] = "mlx-community/Qwen2.5-0.5B-Instruct-4bit";
+  MLXModel["Qwen2_5_0_5B_Instruct_8bit"] = "mlx-community/Qwen2.5-0.5B-Instruct-8bit";
+  MLXModel["Qwen2_5_1_5B_Instruct_4bit"] = "mlx-community/Qwen2.5-1.5B-Instruct-4bit";
+  MLXModel["Qwen2_5_1_5B_Instruct_8bit"] = "mlx-community/Qwen2.5-1.5B-Instruct-8bit";
+  MLXModel["Qwen2_5_3B_Instruct_4bit"] = "mlx-community/Qwen2.5-3B-Instruct-4bit";
+  MLXModel["Qwen2_5_3B_Instruct_8bit"] = "mlx-community/Qwen2.5-3B-Instruct-8bit";
+  // Qwen 3 - 1.7B variant
+  MLXModel["Qwen3_1_7B_4bit"] = "mlx-community/Qwen3-1.7B-4bit";
+  MLXModel["Qwen3_1_7B_8bit"] = "mlx-community/Qwen3-1.7B-8bit";
+  // Qwen 3.5 - 0.8B variant
+  MLXModel["Qwen3_5_0_8B_MLX_4bit"] = "mlx-community/Qwen3.5-0.8B-MLX-4bit";
+  MLXModel["Qwen3_5_0_8B_MLX_8bit"] = "mlx-community/Qwen3.5-0.8B-MLX-8bit";
+  // Gemma 3 (Google) - 1B variant
+  MLXModel["Gemma_3_1B_IT_4bit"] = "mlx-community/gemma-3-1b-it-4bit";
+  MLXModel["Gemma_3_1B_IT_8bit"] = "mlx-community/gemma-3-1b-it-8bit";
+  // Phi 3.5 Mini (Microsoft) - ~3.8B but runs well on mobile
+  MLXModel["Phi_3_5_Mini_Instruct_4bit"] = "mlx-community/Phi-3.5-mini-instruct-4bit";
+  MLXModel["Phi_3_5_Mini_Instruct_8bit"] = "mlx-community/Phi-3.5-mini-instruct-8bit";
+  // Phi 4 Mini (Microsoft)
+  MLXModel["Phi_4_Mini_Instruct_4bit"] = "mlx-community/Phi-4-mini-instruct-4bit";
+  MLXModel["Phi_4_Mini_Instruct_8bit"] = "mlx-community/Phi-4-mini-instruct-8bit";
+  // SmolLM (HuggingFace) - 1.7B
+  MLXModel["SmolLM_1_7B_Instruct_4bit"] = "mlx-community/SmolLM-1.7B-Instruct-4bit";
+  MLXModel["SmolLM_1_7B_Instruct_8bit"] = "mlx-community/SmolLM-1.7B-Instruct-8bit";
+  // SmolLM2 (HuggingFace) - 1.7B
+  MLXModel["SmolLM2_1_7B_Instruct_4bit"] = "mlx-community/SmolLM2-1.7B-Instruct-4bit";
+  MLXModel["SmolLM2_1_7B_Instruct_8bit"] = "mlx-community/SmolLM2-1.7B-Instruct-8bit";
+  // OpenELM (Apple) - 1.1B and 3B
+  MLXModel["OpenELM_1_1B_4bit"] = "mlx-community/OpenELM-1_1B-4bit";
+  MLXModel["OpenELM_1_1B_8bit"] = "mlx-community/OpenELM-1_1B-8bit";
+  MLXModel["OpenELM_3B_4bit"] = "mlx-community/OpenELM-3B-4bit";
+  MLXModel["OpenELM_3B_8bit"] = "mlx-community/OpenELM-3B-8bit";
+  // PocketTTS (Kyutai) - 44.6M
+  MLXModel["PocketTTS"] = "mlx-community/pocket-tts";
+  MLXModel["PocketTTS_8bit"] = "mlx-community/pocket-tts-8bit";
+  MLXModel["PocketTTS_4bit"] = "mlx-community/pocket-tts-4bit";
+  // GLM-ASR (GLMASR) - Speech-to-Text
+  MLXModel["GLM_ASR_Nano_4bit"] = "mlx-community/GLM-ASR-Nano-2512-4bit";
+  return MLXModel;
+}({});
+export const MLXModels = [{
+  id: MLXModel.Llama_3_2_1B_Instruct_4bit,
+  family: ModelFamily.Llama,
+  provider: ModelProvider.Meta,
+  parameters: '1B',
+  quantization: '4bit',
+  displayName: 'Llama 3.2 1B Instruct (4-bit)',
+  downloadSize: 1407777762,
+  type: 'llm'
+}, {
+  id: MLXModel.Llama_3_2_1B_Instruct_8bit,
+  family: ModelFamily.Llama,
+  provider: ModelProvider.Meta,
+  parameters: '1B',
+  quantization: '8bit',
+  displayName: 'Llama 3.2 1B Instruct (8-bit)',
+  downloadSize: 1313157436,
+  type: 'llm'
+}, {
+  id: MLXModel.Llama_3_2_3B_Instruct_4bit,
+  family: ModelFamily.Llama,
+  provider: ModelProvider.Meta,
+  parameters: '3B',
+  quantization: '4bit',
+  displayName: 'Llama 3.2 3B Instruct (4-bit)',
+  downloadSize: 2019397474,
+  type: 'llm'
+}, {
+  id: MLXModel.Llama_3_2_3B_Instruct_8bit,
+  family: ModelFamily.Llama,
+  provider: ModelProvider.Meta,
+  parameters: '3B',
+  quantization: '8bit',
+  displayName: 'Llama 3.2 3B Instruct (8-bit)',
+  downloadSize: 3413784042,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_0_5B_Instruct_4bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '0.5B',
+  quantization: '4bit',
+  displayName: 'Qwen 2.5 0.5B Instruct (4-bit)',
+  downloadSize: 278064920,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_0_5B_Instruct_8bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '0.5B',
+  quantization: '8bit',
+  displayName: 'Qwen 2.5 0.5B Instruct (8-bit)',
+  downloadSize: 525045902,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_1_5B_Instruct_4bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '1.5B',
+  quantization: '4bit',
+  displayName: 'Qwen 2.5 1.5B Instruct (4-bit)',
+  downloadSize: 868628559,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_1_5B_Instruct_8bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '1.5B',
+  quantization: '8bit',
+  displayName: 'Qwen 2.5 1.5B Instruct (8-bit)',
+  downloadSize: 1640414038,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_3B_Instruct_4bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '3B',
+  quantization: '4bit',
+  displayName: 'Qwen 2.5 3B Instruct (4-bit)',
+  downloadSize: 1736293090,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen2_5_3B_Instruct_8bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '3B',
+  quantization: '8bit',
+  displayName: 'Qwen 2.5 3B Instruct (8-bit)',
+  downloadSize: 3279142142,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen3_1_7B_4bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '1.7B',
+  quantization: '4bit',
+  displayName: 'Qwen 3 1.7B (4-bit)',
+  downloadSize: 979502864,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen3_1_7B_8bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '1.7B',
+  quantization: '8bit',
+  displayName: 'Qwen 3 1.7B (8-bit)',
+  downloadSize: 1839729195,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen3_5_0_8B_MLX_4bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '0.8B',
+  quantization: '4bit',
+  displayName: 'Qwen 3.5 0.8B (4-bit)',
+  downloadSize: 550000000,
+  type: 'llm'
+}, {
+  id: MLXModel.Qwen3_5_0_8B_MLX_8bit,
+  family: ModelFamily.Qwen,
+  provider: ModelProvider.Alibaba,
+  parameters: '0.8B',
+  quantization: '8bit',
+  displayName: 'Qwen 3.5 0.8B (8-bit)',
+  downloadSize: 950000000,
+  type: 'llm'
+}, {
+  id: MLXModel.Gemma_3_1B_IT_4bit,
+  family: ModelFamily.Gemma,
+  provider: ModelProvider.Google,
+  parameters: '1B',
+  quantization: '4bit',
+  displayName: 'Gemma 3 1B IT (4-bit)',
+  downloadSize: 770650946,
+  type: 'llm'
+}, {
+  id: MLXModel.Gemma_3_1B_IT_8bit,
+  family: ModelFamily.Gemma,
+  provider: ModelProvider.Google,
+  parameters: '1B',
+  quantization: '8bit',
+  displayName: 'Gemma 3 1B IT (8-bit)',
+  downloadSize: 1421522471,
+  type: 'llm'
+}, {
+  id: MLXModel.Phi_3_5_Mini_Instruct_4bit,
+  family: ModelFamily.Phi,
+  provider: ModelProvider.Microsoft,
+  parameters: '3.8B',
+  quantization: '4bit',
+  displayName: 'Phi 3.5 Mini Instruct (4-bit)',
+  downloadSize: 2150195856,
+  type: 'llm'
+}, {
+  id: MLXModel.Phi_3_5_Mini_Instruct_8bit,
+  family: ModelFamily.Phi,
+  provider: ModelProvider.Microsoft,
+  parameters: '3.8B',
+  quantization: '8bit',
+  displayName: 'Phi 3.5 Mini Instruct (8-bit)',
+  downloadSize: 4060636056,
+  type: 'llm'
+}, {
+  id: MLXModel.Phi_4_Mini_Instruct_4bit,
+  family: ModelFamily.Phi,
+  provider: ModelProvider.Microsoft,
+  parameters: '3.8B',
+  quantization: '4bit',
+  displayName: 'Phi 4 Mini Instruct (4-bit)',
+  downloadSize: 2173624891,
+  type: 'llm'
+}, {
+  id: MLXModel.Phi_4_Mini_Instruct_8bit,
+  family: ModelFamily.Phi,
+  provider: ModelProvider.Microsoft,
+  parameters: '3.8B',
+  quantization: '8bit',
+  displayName: 'Phi 4 Mini Instruct (8-bit)',
+  downloadSize: 4091536167,
+  type: 'llm'
+}, {
+  id: MLXModel.SmolLM_1_7B_Instruct_4bit,
+  family: ModelFamily.SmolLM,
+  provider: ModelProvider.HuggingFace,
+  parameters: '1.7B',
+  quantization: '4bit',
+  displayName: 'SmolLM 1.7B Instruct (4-bit)',
+  downloadSize: 962855374,
+  type: 'llm'
+}, {
+  id: MLXModel.SmolLM_1_7B_Instruct_8bit,
+  family: ModelFamily.SmolLM,
+  provider: ModelProvider.HuggingFace,
+  parameters: '1.7B',
+  quantization: '8bit',
+  displayName: 'SmolLM 1.7B Instruct (8-bit)',
+  downloadSize: 1818493993,
+  type: 'llm'
+}, {
+  id: MLXModel.SmolLM2_1_7B_Instruct_4bit,
+  family: ModelFamily.SmolLM,
+  provider: ModelProvider.HuggingFace,
+  parameters: '1.7B',
+  quantization: '4bit',
+  displayName: 'SmolLM2 1.7B Instruct (4-bit)',
+  downloadSize: 980000000,
+  type: 'llm'
+}, {
+  id: MLXModel.SmolLM2_1_7B_Instruct_8bit,
+  family: ModelFamily.SmolLM,
+  provider: ModelProvider.HuggingFace,
+  parameters: '1.7B',
+  quantization: '8bit',
+  displayName: 'SmolLM2 1.7B Instruct (8-bit)',
+  downloadSize: 1850000000,
+  type: 'llm'
+}, {
+  id: MLXModel.OpenELM_1_1B_4bit,
+  family: ModelFamily.OpenELM,
+  provider: ModelProvider.Apple,
+  parameters: '1.1B',
+  quantization: '4bit',
+  displayName: 'OpenELM 1.1B (4-bit)',
+  downloadSize: 608162655,
+  type: 'llm'
+}, {
+  id: MLXModel.OpenELM_1_1B_8bit,
+  family: ModelFamily.OpenELM,
+  provider: ModelProvider.Apple,
+  parameters: '1.1B',
+  quantization: '8bit',
+  displayName: 'OpenELM 1.1B (8-bit)',
+  downloadSize: 1148048397,
+  type: 'llm'
+}, {
+  id: MLXModel.OpenELM_3B_4bit,
+  family: ModelFamily.OpenELM,
+  provider: ModelProvider.Apple,
+  parameters: '3B',
+  quantization: '4bit',
+  displayName: 'OpenELM 3B (4-bit)',
+  downloadSize: 1650000000,
+  type: 'llm'
+}, {
+  id: MLXModel.OpenELM_3B_8bit,
+  family: ModelFamily.OpenELM,
+  provider: ModelProvider.Apple,
+  parameters: '3B',
+  quantization: '8bit',
+  displayName: 'OpenELM 3B (8-bit)',
+  downloadSize: 3100000000,
+  type: 'llm'
+}, {
+  id: MLXModel.PocketTTS,
+  family: ModelFamily.PocketTTS,
+  provider: ModelProvider.Kyutai,
+  parameters: '44.6M',
+  quantization: 'bf16',
+  displayName: 'PocketTTS (bf16)',
+  downloadSize: 180000000,
+  type: 'tts'
+}, {
+  id: MLXModel.PocketTTS_8bit,
+  family: ModelFamily.PocketTTS,
+  provider: ModelProvider.Kyutai,
+  parameters: '44.6M',
+  quantization: '8bit',
+  displayName: 'PocketTTS (8-bit)',
+  downloadSize: 140000000,
+  type: 'tts'
+}, {
+  id: MLXModel.PocketTTS_4bit,
+  family: ModelFamily.PocketTTS,
+  provider: ModelProvider.Kyutai,
+  parameters: '44.6M',
+  quantization: '4bit',
+  displayName: 'PocketTTS (4-bit)',
+  downloadSize: 80000000,
+  type: 'tts'
+}, {
+  id: MLXModel.GLM_ASR_Nano_4bit,
+  family: ModelFamily.GLMASR,
+  provider: ModelProvider.Alibaba,
+  parameters: '1B',
+  quantization: '4bit',
+  displayName: 'GLM-ASR Nano (4-bit)',
+  downloadSize: 600000000,
+  type: 'stt'
+}];
+//# sourceMappingURL=models.js.map