npm - web-llm-runner - Versions diffs - 0.1.9 → 0.1.10 - Mend

web-llm-runner 0.1.9 → 0.1.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/lib/index.js +28 -12
package/lib/index.js.map +1 -1
package/lib/wrapper/WebLLMWrapper.d.ts +2 -0
package/lib/wrapper/WebLLMWrapper.d.ts.map +1 -1
package/package.json +1 -1

package/lib/index.js CHANGED Viewed

@@ -986,7 +986,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/Llama-3.2-1B-Instruct-q4f32_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 1128.82,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -998,7 +998,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/Llama-3.2-1B-Instruct-q4f16_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 879.04,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1024,7 +1024,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/Llama-3.2-1B-Instruct-q0f16-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 2573.13,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1036,7 +1036,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/Llama-3.2-3B-Instruct-q4f32_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 2951.51,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1048,7 +1048,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/Llama-3.2-3B-Instruct-q4f16_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 2263.69,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1483,7 +1483,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-360M-Instruct-q0f16-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 871.99,
-            low_resource_required: true,
+            low_resource_required: false,
             required_features: ["shader-f16"],
             overrides: {
                 context_window_size: 4096,
@@ -1496,7 +1496,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-360M-Instruct-q0f32-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 1743.99,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1508,7 +1508,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-360M-Instruct-q4f16_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 376.06,
-            low_resource_required: true,
+            low_resource_required: false,
             required_features: ["shader-f16"],
             overrides: {
                 context_window_size: 4096,
@@ -1521,7 +1521,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-360M-Instruct-q4f32_1-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 579.61,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -1533,7 +1533,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-135M-Instruct-q0f16-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 359.69,
-            low_resource_required: true,
+            low_resource_required: false,
             required_features: ["shader-f16"],
             overrides: {
                 context_window_size: 4096,
@@ -1546,7 +1546,7 @@ const prebuiltAppConfig = {
                 modelVersion +
                 "/SmolLM2-135M-Instruct-q0f32-ctx4k_cs1k-webgpu.wasm",
             vram_required_MB: 719.38,
-            low_resource_required: true,
+            low_resource_required: false,
             overrides: {
                 context_window_size: 4096,
             },
@@ -37983,13 +37983,29 @@ class WebLLM {
     messages = [];
     downloadProgress = {};
     config;
+    isLowResourceDevice = false;
     constructor(config = {}) {
         this.config = config;
         this.messages = this.loadContext();
+        this.detectDevice();
+    }
+    detectDevice() {
+        if (typeof navigator === "undefined")
+            return;
+        const isMobile = /Android|webOS|iPhone|iPad|iPod|BlackBerry|IEMobile|Opera Mini/i.test(navigator.userAgent);
+        const hasWebGPU = !!navigator.gpu;
+        // If it's mobile OR if WebGPU is missing, we consider it a low-resource/fallback device
+        this.isLowResourceDevice = isMobile || !hasWebGPU;
+        console.log(`[WebLLM] Device detection: isMobile=${isMobile}, hasWebGPU=${hasWebGPU} -> isLowResourceDevice=${this.isLowResourceDevice}`);
     }
     // manage_model endpoints
     get models_available() {
-        return prebuiltAppConfig.model_list.map((m) => m.model_id);
+        let list = prebuiltAppConfig.model_list;
+        if (this.isLowResourceDevice) {
+            // Filter for low resource models (mostly ONNX/lightweight ones)
+            list = list.filter(m => m.low_resource_required === true);
+        }
+        return list.map((m) => m.model_id);
     }
     async local_model_available(model_id) {
         return await hasModelInCache(model_id);