npm - @simulatte/doppler - Versions diffs - 0.1.6 → 0.1.7 - Mend

@simulatte/doppler 0.1.6 → 0.1.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (316) hide show

package/CHANGELOG.md +126 -0
package/README.md +16 -23
package/package.json +14 -1
package/src/adapters/adapter-registry.js +12 -1
package/src/adapters/lora-loader.js +23 -6
package/src/bridge/extension-client.d.ts +5 -0
package/src/bridge/extension-client.js +40 -0
package/src/bridge/index.d.ts +2 -1
package/src/bridge/index.js +6 -4
package/src/browser/browser-converter.js +26 -1
package/src/browser/file-picker.js +6 -0
package/src/browser/safetensors-parser-browser.js +84 -1
package/src/browser/shard-io-browser.js +2 -2
package/src/browser/tensor-source-download.js +8 -2
package/src/browser/tensor-source-http.d.ts +1 -0
package/src/browser/tensor-source-http.js +5 -1
package/src/client/doppler-api.browser.js +20 -4
package/src/client/doppler-api.js +19 -3
package/src/client/doppler-provider/generation.js +12 -0
package/src/client/doppler-provider/model-manager.d.ts +10 -0
package/src/client/doppler-provider/model-manager.js +91 -19
package/src/client/doppler-provider/source-runtime.d.ts +2 -1
package/src/client/doppler-provider/source-runtime.js +132 -13
package/src/client/doppler-registry.json +8 -7
package/src/config/backward-registry-loader.js +17 -2
package/src/config/execution-v0-contract-check.js +113 -15
package/src/config/kernel-path-contract-check.js +57 -29
package/src/config/kernel-path-loader.js +5 -36
package/src/config/kernels/kernel-ref-digests.js +1 -1
package/src/config/kernels/registry.js +14 -1
package/src/config/kernels/registry.json +7 -5
package/src/config/loader.d.ts +1 -1
package/src/config/loader.js +12 -2
package/src/config/merge-contract-check.js +59 -4
package/src/config/merge-helpers.js +128 -7
package/src/config/merge.d.ts +1 -0
package/src/config/merge.js +10 -0
package/src/config/param-validator.js +47 -2
package/src/config/presets/kernel-paths/{gemma2-q4k-dequant-f32a.json → gemma2-q4k-dequant-f32a-nosubgroups.json} +3 -3
package/src/config/presets/kernel-paths/gemma3-f16-fused-f32a-online-streamingprefill.json +223 -0
package/src/config/presets/kernel-paths/{gemma3-q4k-dequant-f32a.json → gemma3-q4k-dequant-f32a-nosubgroups.json} +3 -3
package/src/config/presets/kernel-paths/registry.json +29 -8
package/src/config/presets/models/gemma2.json +2 -2
package/src/config/presets/runtime/experiments/bench/gemma3-bench-q4k.json +1 -1
package/src/config/presets/runtime/experiments/debug/gemma3-debug-q4k.json +1 -1
package/src/config/presets/runtime/experiments/verify/gemma3-verify.json +1 -1
package/src/config/presets/runtime/kernels/dequant-f16-q4k.json +6 -13
package/src/config/presets/runtime/kernels/dequant-f32-q4k.json +6 -13
package/src/config/presets/runtime/kernels/embeddinggemma-q4k-dequant-f32a.json +37 -0
package/src/config/presets/runtime/kernels/fused-q4k.json +6 -13
package/src/config/presets/runtime/kernels/gemma2-q4k-dequant-f16a.json +33 -0
package/src/config/presets/runtime/kernels/gemma2-q4k-dequant-f32a-nosubgroups.json +33 -0
package/src/config/presets/runtime/kernels/gemma2-q4k-fused-f32a.json +33 -0
package/src/config/presets/runtime/kernels/safe-q4k.json +6 -13
package/src/config/presets/runtime/platform/metal-apple-q4k.json +1 -1
package/src/config/runtime.js +6 -1
package/src/config/schema/debug.schema.d.ts +5 -0
package/src/config/schema/doppler.schema.js +16 -21
package/src/config/schema/inference-defaults.schema.js +3 -3
package/src/config/schema/kernel-path.schema.d.ts +5 -1
package/src/config/schema/kernel-thresholds.schema.js +12 -4
package/src/config/schema/manifest.schema.d.ts +2 -1
package/src/config/schema/manifest.schema.js +16 -3
package/src/config/training-defaults.js +30 -22
package/src/converter/conversion-plan.js +94 -9
package/src/converter/core.d.ts +7 -0
package/src/converter/core.js +14 -9
package/src/converter/execution-v0-manifest.js +4 -1
package/src/converter/index.d.ts +1 -0
package/src/converter/index.js +1 -0
package/src/converter/manifest-inference.js +43 -12
package/src/converter/parsers/diffusion.js +0 -3
package/src/converter/quantization-info.js +35 -15
package/src/converter/shard-packer.d.ts +1 -1
package/src/converter/shard-packer.js +4 -1
package/src/debug/config.js +123 -11
package/src/debug/signals.js +7 -1
package/src/debug/tensor.d.ts +2 -0
package/src/debug/tensor.js +13 -2
package/src/distribution/p2p-control-plane.js +52 -12
package/src/distribution/p2p-observability.js +43 -7
package/src/distribution/p2p-webrtc-browser.js +20 -0
package/src/distribution/shard-delivery.js +77 -26
package/src/formats/gguf/types.js +33 -16
package/src/formats/rdrr/groups.d.ts +12 -4
package/src/formats/rdrr/groups.js +3 -6
package/src/formats/rdrr/parsing.js +39 -2
package/src/formats/rdrr/types.d.ts +2 -1
package/src/gpu/command-recorder.js +86 -61
package/src/gpu/device.d.ts +1 -0
package/src/gpu/device.js +73 -19
package/src/gpu/kernel-tuner/benchmarks.js +326 -316
package/src/gpu/kernel-tuner/cache.js +71 -4
package/src/gpu/kernel-tuner/tuner.js +22 -4
package/src/gpu/kernels/attention.js +15 -34
package/src/gpu/kernels/backward/adam.js +62 -58
package/src/gpu/kernels/backward/attention_backward.js +257 -169
package/src/gpu/kernels/backward/conv2d_backward.js +14 -1
package/src/gpu/kernels/cast.js +191 -149
package/src/gpu/kernels/check-stop.js +33 -44
package/src/gpu/kernels/conv2d.js +27 -17
package/src/gpu/kernels/cross_entropy_loss.js +21 -15
package/src/gpu/kernels/depthwise_conv2d.js +36 -26
package/src/gpu/kernels/dequant.js +178 -126
package/src/gpu/kernels/energy.d.ts +3 -21
package/src/gpu/kernels/energy.js +111 -88
package/src/gpu/kernels/feature-check.js +1 -1
package/src/gpu/kernels/fused_ffn.js +84 -65
package/src/gpu/kernels/fused_matmul_residual.js +56 -33
package/src/gpu/kernels/fused_matmul_rmsnorm.js +62 -45
package/src/gpu/kernels/gather.js +33 -15
package/src/gpu/kernels/gelu.js +19 -11
package/src/gpu/kernels/grouped_pointwise_conv2d.js +33 -23
package/src/gpu/kernels/groupnorm.js +34 -23
package/src/gpu/kernels/kv-quantize.js +5 -2
package/src/gpu/kernels/layernorm.js +35 -19
package/src/gpu/kernels/logit-merge.js +5 -3
package/src/gpu/kernels/matmul.js +58 -39
package/src/gpu/kernels/modulate.js +23 -15
package/src/gpu/kernels/moe.js +221 -175
package/src/gpu/kernels/pixel_shuffle.js +22 -14
package/src/gpu/kernels/relu.js +18 -10
package/src/gpu/kernels/repeat_channels.js +25 -17
package/src/gpu/kernels/residual.js +37 -27
package/src/gpu/kernels/rmsnorm.js +57 -41
package/src/gpu/kernels/rope.js +3 -0
package/src/gpu/kernels/sample.js +27 -38
package/src/gpu/kernels/sana_linear_attention.js +18 -10
package/src/gpu/kernels/scale.js +18 -11
package/src/gpu/kernels/shader-cache.js +4 -2
package/src/gpu/kernels/silu.js +120 -72
package/src/gpu/kernels/softmax.js +44 -25
package/src/gpu/kernels/split_qkv.js +23 -13
package/src/gpu/kernels/transpose.js +18 -10
package/src/gpu/kernels/transpose.wgsl +5 -3
package/src/gpu/kernels/upsample2d.js +21 -13
package/src/gpu/kernels/utils.js +20 -13
package/src/gpu/partitioned-buffer-pool.js +10 -2
package/src/gpu/perf-guards.js +2 -9
package/src/gpu/profiler.js +27 -22
package/src/gpu/readback-utils.d.ts +16 -0
package/src/gpu/readback-utils.js +41 -0
package/src/gpu/submit-tracker.js +13 -0
package/src/gpu/uniform-cache.d.ts +1 -0
package/src/gpu/uniform-cache.js +30 -9
package/src/hotswap/intent-bundle.js +6 -0
package/src/hotswap/manifest.d.ts +10 -1
package/src/hotswap/manifest.js +12 -2
package/src/hotswap/runtime.js +30 -8
package/src/index-browser.d.ts +44 -0
package/src/index-browser.js +14 -0
package/src/inference/browser-harness-contract-helpers.d.ts +5 -0
package/src/inference/browser-harness-contract-helpers.js +28 -0
package/src/inference/browser-harness-diffusion-energy-suites.d.ts +2 -0
package/src/inference/browser-harness-diffusion-energy-suites.js +269 -0
package/src/inference/browser-harness-model-helpers.d.ts +16 -0
package/src/inference/browser-harness-model-helpers.js +217 -0
package/src/inference/browser-harness-report-helpers.d.ts +7 -0
package/src/inference/browser-harness-report-helpers.js +42 -0
package/src/inference/browser-harness-runtime-helpers.d.ts +61 -0
package/src/inference/browser-harness-runtime-helpers.js +415 -0
package/src/inference/browser-harness-suite-helpers.d.ts +28 -0
package/src/inference/browser-harness-suite-helpers.js +268 -0
package/src/inference/browser-harness-text-helpers.d.ts +27 -0
package/src/inference/browser-harness-text-helpers.js +788 -0
package/src/inference/browser-harness.d.ts +6 -0
package/src/inference/browser-harness.js +130 -1996
package/src/inference/kv-cache/base.js +140 -94
package/src/inference/kv-cache/tiered.js +5 -3
package/src/inference/moe-router.js +88 -56
package/src/inference/multi-model-network.js +5 -3
package/src/inference/network-evolution.d.ts +11 -2
package/src/inference/network-evolution.js +20 -21
package/src/inference/pipelines/context.d.ts +3 -0
package/src/inference/pipelines/context.js +142 -2
package/src/inference/pipelines/diffusion/helpers.js +7 -2
package/src/inference/pipelines/diffusion/pipeline.js +2 -1
package/src/inference/pipelines/diffusion/sd3-transformer.js +10 -10
package/src/inference/pipelines/diffusion/vae.js +3 -7
package/src/inference/pipelines/energy/pipeline.js +27 -21
package/src/inference/pipelines/energy/quintel.d.ts +5 -0
package/src/inference/pipelines/energy/quintel.js +11 -0
package/src/inference/pipelines/energy-head/row-head-pipeline.js +17 -13
package/src/inference/pipelines/structured/json-head-pipeline.js +26 -11
package/src/inference/pipelines/text/attention/projections.js +151 -101
package/src/inference/pipelines/text/attention/record.js +62 -8
package/src/inference/pipelines/text/attention/run.js +62 -8
package/src/inference/pipelines/text/config.js +3 -4
package/src/inference/pipelines/text/embed.js +2 -8
package/src/inference/pipelines/text/execution-plan.js +41 -19
package/src/inference/pipelines/text/execution-v0-contract-helpers.d.ts +59 -0
package/src/inference/pipelines/text/execution-v0-contract-helpers.js +937 -0
package/src/inference/pipelines/text/execution-v0-runtime-builders.d.ts +15 -0
package/src/inference/pipelines/text/execution-v0-runtime-builders.js +279 -0
package/src/inference/pipelines/text/execution-v0.js +62 -1013
package/src/inference/pipelines/text/generator-steps.d.ts +46 -0
package/src/inference/pipelines/text/generator-steps.js +298 -207
package/src/inference/pipelines/text/generator.js +6 -23
package/src/inference/pipelines/text/init.js +78 -20
package/src/inference/pipelines/text/kernel-path-auto-select.js +2 -0
package/src/inference/pipelines/text/kernel-trace.d.ts +2 -0
package/src/inference/pipelines/text/kernel-trace.js +6 -0
package/src/inference/pipelines/text/layer.js +3 -9
package/src/inference/pipelines/text/linear-attention.d.ts +10 -0
package/src/inference/pipelines/text/linear-attention.js +80 -6
package/src/inference/pipelines/text/logits/gpu.js +10 -5
package/src/inference/pipelines/text/logits/index.js +10 -11
package/src/inference/pipelines/text/logits/utils.d.ts +7 -0
package/src/inference/pipelines/text/logits/utils.js +9 -0
package/src/inference/pipelines/text/lora-apply.js +50 -32
package/src/inference/pipelines/text/model-load.js +279 -104
package/src/inference/pipelines/text/moe-cache.js +5 -4
package/src/inference/pipelines/text/moe-cpu-gptoss.js +74 -69
package/src/inference/pipelines/text/moe-cpu.js +42 -38
package/src/inference/pipelines/text/moe-gpu.js +110 -86
package/src/inference/pipelines/text/ops.js +90 -90
package/src/inference/pipelines/text/probes.js +9 -9
package/src/inference/pipelines/text/weights.js +17 -7
package/src/inference/pipelines/text.js +13 -1
package/src/inference/speculative.d.ts +2 -2
package/src/inference/speculative.js +4 -18
package/src/inference/test-harness.d.ts +1 -1
package/src/inference/test-harness.js +15 -5
package/src/inference/tokenizer.d.ts +0 -5
package/src/inference/tokenizer.js +4 -23
package/src/inference/tokenizers/bpe.js +9 -0
package/src/inference/tokenizers/bundled.js +20 -0
package/src/inference/tokenizers/sentencepiece.js +12 -0
package/src/loader/doppler-loader.js +38 -22
package/src/loader/dtype-utils.js +3 -44
package/src/loader/embedding-loader.js +7 -3
package/src/loader/experts/expert-cache.js +13 -6
package/src/loader/experts/expert-loader.js +10 -6
package/src/loader/final-weights-loader.js +8 -4
package/src/loader/layer-loader.js +2 -1
package/src/loader/loader-state.js +2 -2
package/src/loader/memory-monitor.js +8 -0
package/src/loader/multi-model-loader.d.ts +14 -0
package/src/loader/multi-model-loader.js +70 -24
package/src/loader/shard-cache.js +81 -12
package/src/loader/shard-resolver.js +25 -3
package/src/loader/tensors/tensor-loader.js +209 -144
package/src/loader/tensors/tensor-reader.js +76 -19
package/src/loader/weight-downcast.js +1 -1
package/src/memory/buffer-pool.d.ts +9 -1
package/src/memory/buffer-pool.js +109 -44
package/src/memory/unified-detect.js +1 -1
package/src/rules/inference/kernel-path.rules.json +24 -8
package/src/rules/rule-registry.js +25 -1
package/src/storage/backends/opfs-store.js +68 -24
package/src/storage/downloader.js +364 -83
package/src/storage/index.d.ts +3 -0
package/src/storage/index.js +3 -0
package/src/storage/preflight.d.ts +2 -2
package/src/storage/preflight.js +24 -2
package/src/storage/quickstart-downloader.js +11 -5
package/src/storage/registry.js +10 -4
package/src/storage/reports.js +1 -1
package/src/storage/shard-manager.d.ts +15 -1
package/src/storage/shard-manager.js +51 -3
package/src/storage/source-artifact-store.d.ts +52 -0
package/src/storage/source-artifact-store.js +234 -0
package/src/tooling/command-api-constants.d.ts +9 -0
package/src/tooling/command-api-constants.js +9 -0
package/src/tooling/command-api-family-normalizers.d.ts +9 -0
package/src/tooling/command-api-family-normalizers.js +343 -0
package/src/tooling/command-api-helpers.d.ts +25 -0
package/src/tooling/command-api-helpers.js +262 -0
package/src/tooling/command-api.js +16 -602
package/src/tooling/command-envelope.js +4 -1
package/src/tooling/command-runner-shared.js +52 -18
package/src/tooling/lean-execution-contract.js +150 -3
package/src/tooling/node-browser-command-runner.js +161 -271
package/src/tooling/node-command-runner.js +29 -3
package/src/tooling/node-converter.js +27 -1
package/src/tooling/node-source-runtime.d.ts +1 -1
package/src/tooling/node-source-runtime.js +84 -3
package/src/tooling/node-webgpu.js +24 -21
package/src/tooling/opfs-cache.js +21 -4
package/src/tooling/runtime-input-composition.d.ts +38 -0
package/src/tooling/runtime-input-composition.js +86 -0
package/src/tooling/source-runtime-bundle.d.ts +40 -5
package/src/tooling/source-runtime-bundle.js +261 -34
package/src/tooling/source-runtime-materializer.d.ts +6 -0
package/src/tooling/source-runtime-materializer.js +93 -0
package/src/training/attention-backward.js +32 -17
package/src/training/autograd.js +80 -52
package/src/training/checkpoint-watch.d.ts +2 -1
package/src/training/checkpoint-watch.js +39 -6
package/src/training/checkpoint.js +40 -11
package/src/training/clip.js +2 -1
package/src/training/datasets/token-batch.js +20 -8
package/src/training/distillation/checkpoint-watch.js +1 -0
package/src/training/distillation/student-fixture.d.ts +22 -0
package/src/training/distillation/student-fixture.js +846 -0
package/src/training/distillation/suite-data.d.ts +45 -0
package/src/training/distillation/suite-data.js +189 -0
package/src/training/lora-pipeline.js +4 -7
package/src/training/lora.js +26 -12
package/src/training/loss.js +5 -6
package/src/training/objectives/cross_entropy.js +2 -5
package/src/training/objectives/distill_kd.js +4 -8
package/src/training/objectives/distill_triplet.js +4 -8
package/src/training/objectives/ul_stage2_base.js +4 -8
package/src/training/operator-command.js +2 -0
package/src/training/optimizer.js +19 -7
package/src/training/runner.js +2 -1
package/src/training/suite.js +18 -978
package/src/training/tensor-factory.d.ts +9 -0
package/src/training/tensor-factory.js +13 -0
package/src/training/trainer.js +3 -5
package/src/training/ul_dataset.js +3 -5
package/src/training/workloads.js +70 -79
package/src/version.js +1 -1
package/tools/convert-safetensors-node.js +22 -16
package/tools/doppler-cli.js +44 -25

package/src/browser/tensor-source-download.js CHANGED Viewed

@@ -229,9 +229,15 @@ export async function createRemoteTensorSource(url, options = {}) {
   try {
     const source = await createHttpTensorSource(url, options);
     return { source, size: source.size, supportsRange: true };
-  } catch (_error) {
+  } catch (error) {
     if (options.allowDownloadFallback === false) {
-      throw _error;
+      throw error;
+    }
+    if (options.allowDownloadFallback !== true) {
+      const message = error instanceof Error ? error.message : String(error);
+      throw new Error(
+        `HTTP tensor source failed for "${url}" and download fallback is not explicitly enabled: ${message}`
+      );
     }
     const downloaded = await createDownloadTensorSource(url, options);
     return { ...downloaded, supportsRange: false };

package/src/browser/tensor-source-http.d.ts CHANGED Viewed

@@ -13,6 +13,7 @@ export interface HttpRangeProbe {
   size: number | null;
   acceptRanges: string | null;
   contentEncoding: string | null;
+  error?: string | null;
 }
 export interface HttpTensorSourceOptions {

package/src/browser/tensor-source-http.js CHANGED Viewed

@@ -61,7 +61,7 @@ export async function probeHttpRange(url, options = {}) {
       acceptRanges,
       contentEncoding,
     };
-  } catch (_error) {
+  } catch (error) {
     return {
       ok: false,
       status: 0,
@@ -69,6 +69,7 @@ export async function probeHttpRange(url, options = {}) {
       size: null,
       acceptRanges: null,
       contentEncoding: null,
+      error: error instanceof Error ? error.message : String(error),
     };
   }
 }
@@ -76,6 +77,9 @@ export async function probeHttpRange(url, options = {}) {
 export async function createHttpTensorSource(url, options = {}) {
   const { headers, signal, name: overrideName } = options;
   const probe = await probeHttpRange(url, { headers, signal });
+  if (!probe.ok && probe.status === 0 && probe.error) {
+    throw new Error(`HTTP tensor source probe failed for "${url}": ${probe.error}`);
+  }
   if (!probe.supportsRange || probe.size == null) {
     throw new Error('HTTP range requests not supported for tensor source');
   }

package/src/client/doppler-api.browser.js CHANGED Viewed

@@ -227,9 +227,7 @@ async function* dopplerGenerate(prompt, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler() requires options.model.');
   }
-  if (options.runtimeConfig !== undefined || options.runtimePreset !== undefined) {
-    throw new Error('doppler() does not accept load-affecting options. Use doppler.load(model, options) instead.');
-  }
+  assertNoLoadAffectingOptions('doppler()', options);
   const model = await getCachedModel(options.model, { onProgress: options.onProgress });
   yield* model.generate(prompt, options);
 }
@@ -240,10 +238,26 @@ export function doppler(prompt, options) {
 doppler.load = load;
+function assertNoLoadAffectingOptions(apiName, options) {
+  if (!options || typeof options !== 'object') {
+    return;
+  }
+  if (
+    options.runtimeConfig !== undefined
+    || options.runtimePreset !== undefined
+    || options.runtimeConfigUrl !== undefined
+  ) {
+    throw new Error(
+      `${apiName} does not accept load-affecting options. Use doppler.load(model, options) instead.`
+    );
+  }
+}
 doppler.text = async function text(prompt, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler.text() requires options.model.');
   }
+  assertNoLoadAffectingOptions('doppler.text()', options);
   const model = await getCachedModel(options.model, { onProgress: options.onProgress });
   return model.generateText(prompt, options);
 };
@@ -252,6 +266,7 @@ doppler.chat = function chat(messages, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler.chat() requires options.model.');
   }
+  assertNoLoadAffectingOptions('doppler.chat()', options);
   return (async function* run() {
     const model = await getCachedModel(options.model, { onProgress: options.onProgress });
     yield* model.chat(messages, options);
@@ -262,6 +277,7 @@ doppler.chatText = async function chatText(messages, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler.chatText() requires options.model.');
   }
+  assertNoLoadAffectingOptions('doppler.chatText()', options);
   const model = await getCachedModel(options.model, { onProgress: options.onProgress });
   return model.chatText(messages, options);
 };
@@ -284,5 +300,5 @@ doppler.evictAll = async function evictAll() {
 doppler.listModels = async function listModels() {
   const models = await listQuickstartModels();
-  return models.map((entry) => entry.aliases[0] || entry.modelId);
+  return models.map((entry) => entry.modelId);
 };

package/src/client/doppler-api.js CHANGED Viewed

@@ -128,6 +128,21 @@ async function collectText(iterable) {
   return output;
 }
+function assertNoLoadAffectingOptions(apiName, options) {
+  if (!options || typeof options !== 'object') {
+    return;
+  }
+  if (
+    options.runtimeConfig !== undefined
+    || options.runtimePreset !== undefined
+    || options.runtimeConfigUrl !== undefined
+  ) {
+    throw new Error(
+      `${apiName} does not accept load-affecting options. Use doppler.load(model, options) instead.`
+    );
+  }
+}
 function createModelHandle(pipeline, resolved) {
   return {
     generate(prompt, options = {}) {
@@ -246,9 +261,7 @@ async function* dopplerGenerate(prompt, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler() requires options.model.');
   }
-  if (options.runtimeConfig !== undefined || options.runtimePreset !== undefined) {
-    throw new Error('doppler() does not accept load-affecting options. Use doppler.load(model, options) instead.');
-  }
+  assertNoLoadAffectingOptions('doppler()', options);
   const model = await getCachedModel(options.model, { onProgress: options.onProgress });
   yield* model.generate(prompt, options);
 }
@@ -259,12 +272,14 @@ export function doppler(prompt, options) {
 doppler.load = load;
 doppler.text = async function text(prompt, options) {
+  assertNoLoadAffectingOptions('doppler.text()', options);
   return collectText(doppler(prompt, options));
 };
 doppler.chat = function chat(messages, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler.chat() requires options.model.');
   }
+  assertNoLoadAffectingOptions('doppler.chat()', options);
   return (async function* () {
     const model = await getCachedModel(options.model, { onProgress: options.onProgress });
     yield* model.chat(messages, options);
@@ -274,6 +289,7 @@ doppler.chatText = async function chatText(messages, options = {}) {
   if (!options || typeof options !== 'object' || options.model == null) {
     throw new Error('doppler.chatText() requires options.model.');
   }
+  assertNoLoadAffectingOptions('doppler.chatText()', options);
   const model = await getCachedModel(options.model, { onProgress: options.onProgress });
   return model.chatText(messages, options);
 };

package/src/client/doppler-provider/generation.js CHANGED Viewed

@@ -11,6 +11,15 @@ import { getPipeline } from './model-manager.js';
 export { formatGemmaChat, formatLlama3Chat, formatGptOssChat };
+function assertSupportedGenerateOptions(options = {}) {
+  if (Array.isArray(options?.stopTokens) && options.stopTokens.length > 0) {
+    throw new Error(
+      'Doppler provider generate options do not support stopTokens on this surface. ' +
+      'Use stopSequences instead.'
+    );
+  }
+}
 function resolveChatTemplate(pipeline, options) {
   const override = options?.useChatTemplate;
   const runtimeEnabled = pipeline?.runtimeConfig?.inference?.chatTemplate?.enabled;
@@ -21,6 +30,7 @@ function resolveChatTemplate(pipeline, options) {
 }
 export async function* generate(prompt, options = {}) {
+  assertSupportedGenerateOptions(options);
   const pipeline = getPipeline();
   if (!pipeline) {
     throw new Error('No model loaded. Call loadModel() first.');
@@ -52,6 +62,7 @@ export async function* generate(prompt, options = {}) {
 }
 export async function prefillKV(prompt, options = {}) {
+  assertSupportedGenerateOptions(options);
   const pipeline = getPipeline();
   if (!pipeline) {
     throw new Error('No model loaded. Call loadModel() first.');
@@ -61,6 +72,7 @@ export async function prefillKV(prompt, options = {}) {
 }
 export async function* generateWithPrefixKV(prefix, prompt, options = {}) {
+  assertSupportedGenerateOptions(options);
   const pipeline = getPipeline();
   if (!pipeline) {
     throw new Error('No model loaded. Call loadModel() first.');

package/src/client/doppler-provider/model-manager.d.ts CHANGED Viewed

@@ -10,6 +10,16 @@ export declare function getPipeline(): InferencePipeline | null;
 export declare function getCurrentModelId(): string | null;
+export declare function verifyExplicitModelUrlMatch(
+  localManifest: RDRRManifest | Record<string, unknown> | null | undefined,
+  modelUrl: string | null | undefined,
+  fetchRemoteManifest?: (modelUrl: string) => Promise<RDRRManifest | Record<string, unknown> | null>
+): Promise<void>;
+export declare function shouldAutoTuneKernels(
+  runtimeConfig?: Record<string, unknown> | null
+): boolean;
 export declare function extractTextModelConfig(manifest: RDRRManifest): TextModelConfig;
 export declare function readOPFSFile(path: string): Promise<ArrayBuffer>;

package/src/client/doppler-provider/model-manager.js CHANGED Viewed

@@ -20,6 +20,12 @@ import { log } from '../../debug/index.js';
 import { DopplerCapabilities } from './types.js';
 import { GB, HEADER_READ_SIZE } from '../../config/schema/index.js';
 import { resolveBridgeSourceRuntimeBundle } from './source-runtime.js';
+import { getRuntimeConfig } from '../../config/runtime.js';
+import {
+  buildSourceArtifactFingerprint,
+  createStoredSourceArtifactContext,
+  verifyStoredSourceArtifact,
+} from '../../storage/source-artifact-store.js';
 let pipeline = null;
 let currentModelId = null;
@@ -34,6 +40,9 @@ function manifestsDiffer(localManifest, remoteManifest) {
   const localShards = Array.isArray(localManifest.shards) ? localManifest.shards : [];
   const remoteShards = Array.isArray(remoteManifest.shards) ? remoteManifest.shards : [];
   if (localShards.length !== remoteShards.length) return true;
+  if (buildSourceArtifactFingerprint(localManifest) !== buildSourceArtifactFingerprint(remoteManifest)) {
+    return true;
+  }
   for (let i = 0; i < localShards.length; i++) {
     const local = localShards[i];
@@ -61,6 +70,34 @@ async function tryFetchRemoteManifest(modelUrl) {
   return manifest;
 }
+export async function verifyExplicitModelUrlMatch(
+  localManifest,
+  modelUrl,
+  fetchRemoteManifest = tryFetchRemoteManifest
+) {
+  if (!localManifest || !modelUrl) {
+    return;
+  }
+  let remoteManifest = null;
+  try {
+    remoteManifest = await fetchRemoteManifest(modelUrl);
+  } catch (error) {
+    throw new Error(
+      `Could not compare cached manifest with explicit modelUrl "${modelUrl}": ${error.message}`
+    );
+  }
+  if (remoteManifest && manifestsDiffer(localManifest, remoteManifest)) {
+    throw new Error(
+      `Explicit modelUrl "${modelUrl}" does not match the cached manifest for "${localManifest.modelId ?? 'unknown'}". ` +
+      'Clear the cache or load the matching source explicitly.'
+    );
+  }
+}
+export function shouldAutoTuneKernels(runtimeConfig = getRuntimeConfig()) {
+  return runtimeConfig?.shared?.kernelWarmup?.autoTune === true;
+}
 export function getPipeline() {
   return pipeline;
 }
@@ -69,6 +106,14 @@ export function getCurrentModelId() {
   return currentModelId;
 }
+function requireManifestQuantization(manifest) {
+  const quantization = String(manifest?.quantization ?? '').trim();
+  if (!quantization) {
+    throw new Error('Manifest is missing quantization; re-convert the model.');
+  }
+  return quantization.toUpperCase();
+}
 export function extractTextModelConfig(manifest) {
   const arch = (manifest.architecture && typeof manifest.architecture === 'object')
     ? manifest.architecture
@@ -86,12 +131,12 @@ export function extractTextModelConfig(manifest) {
     headDim: arch.headDim,
     vocabSize: arch.vocabSize,
     maxSeqLen: arch.maxSeqLen,
-    quantization: (manifest?.quantization || 'f16').toUpperCase(),
+    quantization: requireManifestQuantization(manifest),
   };
 }
 function estimateDequantizedWeightsBytes(manifest) {
-  const q = (manifest?.quantization || '').toUpperCase();
+  const q = requireManifestQuantization(manifest);
   const total = manifest?.totalSize || 0;
   if (q.startsWith('Q4')) {
     return total * 8;
@@ -243,6 +288,24 @@ export async function loadModel(modelId, modelUrl = null, onProgress = null, loc
           manifest = parseManifest(manifestJson);
           log.info('DopplerProvider', `Loaded manifest via bridge: ${manifest.modelId}`);
           if (onProgress) onProgress({ stage: 'manifest', message: 'Manifest loaded via bridge' });
+          const persistedSourceBundle = await resolveBridgeSourceRuntimeBundle({
+            bridgeClient,
+            localPath,
+            modelId,
+            manifest,
+            verifyHashes: true,
+            onProgress: (progress) => onProgress?.(progress),
+          });
+          if (persistedSourceBundle) {
+            bridgeStorageContext = persistedSourceBundle.storageContext;
+            bridgeSourceMode = true;
+            if (onProgress) {
+              onProgress({
+                stage: 'manifest',
+                message: `Direct-source manifest ready (${persistedSourceBundle.sourceKind} artifact mode)`,
+              });
+            }
+          }
         } catch (manifestError) {
           log.warn(
             'DopplerProvider',
@@ -252,6 +315,7 @@ export async function loadModel(modelId, modelUrl = null, onProgress = null, loc
             bridgeClient,
             localPath,
             modelId,
+            verifyHashes: true,
             onProgress: (progress) => onProgress?.(progress),
           });
           if (!sourceBundle) {
@@ -286,25 +350,26 @@ export async function loadModel(modelId, modelUrl = null, onProgress = null, loc
       let integrity = { valid: false, missingShards: [] };
       if (manifest) {
-        integrity = await verifyIntegrity({ checkHashes: false }).catch(() => ({
-          valid: false,
-          missingShards: [],
-        }));
+        const sourceArtifactFingerprint = buildSourceArtifactFingerprint(manifest);
+        if (sourceArtifactFingerprint) {
+          const sourceIntegrity = await verifyStoredSourceArtifact(manifest, { checkHashes: false }).catch(() => ({
+            valid: false,
+            missingFiles: [],
+          }));
+          integrity = {
+            valid: sourceIntegrity.valid,
+            missingShards: Array.isArray(sourceIntegrity.missingFiles) ? sourceIntegrity.missingFiles : [],
+          };
+        } else {
+          integrity = await verifyIntegrity({ checkHashes: false }).catch(() => ({
+            valid: false,
+            missingShards: [],
+          }));
+        }
       }
       if (integrity.valid && manifest && modelUrl) {
-        try {
-          const remoteManifest = await tryFetchRemoteManifest(modelUrl);
-          if (remoteManifest && manifestsDiffer(manifest, remoteManifest)) {
-            log.info('DopplerProvider', 'Cached model differs from source URL manifest; refreshing cache');
-            integrity = { valid: false, missingShards: [] };
-          }
-        } catch (error) {
-          log.warn(
-            'DopplerProvider',
-            `Could not compare cached manifest with source URL (${error.message}); using cached model`
-          );
-        }
+        await verifyExplicitModelUrlMatch(manifest, modelUrl);
       }
       if (!integrity.valid && modelUrl) {
@@ -365,7 +430,11 @@ export async function loadModel(modelId, modelUrl = null, onProgress = null, loc
       DopplerCapabilities.kernelsWarmed = true;
     }
-    if (!DopplerCapabilities.kernelsTuned && typeof setTimeout !== 'undefined') {
+    if (
+      !DopplerCapabilities.kernelsTuned
+      && shouldAutoTuneKernels()
+      && typeof setTimeout !== 'undefined'
+    ) {
       DopplerCapabilities.kernelsTuned = true;
       const tuneConfig = extractTextModelConfig(manifest);
       setTimeout(() => {
@@ -389,6 +458,9 @@ export async function loadModel(modelId, modelUrl = null, onProgress = null, loc
     const memCaps = await getMemoryCapabilities();
     let storageContext = bridgeStorageContext;
+    if (!storageContext && buildSourceArtifactFingerprint(manifest)) {
+      storageContext = createStoredSourceArtifactContext(manifest, { verifyHashes: true });
+    }
     if (!storageContext && useBridge && DopplerCapabilities.bridgeClient && DopplerCapabilities.localPath) {
       const bridgeClient = DopplerCapabilities.bridgeClient;
       const basePath = DopplerCapabilities.localPath.endsWith('/')

package/src/client/doppler-provider/source-runtime.d.ts CHANGED Viewed

@@ -6,7 +6,9 @@ export interface ResolveBridgeSourceRuntimeBundleOptions {
   bridgeClient: ExtensionBridgeClient;
   localPath: string;
   modelId?: string | null;
+  manifest?: RDRRManifest | null;
   onProgress?: (info: { stage: string; message: string }) => void;
+  verifyHashes?: boolean;
 }
 export interface BridgeSourceRuntimeBundle {
@@ -19,4 +21,3 @@ export interface BridgeSourceRuntimeBundle {
 export declare function resolveBridgeSourceRuntimeBundle(
   options: ResolveBridgeSourceRuntimeBundleOptions
 ): Promise<BridgeSourceRuntimeBundle | null>;

package/src/client/doppler-provider/source-runtime.js CHANGED Viewed

@@ -2,6 +2,7 @@ import {
   createConverterConfig,
   HEADER_READ_SIZE,
 } from '../../config/schema/index.js';
+import { DEFAULT_EXECUTION_V0_SESSION_DEFAULTS } from '../../config/schema/execution-v0.schema.js';
 import { extractArchitecture } from '../../converter/core.js';
 import {
   inferSourceWeightQuantization,
@@ -13,9 +14,11 @@ import { parseTransformerModel } from '../../converter/parsers/transformer.js';
 import { parseGGUFHeader } from '../../formats/gguf/types.js';
 import { parseSafetensorsHeader } from '../../formats/safetensors/types.js';
 import { log } from '../../debug/index.js';
+import { computeHash } from '../../storage/shard-manager.js';
 import {
   buildSourceRuntimeBundle,
   createSourceStorageContext,
+  getSourceRuntimeMetadata,
 } from '../../tooling/source-runtime-bundle.js';
 const SUPPORTED_SOURCE_DTYPES = new Set([
@@ -42,6 +45,15 @@ const SOURCE_RUNTIME_EXECUTION_OVERRIDE = {
   ],
 };
+const SOURCE_RUNTIME_SESSION_DEFAULTS = {
+  compute: {
+    defaults: { ...DEFAULT_EXECUTION_V0_SESSION_DEFAULTS.compute.defaults },
+    kernelProfiles: [],
+  },
+  kvcache: null,
+  decodeLoop: null,
+};
 function normalizeRelativePath(value) {
   return String(value || '')
     .replace(/\\/g, '/')
@@ -166,6 +178,14 @@ async function readBridgeRange(bridgeClient, fileEntry, offset, length) {
   return bridgeClient.read(fileEntry.absolutePath, offset, length);
 }
+async function readBridgeAllBytes(bridgeClient, fileEntry, label) {
+  const size = Number(fileEntry?.size) || 0;
+  if (size < 0) {
+    throw new Error(`Invalid bridge file size for ${label}.`);
+  }
+  return readBridgeRange(bridgeClient, fileEntry, 0, size);
+}
 async function readBridgeTextFile(bridgeClient, fileEntry, label) {
   const size = Number(fileEntry?.size) || 0;
   if (size <= 0) {
@@ -274,7 +294,39 @@ async function parseBridgeSafetensorsModel(bridgeClient, fileIndex) {
         }
         return { path, size: entry.size };
       }),
+    auxiliaryFiles: [
+      { path: 'config.json', size: Number(fileIndex.get('config.json')?.size || 0), kind: 'config' },
+      ...(fileIndex.has('model.safetensors.index.json')
+        ? [{
+          path: 'model.safetensors.index.json',
+          size: Number(fileIndex.get('model.safetensors.index.json')?.size || 0),
+          kind: 'safetensors_index',
+        }]
+        : []),
+      ...(fileIndex.has('tokenizer.json')
+        ? [{
+          path: 'tokenizer.json',
+          size: Number(fileIndex.get('tokenizer.json')?.size || 0),
+          kind: 'tokenizer_json',
+        }]
+        : []),
+      ...(fileIndex.has('tokenizer_config.json')
+        ? [{
+          path: 'tokenizer_config.json',
+          size: Number(fileIndex.get('tokenizer_config.json')?.size || 0),
+          kind: 'tokenizer_config',
+        }]
+        : []),
+      ...(fileIndex.has('tokenizer.model')
+        ? [{
+          path: 'tokenizer.model',
+          size: Number(fileIndex.get('tokenizer.model')?.size || 0),
+          kind: 'tokenizer_model',
+        }]
+        : []),
+    ],
     tokenizerJsonPath: fileIndex.has('tokenizer.json') ? 'tokenizer.json' : null,
+    tokenizerConfigPath: fileIndex.has('tokenizer_config.json') ? 'tokenizer_config.json' : null,
     tokenizerModelPath: fileIndex.has('tokenizer.model') ? 'tokenizer.model' : null,
   };
 }
@@ -339,7 +391,9 @@ async function parseBridgeGGUFModel(bridgeClient, fileIndex, ggufRelativePath) {
     tokenizerConfig: null,
     tokenizerModelName: null,
     sourceFiles: [{ path: ggufRelativePath, size: ggufEntry.size }],
+    auxiliaryFiles: [],
     tokenizerJsonPath: null,
+    tokenizerConfigPath: null,
     tokenizerModelPath: null,
   };
 }
@@ -391,14 +445,7 @@ function createBridgeFileReaders(bridgeClient, fileMap, rootPath) {
       return null;
     }
     const direct = map.get(hint);
-    if (direct) {
-      return direct;
-    }
-    const basename = hint.split('/').pop();
-    if (basename && map.has(basename)) {
-      return map.get(basename);
-    }
-    return null;
+    return direct || null;
   };
   const readRange = async (relativePath, offset, length) => {
@@ -432,10 +479,53 @@ function createBridgeFileReaders(bridgeClient, fileMap, rootPath) {
   };
 }
+async function addHashesToBridgeFiles(bridgeClient, fileIndex, entries, hashAlgorithm) {
+  const hashedEntries = [];
+  for (const entry of Array.isArray(entries) ? entries : []) {
+    const relativePath = normalizeRelativePath(entry?.path);
+    if (!relativePath) continue;
+    const fileEntry = fileIndex.get(relativePath);
+    if (!fileEntry) {
+      throw new Error(`Missing bridge file entry for "${relativePath}"`);
+    }
+    const bytes = await readBridgeAllBytes(bridgeClient, fileEntry, `bridge source asset (${relativePath})`);
+    hashedEntries.push({
+      ...entry,
+      path: relativePath,
+      size: Number.isFinite(entry?.size) ? Math.max(0, Math.floor(Number(entry.size))) : fileEntry.size,
+      hash: await computeHash(toUint8Array(bytes), hashAlgorithm),
+      hashAlgorithm,
+    });
+  }
+  return hashedEntries;
+}
+async function resolveBridgeStorageContext(options = {}) {
+  const bridgeClient = options.bridgeClient;
+  const localPath = options.localPath;
+  const manifest = options.manifest;
+  const sourceRuntime = getSourceRuntimeMetadata(manifest);
+  if (!sourceRuntime) {
+    return null;
+  }
+  const files = await listBridgeFilesRecursive(bridgeClient, localPath);
+  const fileMap = indexBridgeFiles(files);
+  const readers = createBridgeFileReaders(bridgeClient, fileMap, localPath);
+  return createSourceStorageContext({
+    manifest,
+    readRange: readers.readRange,
+    readText: readers.readText,
+    readBinary: readers.readBinary,
+    verifyHashes: options.verifyHashes !== false,
+  });
+}
 export async function resolveBridgeSourceRuntimeBundle(options = {}) {
   const bridgeClient = options.bridgeClient;
   const localPath = options.localPath;
   const requestedModelId = options.modelId || null;
+  const verifyHashes = options.verifyHashes !== false;
+  const existingManifest = options.manifest ?? null;
   if (!bridgeClient || typeof bridgeClient.read !== 'function' || typeof bridgeClient.list !== 'function') {
     throw new Error('Bridge source runtime requires a connected bridge client with read/list support.');
@@ -444,6 +534,21 @@ export async function resolveBridgeSourceRuntimeBundle(options = {}) {
     throw new Error('Bridge source runtime requires localPath.');
   }
+  if (existingManifest && getSourceRuntimeMetadata(existingManifest)) {
+    const storageContext = await resolveBridgeStorageContext({
+      bridgeClient,
+      localPath,
+      manifest: existingManifest,
+      verifyHashes,
+    });
+    return {
+      manifest: existingManifest,
+      storageContext,
+      sourceKind: getSourceRuntimeMetadata(existingManifest)?.sourceKind ?? 'safetensors',
+      sourceRoot: localPath,
+    };
+  }
   options.onProgress?.({
     stage: 'source-discovery',
     message: 'Scanning source files via bridge...',
@@ -461,6 +566,7 @@ export async function resolveBridgeSourceRuntimeBundle(options = {}) {
       modelBaseId: requestedModelId || null,
     },
     inference: {
+      sessionDefaults: SOURCE_RUNTIME_SESSION_DEFAULTS,
       execution: SOURCE_RUNTIME_EXECUTION_OVERRIDE,
     },
   });
@@ -476,26 +582,39 @@ export async function resolveBridgeSourceRuntimeBundle(options = {}) {
   });
   const modelId = resolveModelIdHint(requestedModelId, plan, parsed.sourceKind);
+  const hashAlgorithm = converterConfig.manifest.hashAlgorithm;
+  const files = await listBridgeFilesRecursive(bridgeClient, localPath);
+  const fileMap = indexBridgeFiles(files);
+  const sourceFiles = await addHashesToBridgeFiles(bridgeClient, fileMap, parsed.sourceFiles, hashAlgorithm);
+  const auxiliaryFiles = await addHashesToBridgeFiles(
+    bridgeClient,
+    fileMap,
+    parsed.auxiliaryFiles,
+    hashAlgorithm
+  );
   const { manifest, shardSources } = await buildSourceRuntimeBundle({
     modelId,
     modelName: modelId,
     modelType: plan.modelType,
+    sourceKind: parsed.sourceKind,
     architecture: parsed.architecture,
     architectureHint: parsed.architectureHint,
     rawConfig: parsed.config,
     inference: plan.manifestInference,
     tensors: parsed.tensors,
-    sourceFiles: parsed.sourceFiles,
+    sourceFiles,
+    auxiliaryFiles,
     sourceQuantization: parsed.sourceQuantization,
     quantizationInfo: plan.quantizationInfo,
-    hashAlgorithm: converterConfig.manifest.hashAlgorithm,
+    hashAlgorithm,
     tokenizerJson: parsed.tokenizerJson,
     tokenizerConfig: parsed.tokenizerConfig,
     tokenizerModelName: parsed.tokenizerModelName,
+    tokenizerJsonPath: parsed.tokenizerJsonPath,
+    tokenizerConfigPath: parsed.tokenizerConfigPath,
+    tokenizerModelPath: parsed.tokenizerModelPath,
   });
-  const files = await listBridgeFilesRecursive(bridgeClient, localPath);
-  const fileMap = indexBridgeFiles(files);
   const readers = createBridgeFileReaders(bridgeClient, fileMap, localPath);
   const storageContext = createSourceStorageContext({
     manifest,
@@ -505,7 +624,7 @@ export async function resolveBridgeSourceRuntimeBundle(options = {}) {
     readBinary: readers.readBinary,
     tokenizerJsonPath: parsed.tokenizerJsonPath,
     tokenizerModelPath: parsed.tokenizerModelPath,
-    verifyHashes: false,
+    verifyHashes,
   });
   log.info(