npm - @simulatte/doppler - Versions diffs - 0.1.5 → 0.1.6 - Mend

@simulatte/doppler 0.1.5 → 0.1.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (130) hide show

package/README.md +23 -8
package/package.json +7 -4
package/src/config/kernels/kernel-ref-digests.js +39 -39
package/src/config/kernels/registry.json +42 -2
package/src/config/loader.js +31 -2
package/src/config/merge.js +18 -0
package/src/config/presets/models/qwen3.json +9 -2
package/src/config/presets/models/transformer.json +5 -0
package/src/config/required-inference-fields-contract-check.js +6 -0
package/src/config/schema/inference-defaults.schema.js +3 -0
package/src/config/schema/inference.schema.d.ts +9 -0
package/src/config/schema/kernel-path.schema.d.ts +6 -0
package/src/config/schema/manifest.schema.d.ts +6 -0
package/src/config/schema/manifest.schema.js +3 -0
package/src/converter/rope-config.js +42 -0
package/src/gpu/device.js +58 -0
package/src/gpu/kernels/attention.js +98 -0
package/src/gpu/kernels/bias_add.wgsl +8 -6
package/src/gpu/kernels/bias_add_f16.wgsl +8 -5
package/src/gpu/kernels/conv2d.js +1 -1
package/src/gpu/kernels/conv2d.wgsl +7 -8
package/src/gpu/kernels/conv2d_f16.wgsl +7 -8
package/src/gpu/kernels/depthwise_conv2d.js +2 -1
package/src/gpu/kernels/depthwise_conv2d.wgsl +6 -9
package/src/gpu/kernels/depthwise_conv2d_f16.wgsl +6 -9
package/src/gpu/kernels/grouped_pointwise_conv2d.js +2 -1
package/src/gpu/kernels/grouped_pointwise_conv2d.wgsl +6 -9
package/src/gpu/kernels/grouped_pointwise_conv2d_f16.wgsl +6 -9
package/src/gpu/kernels/matmul.js +25 -0
package/src/gpu/kernels/pixel_shuffle.js +1 -1
package/src/gpu/kernels/pixel_shuffle.wgsl +4 -5
package/src/gpu/kernels/pixel_shuffle_f16.wgsl +4 -5
package/src/gpu/kernels/relu.js +15 -2
package/src/gpu/kernels/relu.wgsl +2 -1
package/src/gpu/kernels/relu_f16.wgsl +2 -1
package/src/gpu/kernels/repeat_channels.js +1 -1
package/src/gpu/kernels/repeat_channels.wgsl +4 -5
package/src/gpu/kernels/repeat_channels_f16.wgsl +4 -5
package/src/gpu/kernels/residual.js +44 -8
package/src/gpu/kernels/residual.wgsl +6 -3
package/src/gpu/kernels/residual_f16.wgsl +2 -1
package/src/gpu/kernels/residual_f16_vec4.wgsl +2 -1
package/src/gpu/kernels/residual_vec4.wgsl +2 -1
package/src/gpu/kernels/rmsnorm.js +58 -6
package/src/gpu/kernels/rmsnorm.wgsl +14 -6
package/src/gpu/kernels/rmsnorm_f16.wgsl +10 -2
package/src/gpu/kernels/rope.d.ts +2 -0
package/src/gpu/kernels/rope.js +11 -1
package/src/gpu/kernels/rope.wgsl +56 -40
package/src/gpu/kernels/sana_linear_attention.js +1 -2
package/src/gpu/kernels/sana_linear_attention_apply.wgsl +4 -5
package/src/gpu/kernels/sana_linear_attention_apply_f16.wgsl +4 -5
package/src/gpu/kernels/sana_linear_attention_summary.wgsl +4 -0
package/src/gpu/kernels/sana_linear_attention_summary_f16.wgsl +4 -0
package/src/gpu/kernels/silu.d.ts +1 -0
package/src/gpu/kernels/silu.js +32 -14
package/src/gpu/kernels/silu.wgsl +19 -9
package/src/gpu/kernels/silu_f16.wgsl +19 -9
package/src/gpu/kernels/transpose.js +15 -2
package/src/gpu/kernels/transpose.wgsl +5 -6
package/src/gpu/kernels/upsample2d.js +2 -1
package/src/gpu/kernels/upsample2d.wgsl +6 -9
package/src/gpu/kernels/upsample2d_f16.wgsl +6 -9
package/src/gpu/kernels/utils.js +16 -1
package/src/inference/browser-harness.js +47 -1
package/src/inference/pipelines/diffusion/pipeline.js +15 -6
package/src/inference/pipelines/diffusion/text-encoder-gpu.d.ts +5 -0
package/src/inference/pipelines/diffusion/text-encoder-gpu.js +27 -15
package/src/inference/pipelines/text/attention/record.js +11 -2
package/src/inference/pipelines/text/attention/run.js +11 -2
package/src/inference/pipelines/text/chat-format.js +25 -1
package/src/inference/pipelines/text/config.d.ts +4 -0
package/src/inference/pipelines/text/config.js +68 -1
package/src/inference/pipelines/text/execution-plan.js +23 -31
package/src/inference/pipelines/text/execution-v0.js +29 -2
package/src/inference/pipelines/text/ffn/standard.js +3 -0
package/src/inference/pipelines/text/init.d.ts +4 -0
package/src/inference/pipelines/text/init.js +56 -9
package/src/inference/pipelines/text/layer.js +11 -0
package/src/inference/pipelines/text.js +4 -0
package/src/inference/tokenizers/bundled.js +156 -33
package/src/rules/tooling/command-runtime.rules.json +18 -0
package/src/tooling/command-api.d.ts +27 -1
package/src/tooling/command-api.js +142 -3
package/src/tooling/node-browser-command-runner.d.ts +4 -0
package/src/tooling/node-browser-command-runner.js +58 -3
package/src/tooling/node-command-runner.js +15 -0
package/src/tooling/node-webgpu.js +9 -87
package/src/training/checkpoint-watch.d.ts +7 -0
package/src/training/checkpoint-watch.js +106 -0
package/src/training/checkpoint.d.ts +6 -1
package/src/training/checkpoint.js +12 -2
package/src/training/distillation/artifacts.d.ts +71 -0
package/src/training/distillation/artifacts.js +132 -0
package/src/training/distillation/checkpoint-watch.d.ts +10 -0
package/src/training/distillation/checkpoint-watch.js +57 -0
package/src/training/distillation/dataset.d.ts +59 -0
package/src/training/distillation/dataset.js +337 -0
package/src/training/distillation/eval.d.ts +34 -0
package/src/training/distillation/eval.js +310 -0
package/src/training/distillation/index.d.ts +29 -0
package/src/training/distillation/index.js +29 -0
package/src/training/distillation/runtime.d.ts +20 -0
package/src/training/distillation/runtime.js +121 -0
package/src/training/distillation/scoreboard.d.ts +6 -0
package/src/training/distillation/scoreboard.js +8 -0
package/src/training/distillation/stage-a.d.ts +45 -0
package/src/training/distillation/stage-a.js +338 -0
package/src/training/distillation/stage-b.d.ts +24 -0
package/src/training/distillation/stage-b.js +20 -0
package/src/training/index.d.ts +10 -0
package/src/training/index.js +10 -0
package/src/training/lora-pipeline.d.ts +40 -0
package/src/training/lora-pipeline.js +796 -0
package/src/training/operator-artifacts.d.ts +62 -0
package/src/training/operator-artifacts.js +140 -0
package/src/training/operator-command.d.ts +5 -0
package/src/training/operator-command.js +453 -0
package/src/training/operator-eval.d.ts +48 -0
package/src/training/operator-eval.js +230 -0
package/src/training/operator-scoreboard.d.ts +5 -0
package/src/training/operator-scoreboard.js +44 -0
package/src/training/runner.d.ts +52 -0
package/src/training/runner.js +29 -4
package/src/training/suite.d.ts +112 -0
package/src/training/suite.js +9 -9
package/src/training/workloads.d.ts +164 -0
package/src/training/workloads.js +539 -0
package/src/version.js +1 -1
package/tools/doppler-cli.js +137 -40

package/README.md CHANGED Viewed

@@ -22,7 +22,7 @@ for await (const token of model.generate('Hello, world')) {
 }
 ```
-Registry IDs resolve to hosted RDRR artifacts from `Clocksmith/rdrr` by default. Tokens stream from a native `AsyncGenerator`. See [more examples](#more-examples) below or the canonical [Root API guide](docs/api/root.md).
+Registry IDs resolve to hosted RDRR artifacts from `Clocksmith/rdrr` by default. Tokens stream from a native `AsyncGenerator`. See [more examples](#more-examples) below or the canonical [Root API guide](https://github.com/clocksmith/doppler/blob/main/docs/api/root.md).
 ## Why Doppler
@@ -36,11 +36,11 @@ Registry IDs resolve to hosted RDRR artifacts from `Clocksmith/rdrr` by default.
 ## Evidence
-![Phase-latency comparison on one workload across models](benchmarks/vendors/results/compare_1b_multi-workload_favorable_phases.svg)
+![Phase-latency comparison on one workload across models](https://raw.githubusercontent.com/clocksmith/doppler/main/benchmarks/vendors/results/compare_1b_multi-workload_favorable_phases.svg)
 Snapshot artifacts:
-- [g3-1b-p064-d064-t0-k1.compare.json](benchmarks/vendors/fixtures/g3-1b-p064-d064-t0-k1.compare.json)
-- [lfm2-5-1-2b-p064-d064-t0-k1.compare.json](benchmarks/vendors/fixtures/lfm2-5-1-2b-p064-d064-t0-k1.compare.json)
+- [g3-1b-p064-d064-t0-k1.compare.json](https://github.com/clocksmith/doppler/blob/main/benchmarks/vendors/fixtures/g3-1b-p064-d064-t0-k1.compare.json)
+- [lfm2-5-1-2b-p064-d064-t0-k1.compare.json](https://github.com/clocksmith/doppler/blob/main/benchmarks/vendors/fixtures/lfm2-5-1-2b-p064-d064-t0-k1.compare.json)
 ## Under the hood
@@ -77,10 +77,25 @@ for await (const token of doppler('Hello', { model: 'gemma3-270m' })) {
 ## Documentation
-- Docs index (canonical navigation): [docs/INDEX.md](docs/INDEX.md)
-- First-run workflow: [docs/getting-started.md](docs/getting-started.md)
-- Runtime config contract: [docs/config.md](docs/config.md)
-- Architecture: [docs/architecture.md](docs/architecture.md)
+- Docs index (canonical navigation): [docs/INDEX.md](https://github.com/clocksmith/doppler/blob/main/docs/INDEX.md)
+- First-run workflow: [docs/getting-started.md](https://github.com/clocksmith/doppler/blob/main/docs/getting-started.md)
+- Runtime config contract: [docs/config.md](https://github.com/clocksmith/doppler/blob/main/docs/config.md)
+- Architecture: [docs/architecture.md](https://github.com/clocksmith/doppler/blob/main/docs/architecture.md)
+- Generated model support table: [docs/model-support-matrix.md](https://github.com/clocksmith/doppler/blob/main/docs/model-support-matrix.md)
+## Current model support
+Verified right now:
+- `gemma-3-270m-it-wq4k-ef16-hf16`
+- `gemma-3-1b-it-wq4k-ef16-hf16`
+- `google-embeddinggemma-300m-wq4k-ef16`
+- `translategemma-4b-it-wq4k-ef16-hf16`
+Known failing right now:
+- `qwen-3-5-0-8b-wq4k-ef16-hf16-f16`
+- `qwen-3-5-2b-wq4k-ef16-hf16-f16`
+For the generated status table, including `loads but unverified` and `everything else`, see [docs/model-support-matrix.md](https://github.com/clocksmith/doppler/blob/main/docs/model-support-matrix.md).
 ## Environment requirements

package/package.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
   "name": "@simulatte/doppler",
-  "version": "0.1.5",
+  "version": "0.1.6",
   "description": "Browser-native WebGPU inference engine for local intent and inference loops",
   "main": "src/index.js",
   "types": "src/index.d.ts",
   "type": "module",
   "bin": {
-    "doppler": "./tools/doppler-cli.js"
+    "doppler": "tools/doppler-cli.js"
   },
   "scripts": {
     "cli": "node tools/doppler-cli.js",
@@ -125,7 +125,7 @@
   },
   "repository": {
     "type": "git",
-    "url": "https://github.com/clocksmith/doppler.git"
+    "url": "git+https://github.com/clocksmith/doppler.git"
   },
   "homepage": "https://github.com/clocksmith/doppler",
   "keywords": [
@@ -142,6 +142,9 @@
     "url": "https://github.com/clocksmith/doppler/issues"
   },
   "license": "Apache-2.0",
+  "publishConfig": {
+    "access": "public"
+  },
   "files": [
     "src",
     "src/gpu/kernels/*.wgsl",
@@ -160,6 +163,6 @@
     "playwright": "^1.58.2"
   },
   "optionalDependencies": {
-    "@simulatte/webgpu-doe": "0.1.x"
+    "@simulatte/webgpu": "0.1.x"
   }
 }

package/src/config/kernels/kernel-ref-digests.js CHANGED Viewed

@@ -49,16 +49,16 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "backward/upsample2d_backward.wgsl#main": "3f3a27fc880d3c4cba49889cafb4be66d30132cfeec9c2105751cc12a5a44ae3",
   "bf16_to_f16.wgsl#main": "91c009d291a205fc42e7b45942e58630442eb67f8cb4bacc2e54160fa5f25c35",
   "bf16_to_f32.wgsl#main": "2c5c08476d40aeb64287b8b31d1ef088c63e8bb4568bf7b7c5faf4a4ed493576",
-  "bias_add_f16.wgsl#main": "8ec47faa1a52190616b431ca8bbd7b1e657ef13720e35e787e4df16b65817b03",
-  "bias_add.wgsl#main": "d15e3f38379e5a7b393ab88c8a1a6eae13bbc8fec4348267d891ce5b7e8bb963",
+  "bias_add_f16.wgsl#main": "f4c5b6e6495bcaae4582c3eb11c7fe39466a9625bbe57eede116c24db71682f6",
+  "bias_add.wgsl#main": "e7d3b4a5f9efc8b0569c56bcdeb63e921fa6d1d006901deabc734cab40346715",
   "cast_f16_to_f32.wgsl#main": "98a0b31fcba2bad945e9f8522d643ae75135bfdf6b39a824565f57d5d4fd965d",
   "cast_f32_to_f16.wgsl#main": "0b669e7812c09a2f44e219548e11ca0dfd8af921d30017e2a5c79d54f792542f",
   "clamp.wgsl#main": "9d8039a590d102133636d67de8ae76ca8e9129bf220c48f7a08e9d82fcc48bad",
-  "conv2d_f16.wgsl#main": "aa139e9f0270873acbc1c4b3cbacff4d224cae7247b520ec129a4f068eb6ed59",
-  "conv2d.wgsl#main": "484a676692d2b8097daeefe42e2296a1f8b3ef11abfd7b41df6cdcdf16b7a8fd",
+  "conv2d_f16.wgsl#main": "1e26a7e45e434fc45bdcd1913b0b97d2ed7e80b3c0bb1beae3d762ee457841c7",
+  "conv2d.wgsl#main": "140ed68bf1554ebfadbad7bcf1dfdff7f95aff18588459205f14b05cb432eee2",
   "cross_entropy_loss.wgsl#main": "5a48087bdec94184432c90ce5b345e1eadbdfcb13b9793ecee8052bc7392239c",
-  "depthwise_conv2d_f16.wgsl#main": "d5d8d195b1449e39715340af4a0759da4b44b54f6a3cfbdfa6abe743b0f1d002",
-  "depthwise_conv2d.wgsl#main": "e5da160f505e18508619b78ba30f9bde0c84689a166df06cb59ef0e6591c6faf",
+  "depthwise_conv2d_f16.wgsl#main": "f7f093a7e6623ed17a675bac729149e94718aece916416966eaf03c1d6939f2a",
+  "depthwise_conv2d.wgsl#main": "cf14cb40d282ad4d4fab160109b97eaeaf12aab62579b73324ac485ac75155b0",
   "dequant_f16_out_vec4.wgsl#main_vec4": "61c20e6c71c1c8421b4ec202dbd26292a6300587bd44c314f2a6c6d9d9442c3a",
   "dequant_f16_out.wgsl#main": "94d61843d56f9a3bbc6b7c2b95dc6ecbba3f6a262b2c4086a076f69a8c38ccae",
   "dequant_f16_rowwise.wgsl#main": "f5bf7cef950b52d65cee6121dbaa176244d3221045b3b6386b3be47f23ce17dc",
@@ -118,8 +118,8 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "gelu.wgsl#main": "a9007ea08aaff98f9be08f1e0490a6bcf252883eac5513de876ab9ce918865e6",
   "gptoss_mxfp4_expert_fused.wgsl#main_expert": "3159e8cd81da13f909cf905e6d35307fefe1dcbbdf1b2b8e8ff0ce923bd71180",
   "gptoss_router_topk.wgsl#softmax_topk": "86e4ea709c0c0084d09c6a4cd07710dc14f380e03f91b8ed9ec871b310be49f1",
-  "grouped_pointwise_conv2d_f16.wgsl#main": "11bcaefc5929b2e3c1ba338ebea6a28d2cac26553be8b00f51bfddbabf513be7",
-  "grouped_pointwise_conv2d.wgsl#main": "c0d5cdec0743b4ee337a8df95bda442e617c1678e3d1b6e20ec692d500ede50d",
+  "grouped_pointwise_conv2d_f16.wgsl#main": "578a0fcb3362864feb0de0e800b2df49e66e42db4360a08189e5f815ead944c4",
+  "grouped_pointwise_conv2d.wgsl#main": "9cf77937b10dd96f3aedc1793183ef2fff05d075fac3884fad5cd5869d0d9181",
   "groupnorm_apply_f16.wgsl#main": "cfd850b87944ac1c03ba7bd98136db556dadd8a70611e351d82d297299a7cd02",
   "groupnorm_apply.wgsl#main": "b09b8f2f57dcdfa1a0366daa30d3910feb134204652c711d2ba564e566b5a334",
   "groupnorm_stats_f16.wgsl#main": "fb76f78ce668ea8459110335698fe4b09a2425fc71deed3bab67efd7641c3199",
@@ -155,33 +155,33 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "moe_gather.wgsl#gather_single_pass": "8dbd0c38a323ba6c73af3ecaad297d79d861b817152e6e2c12fcd9db6f767f1e",
   "moe_gather.wgsl#gather_tokens": "58e40a63a39c2f99c47c75dee71767f98482217afd74607cee1b7efc2c85738b",
   "moe_offsets.wgsl#build_offsets": "3ea004145fa234659408cdeb0d4d802adff1037c9c5c03af146b3734cc69dd27",
-  "pixel_shuffle_f16.wgsl#main": "57903a9c19cecc56371b2198402745127115680d266c3ce609201be9119aa359",
-  "pixel_shuffle.wgsl#main": "845b88700b1b46d18cde6f2ec11bb89512c90d7e148763e74ce2a4173fd99b21",
-  "relu_f16.wgsl#main": "fc6134aabe43081b42ce8507d8f374092d0f2e03316aa42c25dd50229dc0ee40",
-  "relu.wgsl#main": "ca2c9bfa0acb9ece3b7e67de5209e00e553602b3917d23aca10338c1e6f01e27",
-  "repeat_channels_f16.wgsl#main": "e7e4d9164752e782d482db40256d0d86d96f784aa7debdb72faf3261b9bdd737",
-  "repeat_channels.wgsl#main": "ad0e34925c8c1173b9f0d92fa6e3808d039f82b3d9ad943b0a75b213ee1776e5",
-  "residual_f16_vec4.wgsl#add_vec4": "30e9226fb6636e2f01e65b1dc8e93c8e849a87acec6215342fc114996da1ed41",
-  "residual_f16.wgsl#main": "d392433f3065d1caf68b033219f4ffacf022dc1f90fc3cf3fd620e4ba49f3219",
-  "residual_vec4.wgsl#add_vec4": "ef011d1683e62887db712da563e783d12fdc80c152955661137d2dca612d7d6a",
-  "residual.wgsl#main": "1fc456b14e2fb2bc9627107b4e51e7a2098f723b5ba6ab5542cd9455af99f423",
-  "rmsnorm_f16.wgsl#main": "21d6d702cfcb8d653d8e105bbbc522e85704fa5628b865a7d36cde338ca5c779",
-  "rmsnorm_f16.wgsl#rmsnorm_small_f16": "10803373bce7d5d5eb0939821e629e0f3fc4e8d27cdddab89f14a9db02e83603",
-  "rmsnorm.wgsl#main": "c529986befb29a04b94d89744585923a7cef82baf4b2b0a243aa2431618622cc",
-  "rmsnorm.wgsl#main_cached": "828d30dd8b6137457375b9f7b446a6bbdc1df826ce4d9b1818f6d1abe7adc9c5",
-  "rmsnorm.wgsl#main_small": "2baf3a1a1a1e982cf9ffcddd3646655503536148c4a3ce9938646bc05cf701b5",
-  "rmsnorm.wgsl#main_small_subgroup": "909b52d4dfcdd780f531afeb6964885adc90552487f36f131aa349bcc54fb495",
-  "rmsnorm.wgsl#main_subgroup": "545ebdd1e6e3ab9790a17a4dd5501b12dbb7bc0073787f9a4f5821752a75991c",
+  "pixel_shuffle_f16.wgsl#main": "1d1202cdaa8f7a94e015c5e2212bc98881d00d548a12fe7a8e91c4e17f2ba723",
+  "pixel_shuffle.wgsl#main": "91c017f0642132229768a2be6c8d47ad26d486f5d40e7dbf9e2349c847e527b8",
+  "relu_f16.wgsl#main": "baac3a33693e5a72e60c7ec9b4a4dbcec10a83ca1fac2972988b07a75780f14a",
+  "relu.wgsl#main": "52ffa66f9898a4f291758ae93055000cb1eb488c22a993e6b0568a29d9d3ad28",
+  "repeat_channels_f16.wgsl#main": "6eee5f9f74d8c17a71f6f422b503bbfb872350a9486ec0065fd1f67718311883",
+  "repeat_channels.wgsl#main": "bce0cb33beed50ce388b2d069961ae0fbe361dd4930b9344cb066b3390475a51",
+  "residual_f16_vec4.wgsl#add_vec4": "bf8cd304a1d4c5500143b0bc52d0236a7e8bbc4cc2d51d54ef0d4fce209f503b",
+  "residual_f16.wgsl#main": "3ca5c562fb5baf495e31e662f85fb26863f8f6d4ad29bb119c484e2ffdee7791",
+  "residual_vec4.wgsl#add_vec4": "f2f30d2dec9d90062bf5fce1f141951e8e6b54f56698b87ffb9bf6662c8acce2",
+  "residual.wgsl#main": "f1abd88c959c5d8dd27b9353d487e37b2a96850ed9d90c365212e260399cc2a7",
+  "rmsnorm_f16.wgsl#main": "7ae20c01b0453306504f777c4a8de37364a8b45bef3c569b0572c7863740a6bd",
+  "rmsnorm_f16.wgsl#rmsnorm_small_f16": "e9ce0a7427831e4d1280691eb9ca0daab55d917d4f0d9975d4bcd7e8fe960941",
+  "rmsnorm.wgsl#main": "f516b3e4bde2015f2a207c3ca5b8c9820c7809fa8f8d0786f90c568e0f1ac077",
+  "rmsnorm.wgsl#main_cached": "bcae48e93d63e11701386850559fec5d4924128ad9d6ac1de27d1b8c34fc3dff",
+  "rmsnorm.wgsl#main_small": "95c65dcb443717c821c44de87dc89cdd4f6da97e08cccf8a9526f5cdd19dd33d",
+  "rmsnorm.wgsl#main_small_subgroup": "8ff72e445b662b1820be25a594fb0558007bfca7e50d2d1bc915df5774a76f6a",
+  "rmsnorm.wgsl#main_subgroup": "0aac7dd6455bf8f3d11917ec87fa71bb5fa9ef4f8e5bba02dfbfd11b92ccd01f",
   "rope_f16.wgsl#main": "a87f2964b77e851a2fbcc88305adeecaf8eba372291d83a71b817c8ef3da5c58",
   "rope_f16.wgsl#rope_compute_freqs": "c7aa2cb50420ab2709b20e0a33e93ab6aa4f50d2fa8d9f79b0bfcfefb2f7abab",
   "rope_f16.wgsl#rope_ntk_scaled": "46d2574b46539b289371c0c37a0b4e2fb21279134126b36a1fc30b98523905dd",
   "rope_f16.wgsl#rope_qk": "3bc01e167dc3cc5397bd7751e493311b4d3f5c6c0f6fad30234a740bb4c4507b",
   "rope_f16.wgsl#rope_yarn": "9b788dd05a1598aadcba5b0218d1666ce75faadbe32b71ee1def65ec23fb7dfe",
-  "rope.wgsl#main": "b639fe8a54508115c82c13c923bfea89f59c6e15a5bef66bfc34e12f0ab4e32f",
-  "rope.wgsl#rope_compute_freqs": "3d3a25df6036c9e87f6270bd6e1f67ffcd5cf3a1aac7cea19b1935fdb6ea6046",
-  "rope.wgsl#rope_ntk_scaled": "14b044c70e8f7bc775606a88298fefbf1181024f45775497cf2350682879fcd4",
-  "rope.wgsl#rope_qk": "d84c973564235347fa16b13552b5a6d7ab524f4ac9b65f0504fec07568b2f032",
-  "rope.wgsl#rope_yarn": "00b473ce1d86f16444d948739da39e834e21d4db30ab09b0df7502d2e4c511b2",
+  "rope.wgsl#main": "4c803ad5e0dd065d5572c7aecc1def277c43884dcc02f22a9676914c10111400",
+  "rope.wgsl#rope_compute_freqs": "c9338316a31c8d467acbf8d512cb9616ee902d2619fa9187639f8ff5d78414ac",
+  "rope.wgsl#rope_ntk_scaled": "818f89865a3d1d6f2d49f671ac882d0fde9709702160a1ae8d9a8ef113afb511",
+  "rope.wgsl#rope_qk": "3d773c8b8c400142edc8a4111afb04a2bf75bdb109b2d41cbe5afdb72a959772",
+  "rope.wgsl#rope_yarn": "cb00e1cf87fac198dcf0fb0d4e2d5f6f99d2fed6dff0a089a96bb459917851d2",
   "sample_f16.wgsl#argmax": "30b9f199b49352e5aff91b7aa8016edb423ce33f77481c3a7bc184251856fb27",
   "sample_f16.wgsl#argmax_reduce": "a3ca27fc50b10c36c1676bdd5dbfe5edc67850cdd5c1af7a1d3ad70f830dd8a7",
   "sample_f16.wgsl#find_topk_phase1": "24e47e5ced28af802959e350ff0a6eec6b9a26f89fb38e222990eeaffb16bd36",
@@ -194,10 +194,10 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "sample.wgsl#find_topk_phase2": "940b216e605d22096da5aca65950a8030866fc5a39e7fdf484d69a832de1b63a",
   "sample.wgsl#sample_single_pass": "4412357e84113ee2f1bc0dc8bf89e314c2ab482c89c14ca016ea9949d16a9d0c",
   "sample.wgsl#softmax_and_sample": "7172c60e76430fbe130e530e3564b569b45eccf193987b32d6f52bd6bbcc9f08",
-  "sana_linear_attention_apply_f16.wgsl#main": "e47366b94d40c4388e631b5bf93f8d61ef4e52cc65ffcd3b08d9d170616bb138",
-  "sana_linear_attention_apply.wgsl#main": "59cad7974c644fd910af776ad85a9a2c43c00492d4d1152fdc8373ecbb8bba18",
-  "sana_linear_attention_summary_f16.wgsl#main": "e3c040bb6469d37fc78eb22c1cc3e0456301607e461bbcdf5365a583c5d260d2",
-  "sana_linear_attention_summary.wgsl#main": "20c7ecdbcd1c73c0f9937c3cdac07b4b6edfe8618bf6f66281806343fd41b122",
+  "sana_linear_attention_apply_f16.wgsl#main": "4a7426ce67eccfb70956feeae84275f4d3cc586c50e8442c07eb69993b378ab5",
+  "sana_linear_attention_apply.wgsl#main": "5f69e0bc1d9e2df5a61e13bd819313c8f7ff5dfc4b7d78e71d5152dc23b6a86c",
+  "sana_linear_attention_summary_f16.wgsl#main": "3abb736ead999485b5dac9c6b534143b464cfd0b5300c5e03c56cec03c8fa48e",
+  "sana_linear_attention_summary.wgsl#main": "be9c1fe861dcb5ea46927749764267656a69160bc8b732c6eb1a1bcb0c075589",
   "scale.wgsl#main": "44ec481452b586307957163e3d65c9d02561d3f2f3db633f906f5488b1ea1ca4",
   "scale.wgsl#main_inplace": "020824c7118a59c461ce81f1c2cd01b7c2a3f1aab326392b7d48d4448a0c2ed1",
   "scatter_add_dynamic_f16_weights.wgsl#scatter_add_dynamic": "42799e745bc445b199b1cbc384bc12bb9372ed1599af3260a803cefc8dd35497",
@@ -206,8 +206,8 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "scatter_add_vec4.wgsl#scatter_add_vec4": "247c4f23129cdfbb19593b17c5833d85048da117d77141c74bc4e16e691d94e1",
   "scatter_add.wgsl#main": "dea947b8014e9b674e4fec8f15fac6c926e8a3a4d8eff104b953d77f35a1ac35",
   "scatter_add.wgsl#scatter_add_accumulate": "561800af22dedae63f1abe69b757b0ef6c7832a2bff228c2262e0b7111d89247",
-  "silu_f16.wgsl#main": "66a87710c1a680f9bf8d01f804709ecd2ce6a99bf2ee82a5f7e199e48eca6e29",
-  "silu.wgsl#main": "e833f98b090845ada7b9ae8edc68cd6cfe823bd1d5ae7a6401f32b6e3bb6ee75",
+  "silu_f16.wgsl#main": "867634b20dcb75969e001966836892a2b7e01782b0028d94779c6ec21c254ae0",
+  "silu.wgsl#main": "7b52d30fb741beef2dbf728e0c4ecffe5b08d9661d63c306caecb4cb3ced85e5",
   "softmax_subgroup.wgsl#main_subgroup": "88472c0dab5f81c5f045f0ee79c4c3bb484791a4a2b84af398c019851438f091",
   "softmax_subgroup.wgsl#softmax_small_subgroup": "5d7bd1b698910a437197bf6c8b7f8b259036dd006ad5470f767b539dba8538f8",
   "softmax.wgsl#main": "45c5876806b442222d7e190e595f55a0079bae82e07d37586996c1a63790bb7a",
@@ -220,7 +220,7 @@ export const KERNEL_REF_CONTENT_DIGESTS = Object.freeze({
   "topk.wgsl#main": "a18763303cd18e8a020e647f8a52f65403526849faf835d9f9394f634c3c97eb",
   "topk.wgsl#softmax_topk": "95ff3517da909e4bd4d0ff8d85b619bd250522943aeb9276375edc59f67e9604",
   "topk.wgsl#topk_2_small": "289eaa5c4f005e0aaf37dfe5343aeda30d9ab3929979dbf0cc3553f23e136807",
-  "transpose.wgsl#main": "3f80f9db1b150f453a9abb62300bfef35e744ec6a8c774c7b64f2ad6088204e5",
-  "upsample2d_f16.wgsl#main": "961f876852d9f4f1d3b224f39cdae3fa434378db12f7903d23a8dab6824644d4",
-  "upsample2d.wgsl#main": "9ff2d864c58a6776b7e03221bc6a7409e9e646fbabe7d9a33f4e06ed62120e43",
+  "transpose.wgsl#main": "002bce09c48b63ab5017d83f42233340011ac6fc20dae9cd08e3095ae5bf72b2",
+  "upsample2d_f16.wgsl#main": "43cee5f2503cb4b6caea45e9842f8961ce313b02eb8ed23a97d6967113ce521c",
+  "upsample2d.wgsl#main": "6de9172ad3d6940dd3c94470a105755a33760e66a84d6e9e96ec4d6a07dc4a25"
 });

package/src/config/kernels/registry.json CHANGED Viewed

@@ -1826,7 +1826,7 @@
         }
       ],
       "baseUniforms": {
-        "size": 16,
+        "size": 32,
         "fields": [
           {
             "name": "hidden_size",
@@ -1847,6 +1847,26 @@
             "name": "has_residual",
             "type": "u32",
             "offset": 12
+          },
+          {
+            "name": "token_stride",
+            "type": "u32",
+            "offset": 16
+          },
+          {
+            "name": "_pad0",
+            "type": "u32",
+            "offset": 20
+          },
+          {
+            "name": "_pad1",
+            "type": "u32",
+            "offset": 24
+          },
+          {
+            "name": "_pad2",
+            "type": "u32",
+            "offset": 28
           }
         ]
       },
@@ -3637,7 +3657,7 @@
         }
       ],
       "baseUniforms": {
-        "size": 16,
+        "size": 32,
         "fields": [
           {
             "name": "num_tokens",
@@ -4117,6 +4137,26 @@
             "name": "bias_offset",
             "type": "u32",
             "offset": 12
+          },
+          {
+            "name": "token_stride",
+            "type": "u32",
+            "offset": 16
+          },
+          {
+            "name": "_pad0",
+            "type": "u32",
+            "offset": 20
+          },
+          {
+            "name": "_pad1",
+            "type": "u32",
+            "offset": 24
+          },
+          {
+            "name": "_pad2",
+            "type": "u32",
+            "offset": 28
           }
         ]
       },

package/src/config/loader.js CHANGED Viewed

@@ -326,6 +326,8 @@ function assertArchitecture(manifest, architecture) {
 function extractArchitectureFromConfig(config) {
   const nestedTextConfig = getNestedTextConfig(config);
+  const topLevelRoPEParameters = getFlatRoPEParameters(config);
+  const nestedRoPEParameters = getFlatRoPEParameters(nestedTextConfig);
   return {
     numLayers: config.num_hidden_layers ?? nestedTextConfig?.num_hidden_layers ?? config.n_layer ?? config.blockCount,
     hiddenSize: config.hidden_size ?? nestedTextConfig?.hidden_size ?? config.n_embd ?? config.embeddingLength,
@@ -335,13 +337,20 @@ function extractArchitectureFromConfig(config) {
     headDim: config.head_dim ?? nestedTextConfig?.head_dim,
     vocabSize: config.vocab_size ?? nestedTextConfig?.vocab_size ?? config.vocabSize,
     maxSeqLen: config.max_position_embeddings ?? nestedTextConfig?.max_position_embeddings ?? config.n_positions ?? config.contextLength,
-    ropeTheta: config.rope_theta ?? nestedTextConfig?.rope_theta ?? config.ropeFreqBase,
+    ropeTheta: topLevelRoPEParameters?.rope_theta
+      ?? nestedRoPEParameters?.rope_theta
+      ?? config.rope_theta
+      ?? nestedTextConfig?.rope_theta
+      ?? config.ropeFreqBase,
     rmsNormEps: config.rms_norm_eps ?? nestedTextConfig?.rms_norm_eps ?? config.attentionLayerNormRMSEpsilon,
   };
 }
 function extractInferenceFromConfig(config) {
   const nestedTextConfig = getNestedTextConfig(config);
+  const topLevelRoPEParameters = getFlatRoPEParameters(config);
+  const nestedRoPEParameters = getFlatRoPEParameters(nestedTextConfig);
+  const ropeParameters = nestedRoPEParameters ?? topLevelRoPEParameters;
   return {
     attention: {
       slidingWindow: config.sliding_window ?? nestedTextConfig?.sliding_window,
@@ -355,7 +364,13 @@ function extractInferenceFromConfig(config) {
     },
     pipeline: config.pipeline ?? nestedTextConfig?.pipeline,
     rope: {
-      ropeTheta: config.rope_theta ?? nestedTextConfig?.rope_theta ?? config.ropeFreqBase,
+      ropeTheta: ropeParameters?.rope_theta
+        ?? config.rope_theta
+        ?? nestedTextConfig?.rope_theta
+        ?? config.ropeFreqBase,
+      mropeInterleaved: ropeParameters?.mrope_interleaved,
+      mropeSection: Array.isArray(ropeParameters?.mrope_section) ? ropeParameters.mrope_section : undefined,
+      partialRotaryFactor: ropeParameters?.partial_rotary_factor,
       ropeScalingType: config.rope_scaling_type ?? nestedTextConfig?.rope_scaling_type,
       ropeScalingFactor: config.rope_scaling_factor ?? nestedTextConfig?.rope_scaling_factor,
     },
@@ -375,6 +390,20 @@ function getNestedTextConfig(config) {
   return null;
 }
+function getFlatRoPEParameters(config) {
+  if (!config || typeof config !== 'object' || Array.isArray(config)) {
+    return null;
+  }
+  const ropeParameters = config.rope_parameters;
+  if (!ropeParameters || typeof ropeParameters !== 'object' || Array.isArray(ropeParameters)) {
+    return null;
+  }
+  if (ropeParameters.full_attention || ropeParameters.sliding_attention) {
+    return null;
+  }
+  return ropeParameters;
+}
 function extractTokenizerFromManifest(manifest) {
   if (!manifest.tokenizer) return {};

package/src/config/merge.js CHANGED Viewed

@@ -152,6 +152,24 @@ function mergeRoPE(
       runtime?.ropeLocalTheta,
       sources
     ),
+    mropeInterleaved: overlay(
+      `${prefix}.mropeInterleaved`,
+      manifest.mropeInterleaved,
+      runtime?.mropeInterleaved,
+      sources
+    ),
+    mropeSection: overlay(
+      `${prefix}.mropeSection`,
+      manifest.mropeSection,
+      runtime?.mropeSection,
+      sources
+    ),
+    partialRotaryFactor: overlay(
+      `${prefix}.partialRotaryFactor`,
+      manifest.partialRotaryFactor,
+      runtime?.partialRotaryFactor,
+      sources
+    ),
     ropeScalingType: overlay(
       `${prefix}.ropeScalingType`,
       manifest.ropeScalingType,

package/src/config/presets/models/qwen3.json CHANGED Viewed

@@ -4,7 +4,7 @@
   "extends": "transformer",
   "architecture": {
-    "ropeTheta": 1000000
+    "ropeTheta": 10000000
   },
   "inference": {
@@ -12,6 +12,9 @@
       "slidingWindow": null,
       "queryKeyNorm": true
     },
+    "output": {
+      "scaleEmbeddings": false
+    },
     "normalization": {
       "rmsNormWeightOffset": false,
       "rmsNormEps": 1e-6
@@ -21,7 +24,10 @@
       "enabled": true
     },
     "rope": {
-      "ropeTheta": 1000000
+      "ropeTheta": 10000000,
+      "mropeInterleaved": true,
+      "mropeSection": [11, 11, 10],
+      "partialRotaryFactor": 0.25
     }
   },
@@ -34,6 +40,7 @@
   "detection": {
     "architecturePatterns": ["qwen3", "qwen3_5", "Qwen3ForCausalLM", "Qwen3_5ForCausalLM", "Qwen2ForCausalLM"],
+    "modelTypePatterns": ["qwen3_5", "qwen3_5_text", "qwen2"],
     "configPatterns": {
       "model_type": "qwen2"
     }

package/src/config/presets/models/transformer.json CHANGED Viewed

@@ -21,6 +21,11 @@
       "activation": "silu",
       "gatedActivation": true
     },
+    "rope": {
+      "mropeInterleaved": false,
+      "mropeSection": null,
+      "partialRotaryFactor": null
+    },
     "output": {
       "finalLogitSoftcapping": null,
       "tieWordEmbeddings": false

package/src/config/required-inference-fields-contract-check.js CHANGED Viewed

@@ -50,6 +50,9 @@ function createValidInferenceFixture() {
       ropeScalingFactor: 1.0,
       ropeScalingType: null,
       ropeLocalTheta: null,
+      mropeInterleaved: false,
+      mropeSection: null,
+      partialRotaryFactor: null,
       yarnBetaFast: null,
       yarnBetaSlow: null,
       yarnOriginalMaxPos: null,
@@ -94,6 +97,9 @@ const FIELD_CASES = Object.freeze([
   { kind: 'nonNullable', path: ['rope', 'ropeScalingFactor'], message: 'rope.ropeScalingFactor is required' },
   { kind: 'nullable', path: ['rope', 'ropeScalingType'], message: 'rope.ropeScalingType must be explicitly set' },
   { kind: 'nullable', path: ['rope', 'ropeLocalTheta'], message: 'rope.ropeLocalTheta must be explicitly set' },
+  { kind: 'nonNullable', path: ['rope', 'mropeInterleaved'], message: 'rope.mropeInterleaved is required' },
+  { kind: 'nullable', path: ['rope', 'mropeSection'], message: 'rope.mropeSection must be explicitly set' },
+  { kind: 'nullable', path: ['rope', 'partialRotaryFactor'], message: 'rope.partialRotaryFactor must be explicitly set' },
   { kind: 'nullable', path: ['rope', 'yarnBetaFast'], message: 'rope.yarnBetaFast must be explicitly set' },
   { kind: 'nullable', path: ['rope', 'yarnBetaSlow'], message: 'rope.yarnBetaSlow must be explicitly set' },
   { kind: 'nullable', path: ['rope', 'yarnOriginalMaxPos'], message: 'rope.yarnOriginalMaxPos must be explicitly set' },

package/src/config/schema/inference-defaults.schema.js CHANGED Viewed

@@ -165,6 +165,9 @@ export const DEFAULT_PRESET_INFERENCE_CONFIG = {
   rope: {
     ropeTheta: 10000,
     ropeLocalTheta: null,
+    mropeInterleaved: false,
+    mropeSection: null,
+    partialRotaryFactor: null,
     ropeScalingType: null,
     ropeScalingFactor: 1.0,
     ropeLocalScalingType: null,

package/src/config/schema/inference.schema.d.ts CHANGED Viewed

@@ -18,6 +18,15 @@ export interface RoPEConfigSchema {
   /** Local RoPE theta for sliding window layers (Gemma 3 uses 10000) */
   ropeLocalTheta?: number;
+  /** Apply adjacent-pair rotary layout instead of rotate-half layout. */
+  mropeInterleaved?: boolean;
+  /** mRoPE section sizes before the Qwen doubling step. */
+  mropeSection?: number[] | null;
+  /** Fraction of the head dimension that participates in rotary embedding. */
+  partialRotaryFactor?: number | null;
   /** RoPE scaling type */
   ropeScalingType?: 'linear' | 'dynamic' | 'yarn' | null;

package/src/config/schema/kernel-path.schema.d.ts CHANGED Viewed

@@ -105,6 +105,12 @@ export interface KernelPathSchema {
   /** KV cache dtype for this path; defaults to activationDtype when omitted. */
   kvDtype?: string;
+  /**
+   * Explicit widening target used by the finiteness fallback execution plan.
+   * Required for inline/generated kernel paths that do not have a stable registry id.
+   */
+  finitenessFallbackKernelPathId?: string;
   /**
    * Prefill phase kernel sequence (M > 1).
    * If not specified, uses decode with batched variants.

package/src/config/schema/manifest.schema.d.ts CHANGED Viewed

@@ -217,6 +217,12 @@ export interface ManifestRoPESchema {
   ropeTheta: number;
   /** Local theta for sliding window layers (null = same as ropeTheta) */
   ropeLocalTheta: number | null;
+  /** Use adjacent-pair rotary layout instead of rotate-half layout. */
+  mropeInterleaved: boolean;
+  /** mRoPE section sizes before the Qwen doubling step. */
+  mropeSection: number[] | null;
+  /** Fraction of the head dimension that participates in rotary embedding. */
+  partialRotaryFactor: number | null;
   /** RoPE scaling type (null = no scaling, 'linear', 'dynamic', 'yarn') */
   ropeScalingType: string | null;
   /** RoPE scaling factor (1.0 if no scaling) */

package/src/config/schema/manifest.schema.js CHANGED Viewed

@@ -62,6 +62,9 @@ export const DEFAULT_MANIFEST_INFERENCE = {
   rope: {
     ropeTheta: 10000,
     ropeLocalTheta: null,  // Same as ropeTheta (null = use ropeTheta)
+    mropeInterleaved: false,
+    mropeSection: null,
+    partialRotaryFactor: null,
     ropeScalingType: null,  // No scaling (null = disabled)
     ropeScalingFactor: 1.0,
     ropeLocalScalingType: null,  // Local scaling policy (null = no scaling)

package/src/converter/rope-config.js CHANGED Viewed

@@ -6,10 +6,26 @@ function asObject(value) {
 }
 function asFiniteNumber(value) {
+  if (value == null || value === '') {
+    return null;
+  }
   const parsed = Number(value);
   return Number.isFinite(parsed) ? parsed : null;
 }
+function asBoolean(value) {
+  return typeof value === 'boolean' ? value : null;
+}
+function asNumberArray(value) {
+  if (!Array.isArray(value)) return null;
+  const normalized = value.map((entry) => asFiniteNumber(entry));
+  if (normalized.some((entry) => entry == null || entry <= 0)) {
+    return null;
+  }
+  return normalized.map((entry) => Math.trunc(entry));
+}
 function normalizeRoPEType(value) {
   if (typeof value !== 'string') return null;
   const normalized = value.trim().toLowerCase();
@@ -125,6 +141,13 @@ function failOnConflictingScaling(sourceLabel, canonicalScaling, candidateScalin
 export function buildRoPEConfig(presetInference, config) {
   const ropeScaling = asObject(config.rope_scaling);
   const ropeParameters = asObject(config.rope_parameters);
+  const flatRoPEParameters = (
+    ropeParameters
+      && !asObject(ropeParameters.full_attention)
+      && !asObject(ropeParameters.sliding_attention)
+  )
+    ? ropeParameters
+    : null;
   const fullAttentionRoPE = asObject(ropeParameters?.full_attention);
   const slidingAttentionRoPE = asObject(ropeParameters?.sliding_attention);
   const presetRoPE = presetInference.rope ?? {};
@@ -164,6 +187,11 @@ export function buildRoPEConfig(presetInference, config) {
       strictMissingTypeAndFactor: false,
       sourceLabel: 'HF config rope_parameters.full_attention',
     });
+  } else if (flatRoPEParameters) {
+    globalScaling = resolveScalingConfig(flatRoPEParameters, {
+      strictMissingTypeAndFactor: false,
+      sourceLabel: 'HF config rope_parameters',
+    });
   }
   const hasPresetLocalScaling = presetRoPE.ropeLocalScalingType !== undefined
@@ -192,6 +220,7 @@ export function buildRoPEConfig(presetInference, config) {
   // HF config is source of truth for ropeTheta when provided:
   // prefer rope_parameters.full_attention.rope_theta, then rope_theta.
   const ropeTheta = asFiniteNumber(fullAttentionRoPE?.rope_theta)
+    ?? asFiniteNumber(flatRoPEParameters?.rope_theta)
     ?? asFiniteNumber(config.rope_theta)
     ?? presetInference.rope?.ropeTheta
     ?? 10000;
@@ -201,9 +230,22 @@ export function buildRoPEConfig(presetInference, config) {
     ?? presetInference.rope?.ropeLocalTheta
     ?? null;
+  const mropeInterleaved = asBoolean(flatRoPEParameters?.mrope_interleaved)
+    ?? presetInference.rope?.mropeInterleaved
+    ?? false;
+  const mropeSection = asNumberArray(flatRoPEParameters?.mrope_section)
+    ?? presetInference.rope?.mropeSection
+    ?? null;
+  const partialRotaryFactor = asFiniteNumber(flatRoPEParameters?.partial_rotary_factor)
+    ?? asFiniteNumber(presetInference.rope?.partialRotaryFactor)
+    ?? null;
   return {
     ropeTheta,
     ropeLocalTheta,
+    mropeInterleaved,
+    mropeSection,
+    partialRotaryFactor,
     ropeScalingType: globalScaling.ropeScalingType,
     ropeScalingFactor: globalScaling.ropeScalingFactor,
     yarnBetaFast: globalScaling.yarnBetaFast,