npm - @simulatte/doppler - Versions diffs - 0.1.9 → 0.2.0 - Mend

@simulatte/doppler 0.1.9 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (1359) hide show

package/README.md +3 -116
package/package.json +5 -162
package/BRANDING.md +0 -14
package/CHANGELOG.md +0 -158
package/LICENSE +0 -201
package/NOTICE +0 -5
package/SECURITY.md +0 -19
package/src/adapters/adapter-manager.d.ts +0 -200
package/src/adapters/adapter-manager.js +0 -509
package/src/adapters/adapter-manifest.d.ts +0 -290
package/src/adapters/adapter-manifest.js +0 -320
package/src/adapters/adapter-registry.d.ts +0 -192
package/src/adapters/adapter-registry.js +0 -477
package/src/adapters/index.d.ts +0 -89
package/src/adapters/index.js +0 -42
package/src/adapters/lora-loader.d.ts +0 -105
package/src/adapters/lora-loader.js +0 -414
package/src/bootstrap.d.ts +0 -1
package/src/bootstrap.js +0 -30
package/src/bridge/extension/background.d.ts +0 -14
package/src/bridge/extension/background.js +0 -168
package/src/bridge/extension/manifest.json +0 -34
package/src/bridge/extension-client.d.ts +0 -114
package/src/bridge/extension-client.js +0 -409
package/src/bridge/index.d.ts +0 -69
package/src/bridge/index.js +0 -53
package/src/bridge/protocol.d.ts +0 -96
package/src/bridge/protocol.js +0 -130
package/src/browser/browser-converter.d.ts +0 -71
package/src/browser/browser-converter.js +0 -977
package/src/browser/file-picker.d.ts +0 -63
package/src/browser/file-picker.js +0 -281
package/src/browser/gguf-importer.d.ts +0 -136
package/src/browser/gguf-importer.js +0 -532
package/src/browser/gguf-parser-browser.d.ts +0 -14
package/src/browser/gguf-parser-browser.js +0 -17
package/src/browser/quantization.d.ts +0 -69
package/src/browser/quantization.js +0 -328
package/src/browser/safetensors-parser-browser.d.ts +0 -193
package/src/browser/safetensors-parser-browser.js +0 -347
package/src/browser/shard-io-browser.d.ts +0 -57
package/src/browser/shard-io-browser.js +0 -89
package/src/browser/tensor-source-download.d.ts +0 -27
package/src/browser/tensor-source-download.js +0 -245
package/src/browser/tensor-source-file.d.ts +0 -26
package/src/browser/tensor-source-file.js +0 -53
package/src/browser/tensor-source-http.d.ts +0 -29
package/src/browser/tensor-source-http.js +0 -130
package/src/client/doppler-api.browser.d.ts +0 -1
package/src/client/doppler-api.browser.js +0 -310
package/src/client/doppler-api.d.ts +0 -83
package/src/client/doppler-api.js +0 -323
package/src/client/doppler-provider/generation.d.ts +0 -25
package/src/client/doppler-provider/generation.js +0 -126
package/src/client/doppler-provider/index.d.ts +0 -2
package/src/client/doppler-provider/index.js +0 -3
package/src/client/doppler-provider/model-manager.d.ts +0 -71
package/src/client/doppler-provider/model-manager.js +0 -739
package/src/client/doppler-provider/provider.d.ts +0 -5
package/src/client/doppler-provider/provider.js +0 -102
package/src/client/doppler-provider/source-runtime.d.ts +0 -23
package/src/client/doppler-provider/source-runtime.js +0 -641
package/src/client/doppler-provider/types.d.ts +0 -127
package/src/client/doppler-provider/types.js +0 -17
package/src/client/doppler-provider.d.ts +0 -46
package/src/client/doppler-provider.js +0 -36
package/src/client/doppler-registry.d.ts +0 -23
package/src/client/doppler-registry.js +0 -86
package/src/client/doppler-registry.json +0 -40
package/src/config/README.md +0 -69
package/src/config/backward-registry-loader.d.ts +0 -3
package/src/config/backward-registry-loader.js +0 -23
package/src/config/execution-contract-check.d.ts +0 -82
package/src/config/execution-contract-check.js +0 -317
package/src/config/execution-v0-contract-check.d.ts +0 -94
package/src/config/execution-v0-contract-check.js +0 -349
package/src/config/execution-v0-graph-contract-check.d.ts +0 -20
package/src/config/execution-v0-graph-contract-check.js +0 -64
package/src/config/index.d.ts +0 -63
package/src/config/index.js +0 -31
package/src/config/kernel-path-contract-check.d.ts +0 -76
package/src/config/kernel-path-contract-check.js +0 -507
package/src/config/kernel-path-loader.d.ts +0 -170
package/src/config/kernel-path-loader.js +0 -570
package/src/config/kernels/backward-registry.json +0 -99
package/src/config/kernels/kernel-ref-digests.d.ts +0 -1
package/src/config/kernels/kernel-ref-digests.js +0 -228
package/src/config/kernels/kernel-ref.d.ts +0 -17
package/src/config/kernels/kernel-ref.js +0 -75
package/src/config/kernels/moe/gpt-oss.paths.json +0 -49
package/src/config/kernels/moe/mixtral.paths.json +0 -46
package/src/config/kernels/registry.d.ts +0 -86
package/src/config/kernels/registry.js +0 -116
package/src/config/kernels/registry.json +0 -7443
package/src/config/loader.d.ts +0 -57
package/src/config/loader.js +0 -584
package/src/config/merge-contract-check.d.ts +0 -16
package/src/config/merge-contract-check.js +0 -383
package/src/config/merge-helpers.d.ts +0 -58
package/src/config/merge-helpers.js +0 -175
package/src/config/merge.d.ts +0 -143
package/src/config/merge.js +0 -414
package/src/config/param-categories.d.ts +0 -17
package/src/config/param-categories.js +0 -72
package/src/config/param-validator.d.ts +0 -26
package/src/config/param-validator.js +0 -280
package/src/config/platforms/amd-rdna3.json +0 -16
package/src/config/platforms/apple-m1.json +0 -16
package/src/config/platforms/apple-m2.json +0 -16
package/src/config/platforms/apple-m3.json +0 -16
package/src/config/platforms/generic.json +0 -14
package/src/config/platforms/loader.d.ts +0 -65
package/src/config/platforms/loader.js +0 -155
package/src/config/platforms/nvidia-rtx30.json +0 -16
package/src/config/platforms/nvidia-rtx40.json +0 -16
package/src/config/presets/kernel-paths/embeddinggemma-f16-f32a.json +0 -60
package/src/config/presets/kernel-paths/embeddinggemma-f32-f32a.json +0 -60
package/src/config/presets/kernel-paths/embeddinggemma-q4k-dequant-f32a.json +0 -60
package/src/config/presets/kernel-paths/gemma2-f16-f16a.json +0 -61
package/src/config/presets/kernel-paths/gemma2-f16-f32a.json +0 -60
package/src/config/presets/kernel-paths/gemma2-q4k-dequant-f16a.json +0 -61
package/src/config/presets/kernel-paths/gemma2-q4k-dequant-f32a-nosubgroups.json +0 -60
package/src/config/presets/kernel-paths/gemma2-q4k-fused-f32a.json +0 -57
package/src/config/presets/kernel-paths/gemma3-f16-fused-f16a-online.json +0 -200
package/src/config/presets/kernel-paths/gemma3-f16-fused-f32a-online-streamingprefill.json +0 -223
package/src/config/presets/kernel-paths/gemma3-f16-fused-f32a-online.json +0 -223
package/src/config/presets/kernel-paths/gemma3-q4k-dequant-f16a-online.json +0 -60
package/src/config/presets/kernel-paths/gemma3-q4k-dequant-f32a-nosubgroups.json +0 -61
package/src/config/presets/kernel-paths/gemma3-q4k-dequant-f32a-online.json +0 -61
package/src/config/presets/kernel-paths/gemma3-q4k-dequant-f32a-small-attn.json +0 -61
package/src/config/presets/kernel-paths/gemma3-q4k-dequant-f32w-f32a-online.json +0 -56
package/src/config/presets/kernel-paths/lfm2-q4k-dequant-f32a-nosubgroups.json +0 -61
package/src/config/presets/kernel-paths/lfm2-q4k-dequant-f32a-online.json +0 -61
package/src/config/presets/kernel-paths/registry.json +0 -145
package/src/config/presets/models/deepseek.json +0 -20
package/src/config/presets/models/diffusion.json +0 -10
package/src/config/presets/models/embeddinggemma.json +0 -74
package/src/config/presets/models/functiongemma.json +0 -31
package/src/config/presets/models/gemma2.json +0 -60
package/src/config/presets/models/gemma3.json +0 -78
package/src/config/presets/models/gemma4.json +0 -61
package/src/config/presets/models/gpt-oss.json +0 -68
package/src/config/presets/models/granite-docling.json +0 -70
package/src/config/presets/models/janus-text.json +0 -27
package/src/config/presets/models/kimi-k2.json +0 -25
package/src/config/presets/models/lfm2.json +0 -88
package/src/config/presets/models/llama3.json +0 -40
package/src/config/presets/models/mamba.json +0 -34
package/src/config/presets/models/mixtral.json +0 -37
package/src/config/presets/models/modernbert.json +0 -32
package/src/config/presets/models/qwen3.json +0 -49
package/src/config/presets/models/qwen3_5.json +0 -16
package/src/config/presets/models/qwen3_vl.json +0 -40
package/src/config/presets/models/transformer.json +0 -78
package/src/config/presets/models/translategemma.json +0 -30
package/src/config/presets/platforms/nvidia-gb200-8gpu.json +0 -45
package/src/config/presets/platforms/nvidia-gb200-nvl72.json +0 -45
package/src/config/presets/platforms/nvidia-gh200-nvl2.json +0 -44
package/src/config/presets/platforms/nvidia-gh200.json +0 -44
package/src/config/presets/runtime/compute/f16-activations.json +0 -30
package/src/config/presets/runtime/compute/f16-batched.json +0 -32
package/src/config/presets/runtime/default.json +0 -101
package/src/config/presets/runtime/diagnostics/debug-logits.json +0 -53
package/src/config/presets/runtime/experiments/bench/gemma3-bench-q4k.json +0 -54
package/src/config/presets/runtime/experiments/debug/gemma3-debug-q4k.json +0 -210
package/src/config/presets/runtime/experiments/verify/gemma3-verify.json +0 -39
package/src/config/presets/runtime/experiments/verify/lfm2-verify.json +0 -46
package/src/config/presets/runtime/experiments/verify/translategemma-verify.json +0 -39
package/src/config/presets/runtime/kernels/dequant-f16-q4k.json +0 -13
package/src/config/presets/runtime/kernels/dequant-f32-q4k.json +0 -13
package/src/config/presets/runtime/kernels/embeddinggemma-q4k-dequant-f32a.json +0 -37
package/src/config/presets/runtime/kernels/fused-q4k.json +0 -13
package/src/config/presets/runtime/kernels/gemma2-q4k-dequant-f16a.json +0 -33
package/src/config/presets/runtime/kernels/gemma2-q4k-dequant-f32a-nosubgroups.json +0 -33
package/src/config/presets/runtime/kernels/gemma2-q4k-fused-f32a.json +0 -33
package/src/config/presets/runtime/kernels/safe-q4k.json +0 -13
package/src/config/presets/runtime/model/gemma2-debug.json +0 -77
package/src/config/presets/runtime/model/gemma2-pipeline-debug.json +0 -66
package/src/config/presets/runtime/model/gemma2-pipeline.json +0 -75
package/src/config/presets/runtime/model/gemma3-layer-probe.json +0 -85
package/src/config/presets/runtime/model/qwen3-5-layer-probe.json +0 -52
package/src/config/presets/runtime/model/qwen3-5-linear-attn-debug.json +0 -90
package/src/config/presets/runtime/modes/bench.json +0 -37
package/src/config/presets/runtime/modes/debug.json +0 -39
package/src/config/presets/runtime/modes/default.json +0 -10
package/src/config/presets/runtime/modes/embedding-bench.json +0 -28
package/src/config/presets/runtime/modes/embedding.json +0 -54
package/src/config/presets/runtime/modes/low-memory.json +0 -40
package/src/config/presets/runtime/modes/production.json +0 -48
package/src/config/presets/runtime/modes/simulation.json +0 -30
package/src/config/presets/runtime/modes/trace-layers.json +0 -127
package/src/config/presets/runtime/platform/metal-apple-q4k.json +0 -11
package/src/config/presets/runtime/tiers/gemma4-16gb.json +0 -69
package/src/config/presets/runtime/tiers/gemma4-24gb.json +0 -66
package/src/config/presets/runtime/tiers/gemma4-32gb.json +0 -66
package/src/config/quantization-contract-check.d.ts +0 -12
package/src/config/quantization-contract-check.js +0 -91
package/src/config/required-inference-fields-contract-check.d.ts +0 -24
package/src/config/required-inference-fields-contract-check.js +0 -237
package/src/config/runtime-merge.d.ts +0 -5
package/src/config/runtime-merge.js +0 -21
package/src/config/runtime.d.ts +0 -28
package/src/config/runtime.js +0 -64
package/src/config/schema/adapter.schema.d.ts +0 -53
package/src/config/schema/adapter.schema.js +0 -60
package/src/config/schema/backward-registry.schema.d.ts +0 -14
package/src/config/schema/backward-registry.schema.js +0 -46
package/src/config/schema/benchmark.schema.d.ts +0 -54
package/src/config/schema/benchmark.schema.js +0 -74
package/src/config/schema/bridge.schema.d.ts +0 -25
package/src/config/schema/bridge.schema.js +0 -22
package/src/config/schema/browser-suite-metrics.schema.d.ts +0 -17
package/src/config/schema/browser-suite-metrics.schema.js +0 -46
package/src/config/schema/buffer-pool.schema.d.ts +0 -92
package/src/config/schema/buffer-pool.schema.js +0 -50
package/src/config/schema/conversion-report.schema.d.ts +0 -40
package/src/config/schema/conversion-report.schema.js +0 -108
package/src/config/schema/conversion.schema.d.ts +0 -184
package/src/config/schema/conversion.schema.js +0 -13
package/src/config/schema/converter.schema.d.ts +0 -123
package/src/config/schema/converter.schema.js +0 -136
package/src/config/schema/debug.schema.d.ts +0 -290
package/src/config/schema/debug.schema.js +0 -134
package/src/config/schema/diffusion.schema.d.ts +0 -88
package/src/config/schema/diffusion.schema.js +0 -62
package/src/config/schema/distill-training.schema.d.ts +0 -48
package/src/config/schema/distill-training.schema.js +0 -139
package/src/config/schema/distribution.schema.d.ts +0 -155
package/src/config/schema/distribution.schema.js +0 -81
package/src/config/schema/doppler.schema.d.ts +0 -75
package/src/config/schema/doppler.schema.js +0 -341
package/src/config/schema/ecosystem.schema.d.ts +0 -255
package/src/config/schema/ecosystem.schema.js +0 -534
package/src/config/schema/emulation.schema.d.ts +0 -351
package/src/config/schema/emulation.schema.js +0 -299
package/src/config/schema/energy.schema.d.ts +0 -102
package/src/config/schema/energy.schema.js +0 -72
package/src/config/schema/execution-v0.schema.d.ts +0 -187
package/src/config/schema/execution-v0.schema.js +0 -55
package/src/config/schema/gpu-cache.schema.d.ts +0 -26
package/src/config/schema/gpu-cache.schema.js +0 -8
package/src/config/schema/harness.schema.d.ts +0 -32
package/src/config/schema/harness.schema.js +0 -20
package/src/config/schema/hotswap.schema.d.ts +0 -55
package/src/config/schema/hotswap.schema.js +0 -18
package/src/config/schema/index.d.ts +0 -885
package/src/config/schema/index.js +0 -491
package/src/config/schema/inference-defaults.schema.d.ts +0 -276
package/src/config/schema/inference-defaults.schema.js +0 -188
package/src/config/schema/inference.schema.d.ts +0 -298
package/src/config/schema/inference.schema.js +0 -39
package/src/config/schema/intent-bundle.schema.d.ts +0 -28
package/src/config/schema/intent-bundle.schema.js +0 -12
package/src/config/schema/kernel-path.schema.d.ts +0 -184
package/src/config/schema/kernel-path.schema.js +0 -9
package/src/config/schema/kernel-registry.schema.d.ts +0 -199
package/src/config/schema/kernel-registry.schema.js +0 -46
package/src/config/schema/kernel-thresholds.schema.d.ts +0 -302
package/src/config/schema/kernel-thresholds.schema.js +0 -195
package/src/config/schema/kernel-warmup.schema.d.ts +0 -19
package/src/config/schema/kernel-warmup.schema.js +0 -5
package/src/config/schema/kvcache.schema.d.ts +0 -131
package/src/config/schema/kvcache.schema.js +0 -31
package/src/config/schema/loading.schema.d.ts +0 -153
package/src/config/schema/loading.schema.js +0 -84
package/src/config/schema/lora.schema.d.ts +0 -12
package/src/config/schema/lora.schema.js +0 -12
package/src/config/schema/manifest.schema.d.ts +0 -507
package/src/config/schema/manifest.schema.js +0 -146
package/src/config/schema/memory-limits.schema.d.ts +0 -107
package/src/config/schema/memory-limits.schema.js +0 -57
package/src/config/schema/moe.schema.d.ts +0 -78
package/src/config/schema/moe.schema.js +0 -31
package/src/config/schema/platform.schema.d.ts +0 -121
package/src/config/schema/platform.schema.js +0 -1
package/src/config/schema/preset.schema.d.ts +0 -124
package/src/config/schema/preset.schema.js +0 -1
package/src/config/schema/quantization-defaults.schema.d.ts +0 -34
package/src/config/schema/quantization-defaults.schema.js +0 -5
package/src/config/schema/quantization.schema.d.ts +0 -10
package/src/config/schema/quantization.schema.js +0 -33
package/src/config/schema/shared-runtime.schema.d.ts +0 -75
package/src/config/schema/shared-runtime.schema.js +0 -45
package/src/config/schema/speculative.schema.d.ts +0 -21
package/src/config/schema/speculative.schema.js +0 -11
package/src/config/schema/storage.schema.d.ts +0 -123
package/src/config/schema/storage.schema.js +0 -66
package/src/config/schema/tooling.schema.d.ts +0 -29
package/src/config/schema/tooling.schema.js +0 -12
package/src/config/schema/training-metrics.schema.d.ts +0 -89
package/src/config/schema/training-metrics.schema.js +0 -374
package/src/config/schema/training.schema.d.ts +0 -88
package/src/config/schema/training.schema.js +0 -106
package/src/config/schema/tuner.schema.d.ts +0 -39
package/src/config/schema/tuner.schema.js +0 -13
package/src/config/schema/ul-training.schema.d.ts +0 -61
package/src/config/schema/ul-training.schema.js +0 -140
package/src/config/schema/units.schema.d.ts +0 -27
package/src/config/schema/units.schema.js +0 -26
package/src/config/training-defaults.d.ts +0 -24
package/src/config/training-defaults.js +0 -99
package/src/converter/conversion-plan.d.ts +0 -64
package/src/converter/conversion-plan.js +0 -565
package/src/converter/core.d.ts +0 -264
package/src/converter/core.js +0 -1383
package/src/converter/execution-v0-manifest.d.ts +0 -15
package/src/converter/execution-v0-manifest.js +0 -149
package/src/converter/index.d.ts +0 -99
package/src/converter/index.js +0 -60
package/src/converter/manifest-inference.d.ts +0 -20
package/src/converter/manifest-inference.js +0 -513
package/src/converter/parsers/diffusion.d.ts +0 -50
package/src/converter/parsers/diffusion.js +0 -327
package/src/converter/parsers/gguf.d.ts +0 -22
package/src/converter/parsers/gguf.js +0 -46
package/src/converter/parsers/index.d.ts +0 -21
package/src/converter/parsers/index.js +0 -12
package/src/converter/parsers/transformer.d.ts +0 -16
package/src/converter/parsers/transformer.js +0 -29
package/src/converter/quantization-info.d.ts +0 -37
package/src/converter/quantization-info.js +0 -422
package/src/converter/quantizer.d.ts +0 -101
package/src/converter/quantizer.js +0 -444
package/src/converter/rope-config.d.ts +0 -15
package/src/converter/rope-config.js +0 -262
package/src/converter/shard-packer.d.ts +0 -138
package/src/converter/shard-packer.js +0 -425
package/src/converter/tokenizer-utils.d.ts +0 -12
package/src/converter/tokenizer-utils.js +0 -104
package/src/debug/config.d.ts +0 -78
package/src/debug/config.js +0 -347
package/src/debug/history.d.ts +0 -65
package/src/debug/history.js +0 -71
package/src/debug/index.d.ts +0 -268
package/src/debug/index.js +0 -192
package/src/debug/log.d.ts +0 -46
package/src/debug/log.js +0 -132
package/src/debug/perf.d.ts +0 -33
package/src/debug/perf.js +0 -51
package/src/debug/reference/README.md +0 -114
package/src/debug/reference/hf_attn_debug.py +0 -114
package/src/debug/reference/hf_embed_check.py +0 -89
package/src/debug/reference/hf_layer_out.py +0 -100
package/src/debug/reference/hf_qwen35_linear_attn_debug.py +0 -268
package/src/debug/reference/hf_rope_check.py +0 -116
package/src/debug/reference/hf_weights.py +0 -75
package/src/debug/signals.d.ts +0 -63
package/src/debug/signals.js +0 -39
package/src/debug/stats.d.ts +0 -47
package/src/debug/stats.js +0 -160
package/src/debug/tensor.d.ts +0 -125
package/src/debug/tensor.js +0 -268
package/src/debug/trace.d.ts +0 -17
package/src/debug/trace.js +0 -167
package/src/diffusion/image-regression.d.ts +0 -31
package/src/diffusion/image-regression.js +0 -107
package/src/diffusion/index.d.ts +0 -8
package/src/diffusion/index.js +0 -8
package/src/distribution/p2p-control-plane.d.ts +0 -52
package/src/distribution/p2p-control-plane.js +0 -272
package/src/distribution/p2p-observability.d.ts +0 -116
package/src/distribution/p2p-observability.js +0 -303
package/src/distribution/p2p-transport-contract.d.ts +0 -57
package/src/distribution/p2p-transport-contract.js +0 -310
package/src/distribution/p2p-webrtc-browser.d.ts +0 -37
package/src/distribution/p2p-webrtc-browser.js +0 -454
package/src/distribution/shard-delivery.d.ts +0 -251
package/src/distribution/shard-delivery.js +0 -2186
package/src/energy/index.d.ts +0 -2
package/src/energy/index.js +0 -2
package/src/errors/doppler-error.d.ts +0 -21
package/src/errors/doppler-error.js +0 -25
package/src/errors/index.d.ts +0 -1
package/src/errors/index.js +0 -1
package/src/formats/gguf/index.d.ts +0 -8
package/src/formats/gguf/index.js +0 -4
package/src/formats/gguf/types.d.ts +0 -137
package/src/formats/gguf/types.js +0 -460
package/src/formats/index.d.ts +0 -51
package/src/formats/index.js +0 -13
package/src/formats/rdrr/classification.d.ts +0 -39
package/src/formats/rdrr/classification.js +0 -307
package/src/formats/rdrr/groups.d.ts +0 -35
package/src/formats/rdrr/groups.js +0 -73
package/src/formats/rdrr/index.d.ts +0 -25
package/src/formats/rdrr/index.js +0 -19
package/src/formats/rdrr/manifest.d.ts +0 -32
package/src/formats/rdrr/manifest.js +0 -108
package/src/formats/rdrr/parsing.d.ts +0 -27
package/src/formats/rdrr/parsing.js +0 -151
package/src/formats/rdrr/tensor-config-validator.d.ts +0 -42
package/src/formats/rdrr/tensor-config-validator.js +0 -156
package/src/formats/rdrr/types.d.ts +0 -201
package/src/formats/rdrr/types.js +0 -16
package/src/formats/rdrr/validation.d.ts +0 -9
package/src/formats/rdrr/validation.js +0 -213
package/src/formats/safetensors/index.d.ts +0 -8
package/src/formats/safetensors/index.js +0 -4
package/src/formats/safetensors/types.d.ts +0 -67
package/src/formats/safetensors/types.js +0 -102
package/src/formats/tokenizer/index.d.ts +0 -5
package/src/formats/tokenizer/index.js +0 -3
package/src/formats/tokenizer/types.d.ts +0 -9
package/src/formats/tokenizer/types.js +0 -22
package/src/generation/index.d.ts +0 -18
package/src/generation/index.js +0 -12
package/src/gpu/command-recorder.d.ts +0 -175
package/src/gpu/command-recorder.js +0 -498
package/src/gpu/device.d.ts +0 -142
package/src/gpu/device.js +0 -462
package/src/gpu/kernel-runtime.d.ts +0 -20
package/src/gpu/kernel-runtime.js +0 -39
package/src/gpu/kernel-selection-cache.d.ts +0 -13
package/src/gpu/kernel-selection-cache.js +0 -13
package/src/gpu/kernel-selection-log.d.ts +0 -12
package/src/gpu/kernel-selection-log.js +0 -28
package/src/gpu/kernel-selector.d.ts +0 -11
package/src/gpu/kernel-selector.js +0 -10
package/src/gpu/kernel-tuner/benchmarks.d.ts +0 -144
package/src/gpu/kernel-tuner/benchmarks.js +0 -902
package/src/gpu/kernel-tuner/cache.d.ts +0 -55
package/src/gpu/kernel-tuner/cache.js +0 -133
package/src/gpu/kernel-tuner/index.d.ts +0 -59
package/src/gpu/kernel-tuner/index.js +0 -38
package/src/gpu/kernel-tuner/tuner.d.ts +0 -82
package/src/gpu/kernel-tuner/tuner.js +0 -247
package/src/gpu/kernel-tuner/types.d.ts +0 -101
package/src/gpu/kernel-tuner/types.js +0 -4
package/src/gpu/kernel-tuner.d.ts +0 -33
package/src/gpu/kernel-tuner.js +0 -12
package/src/gpu/kernels/README.md +0 -127
package/src/gpu/kernels/attention.d.ts +0 -236
package/src/gpu/kernels/attention.js +0 -1439
package/src/gpu/kernels/attention.wgsl +0 -249
package/src/gpu/kernels/attention_bdpa_decode_f16.wgsl +0 -246
package/src/gpu/kernels/attention_decode.wgsl +0 -233
package/src/gpu/kernels/attention_decode_chunked_f16.wgsl +0 -183
package/src/gpu/kernels/attention_decode_chunked_f16kv.wgsl +0 -208
package/src/gpu/kernels/attention_decode_f16.wgsl +0 -202
package/src/gpu/kernels/attention_decode_f16kv.wgsl +0 -224
package/src/gpu/kernels/attention_decode_online_f16.wgsl +0 -223
package/src/gpu/kernels/attention_decode_online_f16kv.wgsl +0 -225
package/src/gpu/kernels/attention_decode_optimized.wgsl +0 -445
package/src/gpu/kernels/attention_decode_paged_f16.wgsl +0 -172
package/src/gpu/kernels/attention_decode_paged_f16kv.wgsl +0 -174
package/src/gpu/kernels/attention_decode_subgroup.wgsl +0 -233
package/src/gpu/kernels/attention_decode_tiered_f16.wgsl +0 -218
package/src/gpu/kernels/attention_decode_tiered_f16kv.wgsl +0 -220
package/src/gpu/kernels/attention_decode_tiered_int4_f16kv.wgsl +0 -242
package/src/gpu/kernels/attention_decode_tiered_int8_f16kv.wgsl +0 -242
package/src/gpu/kernels/attention_f16.wgsl +0 -214
package/src/gpu/kernels/attention_f16kv.wgsl +0 -242
package/src/gpu/kernels/attention_small.wgsl +0 -260
package/src/gpu/kernels/attention_small_f16.wgsl +0 -240
package/src/gpu/kernels/attention_small_f16kv.wgsl +0 -266
package/src/gpu/kernels/attention_streaming.wgsl +0 -149
package/src/gpu/kernels/attention_streaming_f16.wgsl +0 -147
package/src/gpu/kernels/attention_streaming_f16kv.wgsl +0 -151
package/src/gpu/kernels/backward/adam.d.ts +0 -28
package/src/gpu/kernels/backward/adam.js +0 -203
package/src/gpu/kernels/backward/adam.wgsl +0 -50
package/src/gpu/kernels/backward/attention_backward.d.ts +0 -22
package/src/gpu/kernels/backward/attention_backward.js +0 -364
package/src/gpu/kernels/backward/attention_backward.wgsl +0 -49
package/src/gpu/kernels/backward/bias_add_backward.d.ts +0 -17
package/src/gpu/kernels/backward/bias_add_backward.js +0 -24
package/src/gpu/kernels/backward/bias_add_backward.wgsl +0 -33
package/src/gpu/kernels/backward/conv2d_backward.d.ts +0 -31
package/src/gpu/kernels/backward/conv2d_backward.js +0 -148
package/src/gpu/kernels/backward/conv2d_backward_input.wgsl +0 -83
package/src/gpu/kernels/backward/conv2d_backward_weight.wgsl +0 -70
package/src/gpu/kernels/backward/cross_entropy_backward.d.ts +0 -23
package/src/gpu/kernels/backward/cross_entropy_backward.js +0 -29
package/src/gpu/kernels/backward/cross_entropy_backward.wgsl +0 -39
package/src/gpu/kernels/backward/embed_backward.d.ts +0 -29
package/src/gpu/kernels/backward/embed_backward.js +0 -118
package/src/gpu/kernels/backward/embed_backward.wgsl +0 -73
package/src/gpu/kernels/backward/gelu_backward.d.ts +0 -16
package/src/gpu/kernels/backward/gelu_backward.js +0 -39
package/src/gpu/kernels/backward/gelu_backward.wgsl +0 -38
package/src/gpu/kernels/backward/groupnorm_backward.d.ts +0 -24
package/src/gpu/kernels/backward/groupnorm_backward.js +0 -29
package/src/gpu/kernels/backward/groupnorm_backward.wgsl +0 -143
package/src/gpu/kernels/backward/index.d.ts +0 -17
package/src/gpu/kernels/backward/index.js +0 -23
package/src/gpu/kernels/backward/layernorm_backward.d.ts +0 -22
package/src/gpu/kernels/backward/layernorm_backward.js +0 -135
package/src/gpu/kernels/backward/layernorm_backward.wgsl +0 -194
package/src/gpu/kernels/backward/matmul_backward.d.ts +0 -32
package/src/gpu/kernels/backward/matmul_backward.js +0 -124
package/src/gpu/kernels/backward/matmul_backward.wgsl +0 -90
package/src/gpu/kernels/backward/matmul_transpose_a.wgsl +0 -84
package/src/gpu/kernels/backward/pixel_shuffle_backward.d.ts +0 -22
package/src/gpu/kernels/backward/pixel_shuffle_backward.js +0 -30
package/src/gpu/kernels/backward/pixel_shuffle_backward.wgsl +0 -54
package/src/gpu/kernels/backward/rmsnorm_backward.d.ts +0 -24
package/src/gpu/kernels/backward/rmsnorm_backward.js +0 -101
package/src/gpu/kernels/backward/rmsnorm_backward.wgsl +0 -78
package/src/gpu/kernels/backward/rope_backward.d.ts +0 -25
package/src/gpu/kernels/backward/rope_backward.js +0 -109
package/src/gpu/kernels/backward/rope_backward.wgsl +0 -59
package/src/gpu/kernels/backward/scale_backward.d.ts +0 -16
package/src/gpu/kernels/backward/scale_backward.js +0 -84
package/src/gpu/kernels/backward/scale_backward.wgsl +0 -27
package/src/gpu/kernels/backward/silu_backward.d.ts +0 -16
package/src/gpu/kernels/backward/silu_backward.js +0 -39
package/src/gpu/kernels/backward/silu_backward.wgsl +0 -31
package/src/gpu/kernels/backward/softmax_backward.d.ts +0 -16
package/src/gpu/kernels/backward/softmax_backward.js +0 -43
package/src/gpu/kernels/backward/softmax_backward.wgsl +0 -44
package/src/gpu/kernels/backward/upsample2d_backward.d.ts +0 -21
package/src/gpu/kernels/backward/upsample2d_backward.js +0 -30
package/src/gpu/kernels/backward/upsample2d_backward.wgsl +0 -59
package/src/gpu/kernels/backward/utils.d.ts +0 -45
package/src/gpu/kernels/backward/utils.js +0 -371
package/src/gpu/kernels/bf16_to_f16.wgsl +0 -54
package/src/gpu/kernels/bf16_to_f32.wgsl +0 -70
package/src/gpu/kernels/bias_add.wgsl +0 -42
package/src/gpu/kernels/bias_add_f16.wgsl +0 -47
package/src/gpu/kernels/cast.d.ts +0 -67
package/src/gpu/kernels/cast.js +0 -464
package/src/gpu/kernels/cast_f16_to_f32.wgsl +0 -31
package/src/gpu/kernels/cast_f32_to_f16.wgsl +0 -36
package/src/gpu/kernels/check-finiteness.d.ts +0 -15
package/src/gpu/kernels/check-finiteness.js +0 -149
package/src/gpu/kernels/check-stop.d.ts +0 -31
package/src/gpu/kernels/check-stop.js +0 -170
package/src/gpu/kernels/clamp.d.ts +0 -22
package/src/gpu/kernels/clamp.js +0 -42
package/src/gpu/kernels/clamp.wgsl +0 -24
package/src/gpu/kernels/constants.d.ts +0 -168
package/src/gpu/kernels/constants.js +0 -129
package/src/gpu/kernels/conv2d.d.ts +0 -34
package/src/gpu/kernels/conv2d.js +0 -91
package/src/gpu/kernels/conv2d.wgsl +0 -70
package/src/gpu/kernels/conv2d_f16.wgsl +0 -72
package/src/gpu/kernels/cross_entropy_loss.d.ts +0 -21
package/src/gpu/kernels/cross_entropy_loss.js +0 -60
package/src/gpu/kernels/cross_entropy_loss.wgsl +0 -39
package/src/gpu/kernels/depthwise_conv2d.d.ts +0 -29
package/src/gpu/kernels/depthwise_conv2d.js +0 -109
package/src/gpu/kernels/depthwise_conv2d.wgsl +0 -55
package/src/gpu/kernels/depthwise_conv2d_f16.wgsl +0 -59
package/src/gpu/kernels/dequant.d.ts +0 -108
package/src/gpu/kernels/dequant.js +0 -576
package/src/gpu/kernels/dequant_f16_out.wgsl +0 -153
package/src/gpu/kernels/dequant_f16_out_vec4.wgsl +0 -152
package/src/gpu/kernels/dequant_f16_rowwise.wgsl +0 -139
package/src/gpu/kernels/dequant_f32_rowwise.wgsl +0 -133
package/src/gpu/kernels/dequant_mxfp4.wgsl +0 -120
package/src/gpu/kernels/dequant_mxfp4_expert.wgsl +0 -129
package/src/gpu/kernels/dequant_mxfp4_expert_f16.wgsl +0 -105
package/src/gpu/kernels/dequant_mxfp4_vec4.wgsl +0 -116
package/src/gpu/kernels/dequant_q6k.wgsl +0 -140
package/src/gpu/kernels/dequant_q8_0.wgsl +0 -98
package/src/gpu/kernels/dequant_shared.wgsl +0 -204
package/src/gpu/kernels/dequant_shared_vec4.wgsl +0 -155
package/src/gpu/kernels/dequant_subgroup.wgsl +0 -206
package/src/gpu/kernels/dispatch.d.ts +0 -157
package/src/gpu/kernels/dispatch.js +0 -235
package/src/gpu/kernels/energy.d.ts +0 -113
package/src/gpu/kernels/energy.js +0 -448
package/src/gpu/kernels/energy_eval.wgsl +0 -26
package/src/gpu/kernels/energy_eval_f16.wgsl +0 -30
package/src/gpu/kernels/energy_quintel_grad.wgsl +0 -92
package/src/gpu/kernels/energy_quintel_grad_f16.wgsl +0 -96
package/src/gpu/kernels/energy_quintel_reduce.wgsl +0 -112
package/src/gpu/kernels/energy_quintel_reduce_f16.wgsl +0 -116
package/src/gpu/kernels/energy_quintel_update.wgsl +0 -92
package/src/gpu/kernels/energy_quintel_update_f16.wgsl +0 -96
package/src/gpu/kernels/energy_update.wgsl +0 -25
package/src/gpu/kernels/energy_update_f16.wgsl +0 -30
package/src/gpu/kernels/feature-check.d.ts +0 -42
package/src/gpu/kernels/feature-check.js +0 -70
package/src/gpu/kernels/fused_ffn.d.ts +0 -65
package/src/gpu/kernels/fused_ffn.js +0 -337
package/src/gpu/kernels/fused_ffn.wgsl +0 -420
package/src/gpu/kernels/fused_ffn_f16.wgsl +0 -213
package/src/gpu/kernels/fused_ffn_q4k.wgsl +0 -375
package/src/gpu/kernels/fused_matmul_q4.wgsl +0 -404
package/src/gpu/kernels/fused_matmul_q4_batched.wgsl +0 -194
package/src/gpu/kernels/fused_matmul_q4_batched_f16.wgsl +0 -170
package/src/gpu/kernels/fused_matmul_q4_batched_f16a.wgsl +0 -154
package/src/gpu/kernels/fused_matmul_q4_f16a.wgsl +0 -219
package/src/gpu/kernels/fused_matmul_q4_multicol_f16.wgsl +0 -216
package/src/gpu/kernels/fused_matmul_q4_multicol_f16a.wgsl +0 -204
package/src/gpu/kernels/fused_matmul_residual.d.ts +0 -46
package/src/gpu/kernels/fused_matmul_residual.js +0 -175
package/src/gpu/kernels/fused_matmul_rmsnorm.d.ts +0 -64
package/src/gpu/kernels/fused_matmul_rmsnorm.js +0 -290
package/src/gpu/kernels/fused_matmul_rmsnorm.wgsl +0 -324
package/src/gpu/kernels/fused_matmul_rmsnorm_f16.wgsl +0 -303
package/src/gpu/kernels/fused_swiglu.wgsl +0 -63
package/src/gpu/kernels/fused_swiglu_f16.wgsl +0 -57
package/src/gpu/kernels/gated-short-conv.d.ts +0 -63
package/src/gpu/kernels/gated-short-conv.js +0 -284
package/src/gpu/kernels/gather.d.ts +0 -64
package/src/gpu/kernels/gather.js +0 -137
package/src/gpu/kernels/gather.wgsl +0 -61
package/src/gpu/kernels/gather_f16.wgsl +0 -65
package/src/gpu/kernels/gather_f16_f16_out.wgsl +0 -55
package/src/gpu/kernels/gather_f16_out.wgsl +0 -55
package/src/gpu/kernels/gather_f16_vec4.wgsl +0 -76
package/src/gpu/kernels/gather_f16_vec4_f16_out.wgsl +0 -68
package/src/gpu/kernels/gather_vec4.wgsl +0 -74
package/src/gpu/kernels/gather_vec4_f16_out.wgsl +0 -68
package/src/gpu/kernels/gelu.d.ts +0 -33
package/src/gpu/kernels/gelu.js +0 -55
package/src/gpu/kernels/gelu.wgsl +0 -64
package/src/gpu/kernels/gelu_f16.wgsl +0 -66
package/src/gpu/kernels/gptoss_mxfp4_expert_fused.wgsl +0 -127
package/src/gpu/kernels/gptoss_router_topk.wgsl +0 -119
package/src/gpu/kernels/grouped_pointwise_conv2d.d.ts +0 -27
package/src/gpu/kernels/grouped_pointwise_conv2d.js +0 -103
package/src/gpu/kernels/grouped_pointwise_conv2d.wgsl +0 -44
package/src/gpu/kernels/grouped_pointwise_conv2d_f16.wgsl +0 -48
package/src/gpu/kernels/groupnorm.d.ts +0 -31
package/src/gpu/kernels/groupnorm.js +0 -102
package/src/gpu/kernels/groupnorm_apply.wgsl +0 -41
package/src/gpu/kernels/groupnorm_apply_f16.wgsl +0 -46
package/src/gpu/kernels/groupnorm_stats.wgsl +0 -76
package/src/gpu/kernels/groupnorm_stats_f16.wgsl +0 -79
package/src/gpu/kernels/index.d.ts +0 -374
package/src/gpu/kernels/index.js +0 -315
package/src/gpu/kernels/kernel-base.d.ts +0 -33
package/src/gpu/kernels/kernel-base.js +0 -46
package/src/gpu/kernels/kernel-configs.d.ts +0 -65
package/src/gpu/kernels/kernel-configs.js +0 -50
package/src/gpu/kernels/kernel-tuning.d.ts +0 -42
package/src/gpu/kernels/kernel-tuning.js +0 -149
package/src/gpu/kernels/kv-quantize.d.ts +0 -37
package/src/gpu/kernels/kv-quantize.js +0 -141
package/src/gpu/kernels/kv_quantize_int4.wgsl +0 -119
package/src/gpu/kernels/kv_quantize_int8.wgsl +0 -119
package/src/gpu/kernels/layernorm.d.ts +0 -37
package/src/gpu/kernels/layernorm.js +0 -96
package/src/gpu/kernels/layernorm.wgsl +0 -121
package/src/gpu/kernels/layernorm_f16.wgsl +0 -103
package/src/gpu/kernels/linear-attention-core.d.ts +0 -39
package/src/gpu/kernels/linear-attention-core.js +0 -555
package/src/gpu/kernels/logit-merge.d.ts +0 -110
package/src/gpu/kernels/logit-merge.js +0 -394
package/src/gpu/kernels/matmul-dispatch.d.ts +0 -38
package/src/gpu/kernels/matmul-dispatch.js +0 -155
package/src/gpu/kernels/matmul-selection.d.ts +0 -87
package/src/gpu/kernels/matmul-selection.js +0 -518
package/src/gpu/kernels/matmul.d.ts +0 -114
package/src/gpu/kernels/matmul.js +0 -384
package/src/gpu/kernels/matmul_f16.wgsl +0 -170
package/src/gpu/kernels/matmul_f16_tiled.wgsl +0 -165
package/src/gpu/kernels/matmul_f16w_f32a.wgsl +0 -89
package/src/gpu/kernels/matmul_f16w_f32a_tiled.wgsl +0 -154
package/src/gpu/kernels/matmul_f32.wgsl +0 -100
package/src/gpu/kernels/matmul_gemv.wgsl +0 -80
package/src/gpu/kernels/matmul_gemv_f16a.wgsl +0 -81
package/src/gpu/kernels/matmul_gemv_residual.wgsl +0 -119
package/src/gpu/kernels/matmul_gemv_residual_f16.wgsl +0 -78
package/src/gpu/kernels/matmul_gemv_subgroup.wgsl +0 -343
package/src/gpu/kernels/matmul_gemv_subgroup_f16a.wgsl +0 -514
package/src/gpu/kernels/modulate.d.ts +0 -29
package/src/gpu/kernels/modulate.js +0 -57
package/src/gpu/kernels/modulate.wgsl +0 -40
package/src/gpu/kernels/modulate_f16.wgsl +0 -43
package/src/gpu/kernels/moe.d.ts +0 -164
package/src/gpu/kernels/moe.js +0 -542
package/src/gpu/kernels/moe_gather.wgsl +0 -170
package/src/gpu/kernels/moe_gather_f16.wgsl +0 -82
package/src/gpu/kernels/moe_gather_vec4.wgsl +0 -74
package/src/gpu/kernels/moe_offsets.wgsl +0 -48
package/src/gpu/kernels/pipeline-cache.d.ts +0 -88
package/src/gpu/kernels/pipeline-cache.js +0 -305
package/src/gpu/kernels/pixel_shuffle.d.ts +0 -27
package/src/gpu/kernels/pixel_shuffle.js +0 -57
package/src/gpu/kernels/pixel_shuffle.wgsl +0 -43
package/src/gpu/kernels/pixel_shuffle_f16.wgsl +0 -46
package/src/gpu/kernels/relu.d.ts +0 -18
package/src/gpu/kernels/relu.js +0 -66
package/src/gpu/kernels/relu.wgsl +0 -22
package/src/gpu/kernels/relu_f16.wgsl +0 -24
package/src/gpu/kernels/repeat_channels.d.ts +0 -21
package/src/gpu/kernels/repeat_channels.js +0 -68
package/src/gpu/kernels/repeat_channels.wgsl +0 -28
package/src/gpu/kernels/repeat_channels_f16.wgsl +0 -30
package/src/gpu/kernels/residual.d.ts +0 -74
package/src/gpu/kernels/residual.js +0 -173
package/src/gpu/kernels/residual.wgsl +0 -56
package/src/gpu/kernels/residual_f16.wgsl +0 -36
package/src/gpu/kernels/residual_f16_vec4.wgsl +0 -48
package/src/gpu/kernels/residual_vec4.wgsl +0 -47
package/src/gpu/kernels/rmsnorm.d.ts +0 -53
package/src/gpu/kernels/rmsnorm.js +0 -215
package/src/gpu/kernels/rmsnorm.wgsl +0 -425
package/src/gpu/kernels/rmsnorm_f16.wgsl +0 -172
package/src/gpu/kernels/rope.d.ts +0 -50
package/src/gpu/kernels/rope.js +0 -66
package/src/gpu/kernels/rope.wgsl +0 -344
package/src/gpu/kernels/rope_f16.wgsl +0 -271
package/src/gpu/kernels/rule-matcher.d.ts +0 -30
package/src/gpu/kernels/rule-matcher.js +0 -42
package/src/gpu/kernels/rule-registry.d.ts +0 -7
package/src/gpu/kernels/rule-registry.js +0 -41
package/src/gpu/kernels/sample.d.ts +0 -75
package/src/gpu/kernels/sample.js +0 -565
package/src/gpu/kernels/sample.wgsl +0 -407
package/src/gpu/kernels/sample_f16.wgsl +0 -361
package/src/gpu/kernels/sana_linear_attention.d.ts +0 -27
package/src/gpu/kernels/sana_linear_attention.js +0 -129
package/src/gpu/kernels/sana_linear_attention_apply.wgsl +0 -43
package/src/gpu/kernels/sana_linear_attention_apply_f16.wgsl +0 -46
package/src/gpu/kernels/sana_linear_attention_summary.wgsl +0 -51
package/src/gpu/kernels/sana_linear_attention_summary_f16.wgsl +0 -53
package/src/gpu/kernels/scale.d.ts +0 -35
package/src/gpu/kernels/scale.js +0 -44
package/src/gpu/kernels/scale.wgsl +0 -38
package/src/gpu/kernels/scatter_add.wgsl +0 -88
package/src/gpu/kernels/scatter_add_dynamic.wgsl +0 -59
package/src/gpu/kernels/scatter_add_dynamic_f16.wgsl +0 -52
package/src/gpu/kernels/scatter_add_dynamic_f16_weights.wgsl +0 -50
package/src/gpu/kernels/scatter_add_vec4.wgsl +0 -70
package/src/gpu/kernels/shader-cache.d.ts +0 -56
package/src/gpu/kernels/shader-cache.js +0 -213
package/src/gpu/kernels/silu.d.ts +0 -76
package/src/gpu/kernels/silu.js +0 -406
package/src/gpu/kernels/silu.wgsl +0 -109
package/src/gpu/kernels/silu_f16.wgsl +0 -108
package/src/gpu/kernels/softmax.d.ts +0 -57
package/src/gpu/kernels/softmax.js +0 -125
package/src/gpu/kernels/softmax.wgsl +0 -388
package/src/gpu/kernels/softmax_subgroup.wgsl +0 -175
package/src/gpu/kernels/split_qg.d.ts +0 -50
package/src/gpu/kernels/split_qg.js +0 -46
package/src/gpu/kernels/split_qg.wgsl +0 -58
package/src/gpu/kernels/split_qg_f16.wgsl +0 -62
package/src/gpu/kernels/split_qkv.d.ts +0 -51
package/src/gpu/kernels/split_qkv.js +0 -51
package/src/gpu/kernels/split_qkv.wgsl +0 -71
package/src/gpu/kernels/split_qkv_f16.wgsl +0 -75
package/src/gpu/kernels/topk.wgsl +0 -243
package/src/gpu/kernels/topk_f16.wgsl +0 -108
package/src/gpu/kernels/topk_f16_weights.wgsl +0 -101
package/src/gpu/kernels/transpose.d.ts +0 -21
package/src/gpu/kernels/transpose.js +0 -51
package/src/gpu/kernels/transpose.wgsl +0 -33
package/src/gpu/kernels/types.d.ts +0 -21
package/src/gpu/kernels/types.js +0 -4
package/src/gpu/kernels/uniform-utils.d.ts +0 -48
package/src/gpu/kernels/uniform-utils.js +0 -94
package/src/gpu/kernels/upsample2d.d.ts +0 -25
package/src/gpu/kernels/upsample2d.js +0 -67
package/src/gpu/kernels/upsample2d.wgsl +0 -34
package/src/gpu/kernels/upsample2d_f16.wgsl +0 -38
package/src/gpu/kernels/utils.d.ts +0 -106
package/src/gpu/kernels/utils.js +0 -246
package/src/gpu/multi-model-recorder.d.ts +0 -21
package/src/gpu/multi-model-recorder.js +0 -31
package/src/gpu/partitioned-buffer-pool.d.ts +0 -28
package/src/gpu/partitioned-buffer-pool.js +0 -57
package/src/gpu/perf-guards.d.ts +0 -25
package/src/gpu/perf-guards.js +0 -133
package/src/gpu/profiler.d.ts +0 -114
package/src/gpu/profiler.js +0 -396
package/src/gpu/readback-utils.d.ts +0 -16
package/src/gpu/readback-utils.js +0 -41
package/src/gpu/submit-tracker.d.ts +0 -111
package/src/gpu/submit-tracker.js +0 -242
package/src/gpu/tensor.d.ts +0 -69
package/src/gpu/tensor.js +0 -75
package/src/gpu/uniform-cache.d.ts +0 -109
package/src/gpu/uniform-cache.js +0 -263
package/src/gpu/weight-buffer.d.ts +0 -115
package/src/gpu/weight-buffer.js +0 -118
package/src/hotswap/intent-bundle.d.ts +0 -37
package/src/hotswap/intent-bundle.js +0 -129
package/src/hotswap/manifest.d.ts +0 -42
package/src/hotswap/manifest.js +0 -124
package/src/hotswap/runtime.d.ts +0 -31
package/src/hotswap/runtime.js +0 -150
package/src/index-browser.d.ts +0 -92
package/src/index-browser.js +0 -68
package/src/index-internal.d.ts +0 -2
package/src/index-internal.js +0 -2
package/src/index.d.ts +0 -103
package/src/index.js +0 -76
package/src/inference/README.md +0 -593
package/src/inference/browser-harness-contract-helpers.d.ts +0 -5
package/src/inference/browser-harness-contract-helpers.js +0 -28
package/src/inference/browser-harness-diffusion-energy-suites.d.ts +0 -2
package/src/inference/browser-harness-diffusion-energy-suites.js +0 -269
package/src/inference/browser-harness-model-helpers.d.ts +0 -16
package/src/inference/browser-harness-model-helpers.js +0 -217
package/src/inference/browser-harness-report-helpers.d.ts +0 -7
package/src/inference/browser-harness-report-helpers.js +0 -42
package/src/inference/browser-harness-runtime-helpers.d.ts +0 -61
package/src/inference/browser-harness-runtime-helpers.js +0 -415
package/src/inference/browser-harness-suite-helpers.d.ts +0 -28
package/src/inference/browser-harness-suite-helpers.js +0 -268
package/src/inference/browser-harness-text-helpers.d.ts +0 -27
package/src/inference/browser-harness-text-helpers.js +0 -788
package/src/inference/browser-harness.d.ts +0 -242
package/src/inference/browser-harness.js +0 -990
package/src/inference/decode-buffers.d.ts +0 -108
package/src/inference/decode-buffers.js +0 -181
package/src/inference/decode-ring.d.ts +0 -52
package/src/inference/decode-ring.js +0 -273
package/src/inference/expert-router.d.ts +0 -27
package/src/inference/expert-router.js +0 -55
package/src/inference/functiongemma.d.ts +0 -15
package/src/inference/functiongemma.js +0 -1
package/src/inference/kv-cache/base.d.ts +0 -150
package/src/inference/kv-cache/base.js +0 -1076
package/src/inference/kv-cache/basis-decomposed-paged.d.ts +0 -50
package/src/inference/kv-cache/basis-decomposed-paged.js +0 -276
package/src/inference/kv-cache/index.d.ts +0 -35
package/src/inference/kv-cache/index.js +0 -20
package/src/inference/kv-cache/sliding-window.d.ts +0 -72
package/src/inference/kv-cache/sliding-window.js +0 -243
package/src/inference/kv-cache/tiered.d.ts +0 -89
package/src/inference/kv-cache/tiered.js +0 -576
package/src/inference/kv-cache/types.d.ts +0 -188
package/src/inference/kv-cache/types.js +0 -80
package/src/inference/kv-cache.d.ts +0 -36
package/src/inference/kv-cache.js +0 -18
package/src/inference/moe-router.d.ts +0 -212
package/src/inference/moe-router.js +0 -585
package/src/inference/multi-model-network.d.ts +0 -139
package/src/inference/multi-model-network.js +0 -771
package/src/inference/multi-pipeline-pool.d.ts +0 -62
package/src/inference/multi-pipeline-pool.js +0 -161
package/src/inference/network-evolution.d.ts +0 -55
package/src/inference/network-evolution.js +0 -79
package/src/inference/pipelines/context.d.ts +0 -21
package/src/inference/pipelines/context.js +0 -184
package/src/inference/pipelines/diffusion/helpers.d.ts +0 -29
package/src/inference/pipelines/diffusion/helpers.js +0 -120
package/src/inference/pipelines/diffusion/index.d.ts +0 -3
package/src/inference/pipelines/diffusion/index.js +0 -3
package/src/inference/pipelines/diffusion/init.d.ts +0 -24
package/src/inference/pipelines/diffusion/init.js +0 -138
package/src/inference/pipelines/diffusion/pipeline.d.ts +0 -38
package/src/inference/pipelines/diffusion/pipeline.js +0 -772
package/src/inference/pipelines/diffusion/sana-transformer.d.ts +0 -53
package/src/inference/pipelines/diffusion/sana-transformer.js +0 -738
package/src/inference/pipelines/diffusion/scheduler.d.ts +0 -35
package/src/inference/pipelines/diffusion/scheduler.js +0 -153
package/src/inference/pipelines/diffusion/sd3-transformer.d.ts +0 -20
package/src/inference/pipelines/diffusion/sd3-transformer.js +0 -1194
package/src/inference/pipelines/diffusion/sd3-weights.d.ts +0 -21
package/src/inference/pipelines/diffusion/sd3-weights.js +0 -287
package/src/inference/pipelines/diffusion/text-encoder-gpu.d.ts +0 -87
package/src/inference/pipelines/diffusion/text-encoder-gpu.js +0 -1224
package/src/inference/pipelines/diffusion/text-encoder.d.ts +0 -29
package/src/inference/pipelines/diffusion/text-encoder.js +0 -195
package/src/inference/pipelines/diffusion/types.d.ts +0 -116
package/src/inference/pipelines/diffusion/types.js +0 -1
package/src/inference/pipelines/diffusion/vae.d.ts +0 -20
package/src/inference/pipelines/diffusion/vae.js +0 -1375
package/src/inference/pipelines/diffusion/weights.d.ts +0 -40
package/src/inference/pipelines/diffusion/weights.js +0 -150
package/src/inference/pipelines/dream/energy-head-pipeline.d.ts +0 -29
package/src/inference/pipelines/dream/energy-head-pipeline.js +0 -6
package/src/inference/pipelines/dream/pipeline.d.ts +0 -17
package/src/inference/pipelines/dream/pipeline.js +0 -8
package/src/inference/pipelines/energy/index.d.ts +0 -1
package/src/inference/pipelines/energy/index.js +0 -1
package/src/inference/pipelines/energy/pipeline.d.ts +0 -27
package/src/inference/pipelines/energy/pipeline.js +0 -686
package/src/inference/pipelines/energy/quintel.d.ts +0 -92
package/src/inference/pipelines/energy/quintel.js +0 -218
package/src/inference/pipelines/energy/types.d.ts +0 -63
package/src/inference/pipelines/energy/types.js +0 -1
package/src/inference/pipelines/energy-head/index.d.ts +0 -6
package/src/inference/pipelines/energy-head/index.js +0 -6
package/src/inference/pipelines/energy-head/row-head-pipeline.d.ts +0 -103
package/src/inference/pipelines/energy-head/row-head-pipeline.js +0 -491
package/src/inference/pipelines/factory.d.ts +0 -10
package/src/inference/pipelines/factory.js +0 -6
package/src/inference/pipelines/index.d.ts +0 -22
package/src/inference/pipelines/index.js +0 -19
package/src/inference/pipelines/registry.d.ts +0 -15
package/src/inference/pipelines/registry.js +0 -23
package/src/inference/pipelines/rng.d.ts +0 -2
package/src/inference/pipelines/rng.js +0 -17
package/src/inference/pipelines/structured/index.d.ts +0 -8
package/src/inference/pipelines/structured/index.js +0 -8
package/src/inference/pipelines/structured/json-head-pipeline.d.ts +0 -58
package/src/inference/pipelines/structured/json-head-pipeline.js +0 -196
package/src/inference/pipelines/text/attention/index.d.ts +0 -24
package/src/inference/pipelines/text/attention/index.js +0 -17
package/src/inference/pipelines/text/attention/output-projection.d.ts +0 -12
package/src/inference/pipelines/text/attention/output-projection.js +0 -8
package/src/inference/pipelines/text/attention/projections.d.ts +0 -113
package/src/inference/pipelines/text/attention/projections.js +0 -526
package/src/inference/pipelines/text/attention/record.d.ts +0 -36
package/src/inference/pipelines/text/attention/record.js +0 -686
package/src/inference/pipelines/text/attention/run.d.ts +0 -38
package/src/inference/pipelines/text/attention/run.js +0 -942
package/src/inference/pipelines/text/attention/types.d.ts +0 -98
package/src/inference/pipelines/text/attention/types.js +0 -67
package/src/inference/pipelines/text/attention.d.ts +0 -23
package/src/inference/pipelines/text/attention.js +0 -12
package/src/inference/pipelines/text/bdpa-steamroller.d.ts +0 -22
package/src/inference/pipelines/text/bdpa-steamroller.js +0 -158
package/src/inference/pipelines/text/buffer-types.d.ts +0 -7
package/src/inference/pipelines/text/buffer-types.js +0 -4
package/src/inference/pipelines/text/chat-format.d.ts +0 -46
package/src/inference/pipelines/text/chat-format.js +0 -390
package/src/inference/pipelines/text/config.d.ts +0 -245
package/src/inference/pipelines/text/config.js +0 -731
package/src/inference/pipelines/text/debug-utils/config.d.ts +0 -144
package/src/inference/pipelines/text/debug-utils/config.js +0 -156
package/src/inference/pipelines/text/debug-utils/index.d.ts +0 -53
package/src/inference/pipelines/text/debug-utils/index.js +0 -44
package/src/inference/pipelines/text/debug-utils/logging.d.ts +0 -106
package/src/inference/pipelines/text/debug-utils/logging.js +0 -152
package/src/inference/pipelines/text/debug-utils/tensor.d.ts +0 -119
package/src/inference/pipelines/text/debug-utils/tensor.js +0 -268
package/src/inference/pipelines/text/debug-utils/utils.d.ts +0 -77
package/src/inference/pipelines/text/debug-utils/utils.js +0 -139
package/src/inference/pipelines/text/debug-utils.d.ts +0 -42
package/src/inference/pipelines/text/debug-utils.js +0 -34
package/src/inference/pipelines/text/embed.d.ts +0 -67
package/src/inference/pipelines/text/embed.js +0 -474
package/src/inference/pipelines/text/execution-plan.d.ts +0 -116
package/src/inference/pipelines/text/execution-plan.js +0 -329
package/src/inference/pipelines/text/execution-v0-contract-helpers.d.ts +0 -59
package/src/inference/pipelines/text/execution-v0-contract-helpers.js +0 -937
package/src/inference/pipelines/text/execution-v0-runtime-builders.d.ts +0 -15
package/src/inference/pipelines/text/execution-v0-runtime-builders.js +0 -286
package/src/inference/pipelines/text/execution-v0.d.ts +0 -66
package/src/inference/pipelines/text/execution-v0.js +0 -266
package/src/inference/pipelines/text/ffn/dense.d.ts +0 -40
package/src/inference/pipelines/text/ffn/dense.js +0 -759
package/src/inference/pipelines/text/ffn/index.d.ts +0 -23
package/src/inference/pipelines/text/ffn/index.js +0 -16
package/src/inference/pipelines/text/ffn/moe.d.ts +0 -21
package/src/inference/pipelines/text/ffn/moe.js +0 -49
package/src/inference/pipelines/text/ffn/sandwich.d.ts +0 -25
package/src/inference/pipelines/text/ffn/sandwich.js +0 -196
package/src/inference/pipelines/text/ffn/standard.d.ts +0 -23
package/src/inference/pipelines/text/ffn/standard.js +0 -87
package/src/inference/pipelines/text/ffn/types.d.ts +0 -30
package/src/inference/pipelines/text/ffn/types.js +0 -25
package/src/inference/pipelines/text/ffn.d.ts +0 -31
package/src/inference/pipelines/text/ffn.js +0 -18
package/src/inference/pipelines/text/finiteness-guard-status.d.ts +0 -11
package/src/inference/pipelines/text/finiteness-guard-status.js +0 -21
package/src/inference/pipelines/text/finiteness-policy.d.ts +0 -35
package/src/inference/pipelines/text/finiteness-policy.js +0 -45
package/src/inference/pipelines/text/generator-helpers.d.ts +0 -34
package/src/inference/pipelines/text/generator-helpers.js +0 -176
package/src/inference/pipelines/text/generator-runtime.d.ts +0 -93
package/src/inference/pipelines/text/generator-runtime.js +0 -392
package/src/inference/pipelines/text/generator-steps.d.ts +0 -136
package/src/inference/pipelines/text/generator-steps.js +0 -1214
package/src/inference/pipelines/text/generator.d.ts +0 -46
package/src/inference/pipelines/text/generator.js +0 -1515
package/src/inference/pipelines/text/index.d.ts +0 -5
package/src/inference/pipelines/text/index.js +0 -6
package/src/inference/pipelines/text/init.d.ts +0 -314
package/src/inference/pipelines/text/init.js +0 -1126
package/src/inference/pipelines/text/kernel-path-auto-select.d.ts +0 -12
package/src/inference/pipelines/text/kernel-path-auto-select.js +0 -92
package/src/inference/pipelines/text/kernel-trace.d.ts +0 -152
package/src/inference/pipelines/text/kernel-trace.js +0 -330
package/src/inference/pipelines/text/layer-plan.d.ts +0 -65
package/src/inference/pipelines/text/layer-plan.js +0 -249
package/src/inference/pipelines/text/layer.d.ts +0 -56
package/src/inference/pipelines/text/layer.js +0 -951
package/src/inference/pipelines/text/linear-attention.d.ts +0 -109
package/src/inference/pipelines/text/linear-attention.js +0 -907
package/src/inference/pipelines/text/logits/cpu.d.ts +0 -81
package/src/inference/pipelines/text/logits/cpu.js +0 -91
package/src/inference/pipelines/text/logits/gpu.d.ts +0 -113
package/src/inference/pipelines/text/logits/gpu.js +0 -411
package/src/inference/pipelines/text/logits/index.d.ts +0 -62
package/src/inference/pipelines/text/logits/index.js +0 -306
package/src/inference/pipelines/text/logits/types.d.ts +0 -46
package/src/inference/pipelines/text/logits/types.js +0 -4
package/src/inference/pipelines/text/logits/utils.d.ts +0 -56
package/src/inference/pipelines/text/logits/utils.js +0 -68
package/src/inference/pipelines/text/logits.d.ts +0 -27
package/src/inference/pipelines/text/logits.js +0 -16
package/src/inference/pipelines/text/lora-apply.d.ts +0 -28
package/src/inference/pipelines/text/lora-apply.js +0 -76
package/src/inference/pipelines/text/lora-types.d.ts +0 -39
package/src/inference/pipelines/text/lora-types.js +0 -18
package/src/inference/pipelines/text/lora.d.ts +0 -18
package/src/inference/pipelines/text/lora.js +0 -12
package/src/inference/pipelines/text/model-load.d.ts +0 -58
package/src/inference/pipelines/text/model-load.js +0 -739
package/src/inference/pipelines/text/moe-cache.d.ts +0 -32
package/src/inference/pipelines/text/moe-cache.js +0 -108
package/src/inference/pipelines/text/moe-cpu-gptoss.d.ts +0 -9
package/src/inference/pipelines/text/moe-cpu-gptoss.js +0 -115
package/src/inference/pipelines/text/moe-cpu.d.ts +0 -13
package/src/inference/pipelines/text/moe-cpu.js +0 -120
package/src/inference/pipelines/text/moe-gpu.d.ts +0 -13
package/src/inference/pipelines/text/moe-gpu.js +0 -653
package/src/inference/pipelines/text/moe-helpers.d.ts +0 -12
package/src/inference/pipelines/text/moe-helpers.js +0 -21
package/src/inference/pipelines/text/moe-impl.d.ts +0 -117
package/src/inference/pipelines/text/moe-impl.js +0 -9
package/src/inference/pipelines/text/moe-shape-validator.d.ts +0 -40
package/src/inference/pipelines/text/moe-shape-validator.js +0 -98
package/src/inference/pipelines/text/ops.d.ts +0 -167
package/src/inference/pipelines/text/ops.js +0 -437
package/src/inference/pipelines/text/probes.d.ts +0 -31
package/src/inference/pipelines/text/probes.js +0 -171
package/src/inference/pipelines/text/sampling.d.ts +0 -54
package/src/inference/pipelines/text/sampling.js +0 -249
package/src/inference/pipelines/text/state.d.ts +0 -112
package/src/inference/pipelines/text/state.js +0 -154
package/src/inference/pipelines/text/types.d.ts +0 -627
package/src/inference/pipelines/text/types.js +0 -4
package/src/inference/pipelines/text/weights.d.ts +0 -110
package/src/inference/pipelines/text/weights.js +0 -173
package/src/inference/pipelines/text.d.ts +0 -162
package/src/inference/pipelines/text.js +0 -666
package/src/inference/pipelines/vision/encoder.js +0 -386
package/src/inference/pipelines/vision/image-preprocess.js +0 -151
package/src/inference/pipelines/vision/index.js +0 -173
package/src/inference/pipelines/vision/ops.js +0 -78
package/src/inference/pipelines/vision/patch-embed.js +0 -151
package/src/inference/speculative.d.ts +0 -239
package/src/inference/speculative.js +0 -402
package/src/inference/test-harness.d.ts +0 -178
package/src/inference/test-harness.js +0 -361
package/src/inference/tokenizer.d.ts +0 -72
package/src/inference/tokenizer.js +0 -239
package/src/inference/tokenizers/base.d.ts +0 -39
package/src/inference/tokenizers/base.js +0 -69
package/src/inference/tokenizers/bpe.d.ts +0 -27
package/src/inference/tokenizers/bpe.js +0 -180
package/src/inference/tokenizers/bundled.d.ts +0 -63
package/src/inference/tokenizers/bundled.js +0 -1009
package/src/inference/tokenizers/sentencepiece.d.ts +0 -28
package/src/inference/tokenizers/sentencepiece.js +0 -401
package/src/inference/tokenizers/types.d.ts +0 -166
package/src/inference/tokenizers/types.js +0 -7
package/src/loader/doppler-loader.d.ts +0 -137
package/src/loader/doppler-loader.js +0 -1069
package/src/loader/dtype-utils.d.ts +0 -40
package/src/loader/dtype-utils.js +0 -61
package/src/loader/embedding-loader.d.ts +0 -56
package/src/loader/embedding-loader.js +0 -211
package/src/loader/experts/expert-cache.d.ts +0 -156
package/src/loader/experts/expert-cache.js +0 -386
package/src/loader/experts/expert-loader.d.ts +0 -108
package/src/loader/experts/expert-loader.js +0 -392
package/src/loader/final-weights-loader.d.ts +0 -68
package/src/loader/final-weights-loader.js +0 -268
package/src/loader/index.d.ts +0 -150
package/src/loader/index.js +0 -124
package/src/loader/layer-loader.d.ts +0 -63
package/src/loader/layer-loader.js +0 -457
package/src/loader/loader-state.d.ts +0 -51
package/src/loader/loader-state.js +0 -142
package/src/loader/loader-types.d.ts +0 -236
package/src/loader/loader-types.js +0 -4
package/src/loader/manifest-config.d.ts +0 -97
package/src/loader/manifest-config.js +0 -134
package/src/loader/memory-monitor.d.ts +0 -112
package/src/loader/memory-monitor.js +0 -284
package/src/loader/multi-model-loader.d.ts +0 -51
package/src/loader/multi-model-loader.js +0 -133
package/src/loader/quantization-constants.d.ts +0 -23
package/src/loader/quantization-constants.js +0 -14
package/src/loader/shard-cache.d.ts +0 -60
package/src/loader/shard-cache.js +0 -638
package/src/loader/shard-resolver.d.ts +0 -12
package/src/loader/shard-resolver.js +0 -105
package/src/loader/tensors/tensor-loader.d.ts +0 -157
package/src/loader/tensors/tensor-loader.js +0 -618
package/src/loader/tensors/tensor-reader.d.ts +0 -22
package/src/loader/tensors/tensor-reader.js +0 -113
package/src/loader/tensors/tensor-role.d.ts +0 -7
package/src/loader/tensors/tensor-role.js +0 -12
package/src/loader/weight-downcast.d.ts +0 -62
package/src/loader/weight-downcast.js +0 -213
package/src/loader/weights.d.ts +0 -22
package/src/loader/weights.js +0 -4
package/src/memory/address-table.d.ts +0 -104
package/src/memory/address-table.js +0 -114
package/src/memory/buffer-pool.d.ts +0 -204
package/src/memory/buffer-pool.js +0 -821
package/src/memory/capability.d.ts +0 -49
package/src/memory/capability.js +0 -95
package/src/memory/heap-manager.d.ts +0 -104
package/src/memory/heap-manager.js +0 -264
package/src/memory/unified-detect.d.ts +0 -59
package/src/memory/unified-detect.js +0 -192
package/src/rules/converter/execution.rules.json +0 -20
package/src/rules/converter/tensor-roles.rules.json +0 -13
package/src/rules/converter/tokenizer.rules.json +0 -7
package/src/rules/execution-rules-contract-check.d.ts +0 -17
package/src/rules/execution-rules-contract-check.js +0 -245
package/src/rules/inference/attention.rules.json +0 -54
package/src/rules/inference/config.rules.json +0 -58
package/src/rules/inference/dtype.rules.json +0 -99
package/src/rules/inference/execution.rules.json +0 -45
package/src/rules/inference/ffn.rules.json +0 -35
package/src/rules/inference/kernel-path.rules.json +0 -92
package/src/rules/inference/layer-pattern.rules.json +0 -16
package/src/rules/inference/layer.rules.json +0 -7
package/src/rules/inference/moe.rules.json +0 -48
package/src/rules/kernels/attention.rules.json +0 -61
package/src/rules/kernels/conv2d.rules.json +0 -6
package/src/rules/kernels/depthwise-conv2d.rules.json +0 -6
package/src/rules/kernels/dequant.rules.json +0 -58
package/src/rules/kernels/energy.rules.json +0 -22
package/src/rules/kernels/fused-ffn.rules.json +0 -13
package/src/rules/kernels/fused-matmul-residual.rules.json +0 -6
package/src/rules/kernels/fused-matmul-rmsnorm.rules.json +0 -8
package/src/rules/kernels/gather.rules.json +0 -12
package/src/rules/kernels/gelu.rules.json +0 -11
package/src/rules/kernels/grouped-pointwise-conv2d.rules.json +0 -6
package/src/rules/kernels/groupnorm.rules.json +0 -10
package/src/rules/kernels/kernel-validator.d.ts +0 -24
package/src/rules/kernels/kernel-validator.js +0 -160
package/src/rules/kernels/kv_quantize.rules.json +0 -7
package/src/rules/kernels/layernorm.rules.json +0 -6
package/src/rules/kernels/matmul.rules.json +0 -60
package/src/rules/kernels/modulate.rules.json +0 -6
package/src/rules/kernels/moe.rules.gptoss.json +0 -105
package/src/rules/kernels/moe.rules.json +0 -11
package/src/rules/kernels/moe.rules.mixtral.json +0 -75
package/src/rules/kernels/pixel_shuffle.rules.json +0 -6
package/src/rules/kernels/relu.rules.json +0 -6
package/src/rules/kernels/repeat-channels.rules.json +0 -6
package/src/rules/kernels/residual.rules.json +0 -12
package/src/rules/kernels/rmsnorm.rules.json +0 -11
package/src/rules/kernels/rope.rules.json +0 -6
package/src/rules/kernels/sample.rules.json +0 -6
package/src/rules/kernels/sana-linear-attention.rules.json +0 -6
package/src/rules/kernels/scale.rules.json +0 -6
package/src/rules/kernels/silu.rules.json +0 -21
package/src/rules/kernels/softmax.rules.json +0 -25
package/src/rules/kernels/split-qg.rules.json +0 -6
package/src/rules/kernels/split-qkv.rules.json +0 -6
package/src/rules/kernels/upsample2d.rules.json +0 -6
package/src/rules/layer-pattern-contract-check.d.ts +0 -17
package/src/rules/layer-pattern-contract-check.js +0 -231
package/src/rules/loader/tensor-loader.rules.json +0 -15
package/src/rules/loader/weights.rules.json +0 -41
package/src/rules/rule-registry.d.ts +0 -77
package/src/rules/rule-registry.js +0 -243
package/src/rules/tooling/command-runtime.rules.json +0 -56
package/src/storage/backends/idb-store.d.ts +0 -52
package/src/storage/backends/idb-store.js +0 -590
package/src/storage/backends/memory-store.d.ts +0 -36
package/src/storage/backends/memory-store.js +0 -242
package/src/storage/backends/opfs-store.d.ts +0 -41
package/src/storage/backends/opfs-store.js +0 -473
package/src/storage/blake3.d.ts +0 -17
package/src/storage/blake3.js +0 -269
package/src/storage/download-types.d.ts +0 -157
package/src/storage/download-types.js +0 -48
package/src/storage/downloader.d.ts +0 -103
package/src/storage/downloader.js +0 -1121
package/src/storage/emulated-vram.d.ts +0 -264
package/src/storage/emulated-vram.js +0 -576
package/src/storage/export.d.ts +0 -20
package/src/storage/export.js +0 -159
package/src/storage/index.d.ts +0 -256
package/src/storage/index.js +0 -188
package/src/storage/inventory.d.ts +0 -26
package/src/storage/inventory.js +0 -218
package/src/storage/preflight.d.ts +0 -144
package/src/storage/preflight.js +0 -316
package/src/storage/quickstart-downloader.d.ts +0 -157
package/src/storage/quickstart-downloader.js +0 -268
package/src/storage/quota.d.ts +0 -150
package/src/storage/quota.js +0 -304
package/src/storage/registry.d.ts +0 -28
package/src/storage/registry.js +0 -131
package/src/storage/reports.d.ts +0 -20
package/src/storage/reports.js +0 -94
package/src/storage/shard-manager.d.ts +0 -151
package/src/storage/shard-manager.js +0 -850
package/src/storage/source-artifact-store.d.ts +0 -52
package/src/storage/source-artifact-store.js +0 -234
package/src/sw.d.ts +0 -1
package/src/sw.js +0 -187
package/src/tooling/browser-command-runner.d.ts +0 -28
package/src/tooling/browser-command-runner.js +0 -82
package/src/tooling/command-api-constants.d.ts +0 -9
package/src/tooling/command-api-constants.js +0 -9
package/src/tooling/command-api-family-normalizers.d.ts +0 -9
package/src/tooling/command-api-family-normalizers.js +0 -343
package/src/tooling/command-api-helpers.d.ts +0 -25
package/src/tooling/command-api-helpers.js +0 -262
package/src/tooling/command-api.d.ts +0 -173
package/src/tooling/command-api.js +0 -76
package/src/tooling/command-envelope.d.ts +0 -81
package/src/tooling/command-envelope.js +0 -198
package/src/tooling/command-runner-shared.d.ts +0 -73
package/src/tooling/command-runner-shared.js +0 -180
package/src/tooling/command-runner.html +0 -45
package/src/tooling/conversion-config-materializer.d.ts +0 -24
package/src/tooling/conversion-config-materializer.js +0 -97
package/src/tooling/lean-execution-contract-runner.d.ts +0 -43
package/src/tooling/lean-execution-contract-runner.js +0 -158
package/src/tooling/lean-execution-contract.d.ts +0 -16
package/src/tooling/lean-execution-contract.js +0 -228
package/src/tooling/node-browser-command-runner.d.ts +0 -34
package/src/tooling/node-browser-command-runner.js +0 -813
package/src/tooling/node-command-runner.d.ts +0 -36
package/src/tooling/node-command-runner.js +0 -168
package/src/tooling/node-convert-worker-pool.d.ts +0 -16
package/src/tooling/node-convert-worker-pool.js +0 -186
package/src/tooling/node-convert-worker.d.ts +0 -1
package/src/tooling/node-convert-worker.js +0 -60
package/src/tooling/node-converter.d.ts +0 -1
package/src/tooling/node-converter.js +0 -1333
package/src/tooling/node-file-fetch.d.ts +0 -1
package/src/tooling/node-file-fetch.js +0 -38
package/src/tooling/node-source-runtime.d.ts +0 -19
package/src/tooling/node-source-runtime.js +0 -610
package/src/tooling/node-webgpu.d.ts +0 -6
package/src/tooling/node-webgpu.js +0 -284
package/src/tooling/opfs-cache.d.ts +0 -11
package/src/tooling/opfs-cache.js +0 -191
package/src/tooling/runtime-input-composition.d.ts +0 -38
package/src/tooling/runtime-input-composition.js +0 -86
package/src/tooling/source-runtime-bundle.d.ts +0 -137
package/src/tooling/source-runtime-bundle.js +0 -711
package/src/tooling/source-runtime-materializer.d.ts +0 -6
package/src/tooling/source-runtime-materializer.js +0 -93
package/src/tooling-exports.browser.d.ts +0 -7
package/src/tooling-exports.browser.js +0 -2
package/src/tooling-exports.d.ts +0 -22
package/src/tooling-exports.js +0 -7
package/src/tooling-exports.shared.d.ts +0 -105
package/src/tooling-exports.shared.js +0 -92
package/src/training/README.md +0 -153
package/src/training/artifacts.d.ts +0 -160
package/src/training/artifacts.js +0 -896
package/src/training/attention-backward.d.ts +0 -30
package/src/training/attention-backward.js +0 -232
package/src/training/attention-forward.d.ts +0 -22
package/src/training/attention-forward.js +0 -82
package/src/training/autograd.d.ts +0 -51
package/src/training/autograd.js +0 -408
package/src/training/checkpoint-watch.d.ts +0 -8
package/src/training/checkpoint-watch.js +0 -139
package/src/training/checkpoint.d.ts +0 -36
package/src/training/checkpoint.js +0 -277
package/src/training/clip.d.ts +0 -9
package/src/training/clip.js +0 -55
package/src/training/dataloader.d.ts +0 -8
package/src/training/dataloader.js +0 -44
package/src/training/datasets/index.d.ts +0 -12
package/src/training/datasets/index.js +0 -6
package/src/training/datasets/jsonl.d.ts +0 -11
package/src/training/datasets/jsonl.js +0 -50
package/src/training/datasets/reploid.d.ts +0 -3
package/src/training/datasets/reploid.js +0 -36
package/src/training/datasets/text-pairs.d.ts +0 -21
package/src/training/datasets/text-pairs.js +0 -42
package/src/training/datasets/token-batch.d.ts +0 -21
package/src/training/datasets/token-batch.js +0 -52
package/src/training/datasets/translation-pairs.d.ts +0 -34
package/src/training/datasets/translation-pairs.js +0 -49
package/src/training/distillation/artifacts.d.ts +0 -71
package/src/training/distillation/artifacts.js +0 -132
package/src/training/distillation/checkpoint-watch.d.ts +0 -10
package/src/training/distillation/checkpoint-watch.js +0 -58
package/src/training/distillation/dataset.d.ts +0 -59
package/src/training/distillation/dataset.js +0 -337
package/src/training/distillation/eval.d.ts +0 -34
package/src/training/distillation/eval.js +0 -310
package/src/training/distillation/index.d.ts +0 -29
package/src/training/distillation/index.js +0 -29
package/src/training/distillation/runtime.d.ts +0 -20
package/src/training/distillation/runtime.js +0 -121
package/src/training/distillation/scoreboard.d.ts +0 -6
package/src/training/distillation/scoreboard.js +0 -8
package/src/training/distillation/stage-a.d.ts +0 -45
package/src/training/distillation/stage-a.js +0 -338
package/src/training/distillation/stage-b.d.ts +0 -24
package/src/training/distillation/stage-b.js +0 -20
package/src/training/distillation/student-fixture.d.ts +0 -22
package/src/training/distillation/student-fixture.js +0 -846
package/src/training/distillation/suite-data.d.ts +0 -45
package/src/training/distillation/suite-data.js +0 -189
package/src/training/export.d.ts +0 -32
package/src/training/export.js +0 -112
package/src/training/index.d.ts +0 -62
package/src/training/index.js +0 -51
package/src/training/lora-pipeline.d.ts +0 -40
package/src/training/lora-pipeline.js +0 -793
package/src/training/lora.d.ts +0 -19
package/src/training/lora.js +0 -71
package/src/training/loss-scaling.d.ts +0 -21
package/src/training/loss-scaling.js +0 -80
package/src/training/loss.d.ts +0 -10
package/src/training/loss.js +0 -40
package/src/training/objectives/base.d.ts +0 -58
package/src/training/objectives/base.js +0 -38
package/src/training/objectives/cross_entropy.d.ts +0 -18
package/src/training/objectives/cross_entropy.js +0 -34
package/src/training/objectives/distill_kd.d.ts +0 -16
package/src/training/objectives/distill_kd.js +0 -365
package/src/training/objectives/distill_triplet.d.ts +0 -16
package/src/training/objectives/distill_triplet.js +0 -408
package/src/training/objectives/index.d.ts +0 -12
package/src/training/objectives/index.js +0 -6
package/src/training/objectives/ul_stage1_joint.d.ts +0 -16
package/src/training/objectives/ul_stage1_joint.js +0 -188
package/src/training/objectives/ul_stage2_base.d.ts +0 -16
package/src/training/objectives/ul_stage2_base.js +0 -218
package/src/training/operator-artifacts.d.ts +0 -62
package/src/training/operator-artifacts.js +0 -140
package/src/training/operator-command.d.ts +0 -5
package/src/training/operator-command.js +0 -455
package/src/training/operator-eval.d.ts +0 -48
package/src/training/operator-eval.js +0 -230
package/src/training/operator-scoreboard.d.ts +0 -5
package/src/training/operator-scoreboard.js +0 -44
package/src/training/optimizer.d.ts +0 -22
package/src/training/optimizer.js +0 -127
package/src/training/runner.d.ts +0 -248
package/src/training/runner.js +0 -1220
package/src/training/suite.d.ts +0 -299
package/src/training/suite.js +0 -2196
package/src/training/tensor-factory.d.ts +0 -9
package/src/training/tensor-factory.js +0 -13
package/src/training/trainer.d.ts +0 -89
package/src/training/trainer.js +0 -299
package/src/training/ul_dataset.d.ts +0 -47
package/src/training/ul_dataset.js +0 -151
package/src/training/ul_schedule.d.ts +0 -6
package/src/training/ul_schedule.js +0 -29
package/src/training/workloads.d.ts +0 -164
package/src/training/workloads.js +0 -530
package/src/types/chrome.d.ts +0 -36
package/src/types/chrome.js +0 -1
package/src/types/gpu.d.ts +0 -185
package/src/types/gpu.js +0 -5
package/src/types/index.d.ts +0 -3
package/src/types/index.js +0 -3
package/src/types/inference.d.ts +0 -197
package/src/types/inference.js +0 -5
package/src/types/model.d.ts +0 -130
package/src/types/model.js +0 -5
package/src/utils/hf-resolve-url.d.ts +0 -16
package/src/utils/hf-resolve-url.js +0 -17
package/src/utils/index.d.ts +0 -7
package/src/utils/index.js +0 -7
package/src/utils/load-json.d.ts +0 -5
package/src/utils/load-json.js +0 -23
package/src/utils/plain-object.d.ts +0 -1
package/src/utils/plain-object.js +0 -3
package/src/utils/sha256.d.ts +0 -4
package/src/utils/sha256.js +0 -135
package/src/version.d.ts +0 -2
package/src/version.js +0 -2
package/tools/convert-safetensors-node.js +0 -233
package/tools/doppler-cli.js +0 -1452

package/src/inference/pipelines/diffusion/vae.js DELETED Viewed

@@ -1,1375 +0,0 @@
-import { getDevice } from '../../../gpu/device.js';
-import { acquireBuffer, releaseBuffer, readBuffer, isBufferActive } from '../../../memory/buffer-pool.js';
-import { createTensor, dtypeBytes } from '../../../gpu/tensor.js';
-import { getBuffer, getWeightDtype } from '../../../gpu/weight-buffer.js';
-import { CommandRecorder } from '../../../gpu/command-recorder.js';
-import { runConv2D, recordConv2D } from '../../../gpu/kernels/conv2d.js';
-import { runGroupNorm, recordGroupNorm } from '../../../gpu/kernels/groupnorm.js';
-import { runRMSNorm, recordRMSNorm } from '../../../gpu/kernels/rmsnorm.js';
-import { runSiLU, runSiLURowSplit, recordSiLU, recordSiLURowSplit } from '../../../gpu/kernels/silu.js';
-import { runMatmul, recordMatmul } from '../../../gpu/kernels/matmul.js';
-import { runAttention, recordAttention } from '../../../gpu/kernels/attention.js';
-import { runTranspose, recordTranspose } from '../../../gpu/kernels/transpose.js';
-import { runResidualAdd, runBiasAdd, recordResidualAdd, recordBiasAdd } from '../../../gpu/kernels/residual.js';
-import { runUpsample2D, recordUpsample2D } from '../../../gpu/kernels/upsample2d.js';
-import { runDepthwiseConv2D, recordDepthwiseConv2D } from '../../../gpu/kernels/depthwise_conv2d.js';
-import { runGroupedPointwiseConv2D, recordGroupedPointwiseConv2D } from '../../../gpu/kernels/grouped_pointwise_conv2d.js';
-import { runSanaLinearAttention, recordSanaLinearAttention } from '../../../gpu/kernels/sana_linear_attention.js';
-import { runPixelShuffle, recordPixelShuffle } from '../../../gpu/kernels/pixel_shuffle.js';
-import { runRepeatChannels, recordRepeatChannels } from '../../../gpu/kernels/repeat_channels.js';
-import { runReLU, recordReLU } from '../../../gpu/kernels/relu.js';
-import { castF32ToF16, recordCastF32ToF16 } from '../../../gpu/kernels/cast.js';
-import { f16ToF32 } from '../../../loader/dtype-utils.js';
-import { log } from '../../../debug/index.js';
-function clamp(value, min, max) {
-  return Math.max(min, Math.min(max, value));
-}
-function reshapeTensor(tensor, shape, label) {
-  return createTensor(tensor.buffer, tensor.dtype, shape, label ?? tensor.label);
-}
-function getWeight(weights, shapes, name) {
-  const value = weights.get(name);
-  if (!value) {
-    throw new Error(`Missing VAE weight: ${name}`);
-  }
-  const shape = shapes.get(name);
-  if (!shape) {
-    throw new Error(`Missing VAE weight shape: ${name}`);
-  }
-  return { value, shape };
-}
-function getWeightOptional(weights, shapes, name) {
-  const value = weights.get(name);
-  if (!value) return null;
-  const shape = shapes.get(name);
-  if (!shape) return null;
-  return { value, shape };
-}
-function getWeightByCandidates(weights, shapes, candidates, label) {
-  for (const name of candidates) {
-    const value = getWeightOptional(weights, shapes, name);
-    if (value) {
-      return { ...value, name };
-    }
-  }
-  throw new Error(
-    `Missing VAE weight: ${label}. Tried: ${candidates.join(', ')}`
-  );
-}
-function getConvShape(shape) {
-  if (!Array.isArray(shape) || shape.length !== 4) {
-    throw new Error(`Conv2D weight shape must be [out,in,h,w], got ${shape}`);
-  }
-  return {
-    outChannels: shape[0],
-    inChannels: shape[1],
-    kernelH: shape[2],
-    kernelW: shape[3],
-  };
-}
-function getLinearShape(shape, label) {
-  if (Array.isArray(shape) && shape.length === 2) {
-    return {
-      outFeatures: shape[0],
-      inFeatures: shape[1],
-    };
-  }
-  if (Array.isArray(shape) && shape.length === 4) {
-    if (shape[2] !== 1 || shape[3] !== 1) {
-      throw new Error(`Linear weight "${label}" with 4D shape must be 1x1, got ${shape}`);
-    }
-    return {
-      outFeatures: shape[0],
-      inFeatures: shape[1],
-    };
-  }
-  throw new Error(`Linear weight shape must be [out,in] or [out,in,1,1], got ${shape}`);
-}
-function readPositiveInteger(value) {
-  const parsed = Number(value);
-  if (!Number.isInteger(parsed) || parsed < 1) return null;
-  return parsed;
-}
-function resolveAttentionHeadShape(channels, config) {
-  const rawHeadDim = Array.isArray(config?.attention_head_dim)
-    ? config.attention_head_dim[0]
-    : config?.attention_head_dim;
-  const configuredHeadDim = readPositiveInteger(rawHeadDim);
-  if (configuredHeadDim && channels % configuredHeadDim === 0) {
-    return {
-      numHeads: channels / configuredHeadDim,
-      headDim: configuredHeadDim,
-    };
-  }
-  const configuredNumHeads = readPositiveInteger(config?.num_attention_heads);
-  if (configuredNumHeads && channels % configuredNumHeads === 0) {
-    return {
-      numHeads: configuredNumHeads,
-      headDim: channels / configuredNumHeads,
-    };
-  }
-  throw new Error(
-    `VAE attention requires explicit compatible attention_head_dim or num_attention_heads for channels=${channels}.`
-  );
-}
-function createBiasTensor(weight, label, fallbackDtype = 'f16') {
-  if (!weight) return null;
-  const dtype = getWeightDtype(weight.value) || fallbackDtype;
-  const shape = Array.isArray(weight.shape) && weight.shape.length > 0
-    ? weight.shape
-    : [0];
-  const size = shape.reduce((acc, value) => acc * value, 1);
-  if (!Number.isInteger(size) || size < 1) {
-    throw new Error(`Bias "${label}" has invalid shape: ${shape}`);
-  }
-  return createTensor(getBuffer(weight.value), dtype, [size], label);
-}
-function buildIndexList(weights, prefix) {
-  const indices = new Set();
-  for (const name of weights.keys()) {
-    if (!name.startsWith(prefix)) continue;
-    const rest = name.slice(prefix.length);
-    const match = rest.match(/^(\d+)\./);
-    if (!match) continue;
-    const idx = Number.parseInt(match[1], 10);
-    if (Number.isFinite(idx)) indices.add(idx);
-  }
-  return Array.from(indices).sort((a, b) => a - b);
-}
-function normalizePerBlockValue(value, count, label) {
-  if (Array.isArray(value)) {
-    if (value.length !== count) {
-      throw new Error(`${label} must have ${count} entries, got ${value.length}.`);
-    }
-    return value;
-  }
-  return Array.from({ length: count }, () => value);
-}
-function tensorElementCount(tensor) {
-  if (!Array.isArray(tensor?.shape) || tensor.shape.length === 0) {
-    throw new Error('Tensor shape is required.');
-  }
-  return tensor.shape.reduce((acc, value) => acc * value, 1);
-}
-function createKernelOps(recorder) {
-  if (!recorder) {
-    return {
-      conv2d: runConv2D,
-      groupNorm: runGroupNorm,
-      rmsNorm: runRMSNorm,
-      silu: runSiLU,
-      siluRowSplit: runSiLURowSplit,
-      matmul: runMatmul,
-      attention: runAttention,
-      transpose: runTranspose,
-      residualAdd: runResidualAdd,
-      biasAdd: runBiasAdd,
-      upsample2d: runUpsample2D,
-      depthwiseConv2d: runDepthwiseConv2D,
-      groupedPointwiseConv2d: runGroupedPointwiseConv2D,
-      sanaLinearAttention: runSanaLinearAttention,
-      pixelShuffle: runPixelShuffle,
-      repeatChannels: runRepeatChannels,
-      relu: runReLU,
-      castF32ToF16,
-    };
-  }
-  return {
-    conv2d: (...args) => recordConv2D(recorder, ...args),
-    groupNorm: (...args) => recordGroupNorm(recorder, ...args),
-    rmsNorm: (...args) => recordRMSNorm(recorder, ...args),
-    silu: (...args) => recordSiLU(recorder, ...args),
-    siluRowSplit: (...args) => recordSiLURowSplit(recorder, ...args),
-    matmul: (...args) => recordMatmul(recorder, ...args),
-    attention: (...args) => recordAttention(recorder, ...args),
-    transpose: (...args) => recordTranspose(recorder, ...args),
-    residualAdd: (...args) => recordResidualAdd(recorder, ...args),
-    biasAdd: (...args) => recordBiasAdd(recorder, ...args),
-    upsample2d: (...args) => recordUpsample2D(recorder, ...args),
-    depthwiseConv2d: (...args) => recordDepthwiseConv2D(recorder, ...args),
-    groupedPointwiseConv2d: (...args) => recordGroupedPointwiseConv2D(recorder, ...args),
-    sanaLinearAttention: (...args) => recordSanaLinearAttention(recorder, ...args),
-    pixelShuffle: (...args) => recordPixelShuffle(recorder, ...args),
-    repeatChannels: (...args) => recordRepeatChannels(recorder, ...args),
-    relu: (...args) => recordReLU(recorder, ...args),
-    castF32ToF16: (...args) => recordCastF32ToF16(recorder, ...args),
-  };
-}
-function createBufferReleaser(recorder) {
-  if (!recorder) {
-    return (buffer) => {
-      if (!buffer || !isBufferActive(buffer)) return;
-      releaseBuffer(buffer);
-    };
-  }
-  return (buffer) => {
-    if (!buffer) return;
-    recorder.trackTemporaryBuffer(buffer);
-  };
-}
-function sumProfileTimings(timings) {
-  if (!timings) return null;
-  return Object.values(timings).reduce((sum, value) => sum + value, 0);
-}
-async function applyConv2D(state, weights, shapes, namePrefix, options = {}, ops, release) {
-  const weightName = `${namePrefix}.weight`;
-  const biasName = `${namePrefix}.bias`;
-  const weight = getWeight(weights, shapes, weightName);
-  const bias = getWeightOptional(weights, shapes, biasName);
-  const { outChannels, inChannels, kernelH, kernelW } = getConvShape(weight.shape);
-  if (inChannels !== state.channels) {
-    log.warn('Diffusion', `VAE conv channel mismatch: ${namePrefix} in=${inChannels} state=${state.channels}`);
-  }
-  const output = await ops.conv2d(
-    state.tensor,
-    weight.value,
-    bias?.value ?? null,
-    {
-      inChannels,
-      outChannels,
-      height: state.height,
-      width: state.width,
-      kernelH,
-      kernelW,
-      stride: options.stride ?? 1,
-      pad: options.pad ?? 1,
-    }
-  );
-  release(state.tensor.buffer);
-  return {
-    tensor: output,
-    channels: outChannels,
-    height: Math.floor((state.height + (options.pad ?? 1) * 2 - kernelH) / (options.stride ?? 1)) + 1,
-    width: Math.floor((state.width + (options.pad ?? 1) * 2 - kernelW) / (options.stride ?? 1)) + 1,
-  };
-}
-async function submitCopyWork(device, recorder, encoder) {
-  if (recorder) {
-    return;
-  }
-  device.queue.submit([encoder.finish()]);
-}
-async function concatChannelTensors(tensors, height, width, recorder) {
-  if (!Array.isArray(tensors) || tensors.length === 0) {
-    throw new Error('concatChannelTensors requires at least one tensor.');
-  }
-  const device = getDevice();
-  if (!device) {
-    throw new Error('Channel tensor concatenation requires a WebGPU device.');
-  }
-  const dtype = tensors[0].dtype;
-  const bytesPerElement = dtypeBytes(dtype);
-  let totalChannels = 0;
-  for (const tensor of tensors) {
-    if (tensor.dtype !== dtype) {
-      throw new Error('concatChannelTensors requires matching dtypes.');
-    }
-    if (tensor.shape[1] !== height || tensor.shape[2] !== width) {
-      throw new Error('concatChannelTensors requires matching spatial dimensions.');
-    }
-    totalChannels += tensor.shape[0];
-  }
-  const output = acquireBuffer(totalChannels * height * width * bytesPerElement, undefined, 'vae_concat_channels');
-  const encoder = recorder ? recorder.getEncoder() : device.createCommandEncoder({ label: 'vae_concat_channels' });
-  let channelOffset = 0;
-  for (const tensor of tensors) {
-    const byteLength = tensor.shape[0] * height * width * bytesPerElement;
-    encoder.copyBufferToBuffer(
-      tensor.buffer,
-      0,
-      output,
-      channelOffset * height * width * bytesPerElement,
-      byteLength
-    );
-    channelOffset += tensor.shape[0];
-  }
-  await submitCopyWork(device, recorder, encoder);
-  return createTensor(output, dtype, [totalChannels, height, width], 'vae_concat_channels');
-}
-async function sliceChannelTensor(tensor, startChannel, channelCount, height, width, recorder) {
-  const device = getDevice();
-  if (!device) {
-    throw new Error('Channel tensor slicing requires a WebGPU device.');
-  }
-  const bytesPerElement = dtypeBytes(tensor.dtype);
-  const channelSize = height * width * bytesPerElement;
-  const output = acquireBuffer(channelCount * channelSize, undefined, 'vae_slice_channels');
-  const encoder = recorder ? recorder.getEncoder() : device.createCommandEncoder({ label: 'vae_slice_channels' });
-  encoder.copyBufferToBuffer(
-    tensor.buffer,
-    startChannel * channelSize,
-    output,
-    0,
-    channelCount * channelSize
-  );
-  await submitCopyWork(device, recorder, encoder);
-  return createTensor(output, tensor.dtype, [channelCount, height, width], 'vae_slice_channels');
-}
-async function runChannelwiseRmsNorm(state, normWeight, normBias, eps, ops, release) {
-  const spatial = state.height * state.width;
-  const channelsSpatial = reshapeTensor(state.tensor, [state.channels, spatial], 'vae_rmsnorm_channels_spatial');
-  const tokens = await ops.transpose(channelsSpatial, state.channels, spatial);
-  const normed = await ops.rmsNorm(tokens, normWeight.value, eps, {
-    batchSize: spatial,
-    hiddenSize: state.channels,
-  });
-  release(tokens.buffer);
-  let shifted = normed;
-  if (normBias) {
-    const biasTensor = createBiasTensor(normBias, `${normBias.name ?? 'vae_rmsnorm_bias'}`, normed.dtype);
-    shifted = await ops.biasAdd(normed, biasTensor, spatial, state.channels);
-    release(normed.buffer);
-  }
-  const channelsFirst = await ops.transpose(shifted, spatial, state.channels);
-  release(shifted.buffer);
-  return {
-    tensor: reshapeTensor(channelsFirst, [state.channels, state.height, state.width], 'vae_rmsnorm_output'),
-    channels: state.channels,
-    height: state.height,
-    width: state.width,
-  };
-}
-async function channelsToTokens(state, ops) {
-  const spatial = state.height * state.width;
-  const channelsSpatial = reshapeTensor(state.tensor, [state.channels, spatial], 'vae_channels_spatial');
-  const tokens = await ops.transpose(channelsSpatial, state.channels, spatial);
-  return {
-    tensor: tokens,
-    numTokens: spatial,
-  };
-}
-async function tokensToChannels(tokens, channels, height, width, ops) {
-  const channelsSpatial = await ops.transpose(tokens, height * width, channels);
-  return {
-    tensor: reshapeTensor(channelsSpatial, [channels, height, width], 'vae_tokens_channels'),
-    channels,
-    height,
-    width,
-  };
-}
-async function runResnetBlock(state, weights, shapes, prefix, config, ops, release) {
-  const numGroups = config.numGroups;
-  const eps = config.eps;
-  const channels = state.channels;
-  const norm1 = getWeight(weights, shapes, `${prefix}.norm1.weight`);
-  const norm1Bias = getWeight(weights, shapes, `${prefix}.norm1.bias`);
-  const normed1 = await ops.groupNorm(state.tensor, norm1.value, norm1Bias.value, {
-    channels,
-    height: state.height,
-    width: state.width,
-    numGroups,
-    eps,
-  });
-  const silu1 = await ops.silu(normed1, { size: channels * state.height * state.width, swigluLimit: null });
-  release(normed1.buffer);
-  const silu1View = reshapeTensor(silu1, [channels, state.height, state.width], 'vae_resnet_silu1');
-  const conv1 = await applyConv2D(
-    { tensor: silu1View, channels, height: state.height, width: state.width },
-    weights,
-    shapes,
-    `${prefix}.conv1`,
-    { pad: 1 },
-    ops,
-    release
-  );
-  const norm2 = getWeight(weights, shapes, `${prefix}.norm2.weight`);
-  const norm2Bias = getWeight(weights, shapes, `${prefix}.norm2.bias`);
-  const normed2 = await ops.groupNorm(conv1.tensor, norm2.value, norm2Bias.value, {
-    channels: conv1.channels,
-    height: conv1.height,
-    width: conv1.width,
-    numGroups,
-    eps,
-  });
-  release(conv1.tensor.buffer);
-  const silu2 = await ops.silu(normed2, { size: conv1.channels * conv1.height * conv1.width, swigluLimit: null });
-  release(normed2.buffer);
-  const silu2View = reshapeTensor(silu2, [conv1.channels, conv1.height, conv1.width], 'vae_resnet_silu2');
-  const conv2 = await applyConv2D(
-    { tensor: silu2View, channels: conv1.channels, height: conv1.height, width: conv1.width },
-    weights,
-    shapes,
-    `${prefix}.conv2`,
-    { pad: 1 },
-    ops,
-    release
-  );
-  let residualTensor = state.tensor;
-  if (weights.has(`${prefix}.conv_shortcut.weight`)) {
-    const shortcut = await applyConv2D(state, weights, shapes, `${prefix}.conv_shortcut`, { pad: 0 }, ops, release);
-    residualTensor = shortcut.tensor;
-  }
-  const size = conv2.channels * conv2.height * conv2.width;
-  const residual = reshapeTensor(residualTensor, [size], 'vae_resnet_residual');
-  const output = await ops.residualAdd(
-    reshapeTensor(conv2.tensor, [size], 'vae_resnet_main'),
-    residual,
-    size,
-    { useVec4: true }
-  );
-  if (residualTensor === state.tensor) {
-    release(state.tensor.buffer);
-  } else {
-    release(residualTensor.buffer);
-  }
-  release(conv2.tensor.buffer);
-  return {
-    tensor: reshapeTensor(output, [conv2.channels, conv2.height, conv2.width], 'vae_resnet_output'),
-    channels: conv2.channels,
-    height: conv2.height,
-    width: conv2.width,
-  };
-}
-async function runMidBlockAttention(state, weights, shapes, prefix, config, ops, release) {
-  const channels = state.channels;
-  const height = state.height;
-  const width = state.width;
-  const spatial = height * width;
-  if (!Number.isFinite(spatial) || spatial <= 0) {
-    throw new Error('VAE mid-block attention requires a positive spatial size.');
-  }
-  const normWeight = getWeightByCandidates(
-    weights,
-    shapes,
-    [`${prefix}.group_norm.weight`, `${prefix}.norm.weight`],
-    `${prefix}.group_norm.weight`
-  );
-  const normBias = getWeightByCandidates(
-    weights,
-    shapes,
-    [`${prefix}.group_norm.bias`, `${prefix}.norm.bias`],
-    `${prefix}.group_norm.bias`
-  );
-  const normed = await ops.groupNorm(state.tensor, normWeight.value, normBias.value, {
-    channels,
-    height,
-    width,
-    numGroups: config.numGroups,
-    eps: config.eps,
-  });
-  const normedChannelsSpatial = reshapeTensor(normed, [channels, spatial], 'vae_attn_norm_cs');
-  const normedTokens = await ops.transpose(normedChannelsSpatial, channels, spatial);
-  release(normed.buffer);
-  const residualChannelsSpatial = reshapeTensor(state.tensor, [channels, spatial], 'vae_attn_residual_cs');
-  const residualTokens = await ops.transpose(residualChannelsSpatial, channels, spatial);
-  release(state.tensor.buffer);
-  const qWeight = getWeightByCandidates(weights, shapes, [`${prefix}.to_q.weight`], `${prefix}.to_q.weight`);
-  const kWeight = getWeightByCandidates(weights, shapes, [`${prefix}.to_k.weight`], `${prefix}.to_k.weight`);
-  const vWeight = getWeightByCandidates(weights, shapes, [`${prefix}.to_v.weight`], `${prefix}.to_v.weight`);
-  const qBias = getWeightOptional(weights, shapes, `${prefix}.to_q.bias`);
-  const kBias = getWeightOptional(weights, shapes, `${prefix}.to_k.bias`);
-  const vBias = getWeightOptional(weights, shapes, `${prefix}.to_v.bias`);
-  const qShape = getLinearShape(qWeight.shape, qWeight.name);
-  const kShape = getLinearShape(kWeight.shape, kWeight.name);
-  const vShape = getLinearShape(vWeight.shape, vWeight.name);
-  if (qShape.inFeatures !== channels || kShape.inFeatures !== channels || vShape.inFeatures !== channels) {
-    throw new Error(
-      `VAE mid-block attention projection mismatch: expected inFeatures=${channels}, ` +
-      `got q=${qShape.inFeatures}, k=${kShape.inFeatures}, v=${vShape.inFeatures}.`
-    );
-  }
-  if (qShape.outFeatures !== kShape.outFeatures || qShape.outFeatures !== vShape.outFeatures) {
-    throw new Error(
-      `VAE mid-block attention projection mismatch: q/k/v outFeatures differ ` +
-      `(${qShape.outFeatures}, ${kShape.outFeatures}, ${vShape.outFeatures}).`
-    );
-  }
-  const hiddenSize = qShape.outFeatures;
-  const projectionDtype = normedTokens.dtype;
-  let q = await ops.matmul(normedTokens, qWeight.value, spatial, hiddenSize, channels, {
-    outputDtype: projectionDtype,
-    transposeB: 'auto',
-  });
-  let k = await ops.matmul(normedTokens, kWeight.value, spatial, hiddenSize, channels, {
-    outputDtype: projectionDtype,
-    transposeB: 'auto',
-  });
-  let v = await ops.matmul(normedTokens, vWeight.value, spatial, hiddenSize, channels, {
-    outputDtype: projectionDtype,
-    transposeB: 'auto',
-  });
-  const qBiasTensor = createBiasTensor(qBias, `${prefix}.to_q.bias`, projectionDtype);
-  const kBiasTensor = createBiasTensor(kBias, `${prefix}.to_k.bias`, projectionDtype);
-  const vBiasTensor = createBiasTensor(vBias, `${prefix}.to_v.bias`, projectionDtype);
-  if (qBiasTensor) q = await ops.biasAdd(q, qBiasTensor, spatial, hiddenSize);
-  if (kBiasTensor) k = await ops.biasAdd(k, kBiasTensor, spatial, hiddenSize);
-  if (vBiasTensor) v = await ops.biasAdd(v, vBiasTensor, spatial, hiddenSize);
-  const { numHeads, headDim } = resolveAttentionHeadShape(hiddenSize, config.modelConfig);
-  const attn = await ops.attention(
-    q,
-    k,
-    v,
-    null,
-    numHeads,
-    headDim,
-    {
-      seqLen: spatial,
-      kvLen: spatial,
-      numKVHeads: numHeads,
-      causal: false,
-    }
-  );
-  release(q.buffer);
-  release(k.buffer);
-  release(v.buffer);
-  const outWeight = getWeightByCandidates(
-    weights,
-    shapes,
-    [`${prefix}.to_out.0.weight`, `${prefix}.to_out.weight`],
-    `${prefix}.to_out.0.weight`
-  );
-  const outBias = getWeightOptional(weights, shapes, `${prefix}.to_out.0.bias`)
-    || getWeightOptional(weights, shapes, `${prefix}.to_out.bias`);
-  const outShape = getLinearShape(outWeight.shape, outWeight.name);
-  if (outShape.inFeatures !== hiddenSize) {
-    throw new Error(
-      `VAE mid-block attention output projection mismatch: expected inFeatures=${hiddenSize}, got ${outShape.inFeatures}.`
-    );
-  }
-  if (outShape.outFeatures !== channels) {
-    throw new Error(
-      `VAE mid-block attention output projection mismatch: expected outFeatures=${channels}, got ${outShape.outFeatures}.`
-    );
-  }
-  let projected = await ops.matmul(attn, outWeight.value, spatial, outShape.outFeatures, outShape.inFeatures, {
-    outputDtype: projectionDtype,
-    transposeB: 'auto',
-  });
-  release(attn.buffer);
-  const outBiasTensor = createBiasTensor(outBias, `${prefix}.to_out.0.bias`, projectionDtype);
-  if (outBiasTensor) {
-    projected = await ops.biasAdd(projected, outBiasTensor, spatial, outShape.outFeatures);
-  }
-  const combined = await ops.residualAdd(projected, residualTokens, spatial * outShape.outFeatures, { useVec4: true });
-  release(projected.buffer);
-  release(residualTokens.buffer);
-  release(normedTokens.buffer);
-  const combinedChannelsSpatial = await ops.transpose(combined, spatial, outShape.outFeatures);
-  release(combined.buffer);
-  return {
-    tensor: reshapeTensor(combinedChannelsSpatial, [outShape.outFeatures, height, width], 'vae_attn_out'),
-    channels: outShape.outFeatures,
-    height,
-    width,
-  };
-}
-async function runAutoencoderDCInputProjection(state, weights, shapes, config, ops, release) {
-  const blockOutChannels = config.decoder_block_out_channels;
-  if (!Array.isArray(blockOutChannels) || blockOutChannels.length === 0) {
-    throw new Error('AutoencoderDC decode requires decoder_block_out_channels.');
-  }
-  const outChannels = blockOutChannels[blockOutChannels.length - 1];
-  const repeats = outChannels / state.channels;
-  if (!Number.isInteger(repeats) || repeats < 1) {
-    throw new Error(
-      `AutoencoderDC input shortcut requires an integer repeat factor; got ${outChannels}/${state.channels}.`
-    );
-  }
-  const shortcut = await ops.repeatChannels(state.tensor, {
-    inChannels: state.channels,
-    height: state.height,
-    width: state.width,
-    repeats,
-  });
-  const projected = await applyConv2D(state, weights, shapes, 'vae.decoder.conv_in', { pad: 1 }, ops, release);
-  const size = projected.channels * projected.height * projected.width;
-  const combined = await ops.residualAdd(
-    reshapeTensor(projected.tensor, [size], 'vae_dc_conv_in'),
-    reshapeTensor(shortcut, [size], 'vae_dc_conv_in_shortcut'),
-    size,
-    { useVec4: true }
-  );
-  release(projected.tensor.buffer);
-  release(shortcut.buffer);
-  return {
-    tensor: reshapeTensor(combined, [projected.channels, projected.height, projected.width], 'vae_dc_conv_in_out'),
-    channels: projected.channels,
-    height: projected.height,
-    width: projected.width,
-  };
-}
-async function runAutoencoderDCUpBlock(state, weights, shapes, prefix, config, ops, release, recorder) {
-  const convWeight = getWeight(weights, shapes, `${prefix}.conv.weight`);
-  const convBias = getWeightOptional(weights, shapes, `${prefix}.conv.bias`);
-  const { outChannels, inChannels, kernelH, kernelW } = getConvShape(convWeight.shape);
-  if (inChannels !== state.channels) {
-    throw new Error(
-      `AutoencoderDC up block "${prefix}" expected ${inChannels} input channels, got ${state.channels}.`
-    );
-  }
-  const factor = 2;
-  const outHeight = state.height * factor;
-  const outWidth = state.width * factor;
-  const shortcutRepeats = outChannels * factor * factor / state.channels;
-  if (!Number.isInteger(shortcutRepeats) || shortcutRepeats < 1) {
-    throw new Error(
-      `AutoencoderDC up block "${prefix}" requires integer shortcut repeats; got ${outChannels}/${state.channels}.`
-    );
-  }
-  let projected;
-  if (config.upsample_block_type === 'interpolate') {
-    const upsampled = await ops.upsample2d(state.tensor, {
-      channels: state.channels,
-      height: state.height,
-      width: state.width,
-      scale: factor,
-    });
-    projected = await ops.conv2d(
-      reshapeTensor(upsampled, [state.channels, outHeight, outWidth], 'vae_dc_upsample'),
-      convWeight.value,
-      convBias?.value ?? null,
-      {
-        inChannels: state.channels,
-        outChannels,
-        height: outHeight,
-        width: outWidth,
-        kernelH,
-        kernelW,
-        stride: 1,
-        pad: 1,
-      }
-    );
-    release(upsampled.buffer);
-  } else if (config.upsample_block_type === 'pixel_shuffle') {
-    const conv = await ops.conv2d(state.tensor, convWeight.value, convBias?.value ?? null, {
-      inChannels: state.channels,
-      outChannels: outChannels * factor * factor,
-      height: state.height,
-      width: state.width,
-      kernelH,
-      kernelW,
-      stride: 1,
-      pad: 1,
-    });
-    projected = await ops.pixelShuffle(conv, {
-      outChannels,
-      outHeight,
-      outWidth,
-      gridWidth: state.width,
-      gridHeight: state.height,
-      patchSize: factor,
-      patchChannels: outChannels * factor * factor,
-    });
-    release(conv.buffer);
-  } else {
-    throw new Error(
-      `Unsupported AutoencoderDC upsample_block_type "${config.upsample_block_type}".`
-    );
-  }
-  const repeated = await ops.repeatChannels(state.tensor, {
-    inChannels: state.channels,
-    height: state.height,
-    width: state.width,
-    repeats: shortcutRepeats,
-  });
-  const shortcut = await ops.pixelShuffle(repeated, {
-    outChannels,
-    outHeight,
-    outWidth,
-    gridWidth: state.width,
-    gridHeight: state.height,
-    patchSize: factor,
-    patchChannels: state.channels * shortcutRepeats,
-  });
-  release(repeated.buffer);
-  release(state.tensor.buffer);
-  const size = outChannels * outHeight * outWidth;
-  const combined = await ops.residualAdd(
-    reshapeTensor(projected, [size], 'vae_dc_up_main'),
-    reshapeTensor(shortcut, [size], 'vae_dc_up_shortcut'),
-    size,
-    { useVec4: true }
-  );
-  release(projected.buffer);
-  release(shortcut.buffer);
-  return {
-    tensor: reshapeTensor(combined, [outChannels, outHeight, outWidth], 'vae_dc_up_out'),
-    channels: outChannels,
-    height: outHeight,
-    width: outWidth,
-  };
-}
-async function runAutoencoderDCResBlock(state, weights, shapes, prefix, eps, ops, release) {
-  const conv1Weight = getWeight(weights, shapes, `${prefix}.conv1.weight`);
-  const conv1Bias = getWeightOptional(weights, shapes, `${prefix}.conv1.bias`);
-  const conv1Shape = getConvShape(conv1Weight.shape);
-  const conv1Tensor = await ops.conv2d(state.tensor, conv1Weight.value, conv1Bias?.value ?? null, {
-    inChannels: conv1Shape.inChannels,
-    outChannels: conv1Shape.outChannels,
-    height: state.height,
-    width: state.width,
-    kernelH: conv1Shape.kernelH,
-    kernelW: conv1Shape.kernelW,
-    stride: 1,
-    pad: 1,
-  });
-  const conv1 = {
-    tensor: reshapeTensor(conv1Tensor, [conv1Shape.outChannels, state.height, state.width], 'vae_dc_resblock_conv1'),
-    channels: conv1Shape.outChannels,
-    height: state.height,
-    width: state.width,
-  };
-  const activated = await ops.silu(conv1.tensor, {
-    size: conv1.channels * conv1.height * conv1.width,
-    swigluLimit: null,
-  });
-  release(conv1.tensor.buffer);
-  const conv2Weight = getWeight(weights, shapes, `${prefix}.conv2.weight`);
-  const conv2Shape = getConvShape(conv2Weight.shape);
-  const conv2 = await ops.conv2d(
-    reshapeTensor(activated, [conv1.channels, conv1.height, conv1.width], 'vae_dc_resblock_act'),
-    conv2Weight.value,
-    null,
-    {
-      inChannels: conv1.channels,
-      outChannels: conv2Shape.outChannels,
-      height: conv1.height,
-      width: conv1.width,
-      kernelH: 3,
-      kernelW: 3,
-      stride: 1,
-      pad: 1,
-    }
-  );
-  release(activated.buffer);
-  const normed = await runChannelwiseRmsNorm(
-    {
-      tensor: reshapeTensor(conv2, [conv2Shape.outChannels, conv1.height, conv1.width], 'vae_dc_resblock_conv2'),
-      channels: conv2Shape.outChannels,
-      height: conv1.height,
-      width: conv1.width,
-    },
-    getWeight(weights, shapes, `${prefix}.norm.weight`),
-    getWeightOptional(weights, shapes, `${prefix}.norm.bias`),
-    eps,
-    ops,
-    release
-  );
-  release(conv2.buffer);
-  const size = normed.channels * normed.height * normed.width;
-  const combined = await ops.residualAdd(
-    reshapeTensor(normed.tensor, [size], 'vae_dc_resblock_main'),
-    reshapeTensor(state.tensor, [size], 'vae_dc_resblock_residual'),
-    size,
-    { useVec4: true }
-  );
-  release(normed.tensor.buffer);
-  release(state.tensor.buffer);
-  return {
-    tensor: reshapeTensor(combined, [normed.channels, normed.height, normed.width], 'vae_dc_resblock_out'),
-    channels: normed.channels,
-    height: normed.height,
-    width: normed.width,
-  };
-}
-async function runAutoencoderDCAttention(state, weights, shapes, prefix, attentionHeadDim, qkvMultiscales, eps, ops, release, recorder) {
-  const qWeight = getWeight(weights, shapes, `${prefix}.attn.to_q.weight`);
-  const kWeight = getWeight(weights, shapes, `${prefix}.attn.to_k.weight`);
-  const vWeight = getWeight(weights, shapes, `${prefix}.attn.to_v.weight`);
-  const qShape = getLinearShape(qWeight.shape, `${prefix}.attn.to_q.weight`);
-  const innerDim = qShape.outFeatures;
-  if (qShape.inFeatures !== state.channels || innerDim !== getLinearShape(kWeight.shape, `${prefix}.attn.to_k.weight`).outFeatures || innerDim !== getLinearShape(vWeight.shape, `${prefix}.attn.to_v.weight`).outFeatures) {
-    throw new Error(`AutoencoderDC attention "${prefix}" has incompatible q/k/v projection shapes.`);
-  }
-  if (!Number.isFinite(attentionHeadDim) || attentionHeadDim <= 0 || innerDim % attentionHeadDim !== 0) {
-    throw new Error(`AutoencoderDC attention "${prefix}" requires innerDim divisible by attentionHeadDim.`);
-  }
-  const numHeads = innerDim / attentionHeadDim;
-  const baseOptions = {
-    inChannels: state.channels,
-    outChannels: innerDim,
-    height: state.height,
-    width: state.width,
-    groups: 1,
-  };
-  const qBase = await ops.groupedPointwiseConv2d(state.tensor, qWeight.value, null, baseOptions);
-  const kBase = await ops.groupedPointwiseConv2d(state.tensor, kWeight.value, null, baseOptions);
-  const vBase = await ops.groupedPointwiseConv2d(state.tensor, vWeight.value, null, baseOptions);
-  const qVariants = [qBase];
-  const kVariants = [kBase];
-  const vVariants = [vBase];
-  if (Array.isArray(qkvMultiscales)) {
-    const qkvBase = await concatChannelTensors([qBase, kBase, vBase], state.height, state.width, recorder);
-    for (let scaleIdx = 0; scaleIdx < qkvMultiscales.length; scaleIdx++) {
-      const depthWeight = getWeight(weights, shapes, `${prefix}.attn.to_qkv_multiscale.${scaleIdx}.proj_in.weight`);
-      const pointWeight = getWeight(weights, shapes, `${prefix}.attn.to_qkv_multiscale.${scaleIdx}.proj_out.weight`);
-      const depthShape = getConvShape(depthWeight.shape);
-      const pointShape = getConvShape(pointWeight.shape);
-      const groups = pointShape.outChannels / pointShape.inChannels;
-      const depth = await ops.depthwiseConv2d(qkvBase, depthWeight.value, null, {
-        channels: qkvBase.shape[0],
-        height: state.height,
-        width: state.width,
-        kernelH: depthShape.kernelH,
-        kernelW: depthShape.kernelW,
-        stride: 1,
-        pad: Math.floor(depthShape.kernelH / 2),
-      });
-      const projected = await ops.groupedPointwiseConv2d(depth, pointWeight.value, null, {
-        inChannels: qkvBase.shape[0],
-        outChannels: pointShape.outChannels,
-        height: state.height,
-        width: state.width,
-        groups,
-      });
-      release(depth.buffer);
-      const qScale = await sliceChannelTensor(projected, 0, innerDim, state.height, state.width, recorder);
-      const kScale = await sliceChannelTensor(projected, innerDim, innerDim, state.height, state.width, recorder);
-      const vScale = await sliceChannelTensor(projected, innerDim * 2, innerDim, state.height, state.width, recorder);
-      release(projected.buffer);
-      qVariants.push(qScale);
-      kVariants.push(kScale);
-      vVariants.push(vScale);
-    }
-    release(qkvBase.buffer);
-  }
-  const qAll = await concatChannelTensors(qVariants, state.height, state.width, recorder);
-  const kAll = await concatChannelTensors(kVariants, state.height, state.width, recorder);
-  const vAll = await concatChannelTensors(vVariants, state.height, state.width, recorder);
-  for (const tensor of qVariants) release(tensor.buffer);
-  for (const tensor of kVariants) release(tensor.buffer);
-  for (const tensor of vVariants) release(tensor.buffer);
-  const qTokens = await channelsToTokens({ tensor: qAll, channels: qAll.shape[0], height: state.height, width: state.width }, ops);
-  const kTokens = await channelsToTokens({ tensor: kAll, channels: kAll.shape[0], height: state.height, width: state.width }, ops);
-  const vTokens = await channelsToTokens({ tensor: vAll, channels: vAll.shape[0], height: state.height, width: state.width }, ops);
-  release(qAll.buffer);
-  release(kAll.buffer);
-  release(vAll.buffer);
-  const qRelu = await ops.relu(qTokens.tensor, { count: tensorElementCount(qTokens.tensor) });
-  const kRelu = await ops.relu(kTokens.tensor, { count: tensorElementCount(kTokens.tensor) });
-  release(qTokens.tensor.buffer);
-  release(kTokens.tensor.buffer);
-  const allHeads = numHeads * qVariants.length;
-  const attention = await ops.sanaLinearAttention(qRelu, kRelu, vTokens.tensor, {
-    numHeads: allHeads,
-    headDim: attentionHeadDim,
-    numTokens: qTokens.numTokens,
-    hiddenSize: allHeads * attentionHeadDim,
-    eps,
-  });
-  release(qRelu.buffer);
-  release(kRelu.buffer);
-  release(vTokens.tensor.buffer);
-  const attended = await tokensToChannels(attention, allHeads * attentionHeadDim, state.height, state.width, ops);
-  release(attention.buffer);
-  const outWeight = getWeight(weights, shapes, `${prefix}.attn.to_out.weight`);
-  const outShape = getLinearShape(outWeight.shape, `${prefix}.attn.to_out.weight`);
-  const projected = await ops.groupedPointwiseConv2d(attended.tensor, outWeight.value, null, {
-    inChannels: attended.channels,
-    outChannels: outShape.outFeatures,
-    height: state.height,
-    width: state.width,
-    groups: 1,
-  });
-  release(attended.tensor.buffer);
-  const normed = await runChannelwiseRmsNorm(
-    {
-      tensor: reshapeTensor(projected, [outShape.outFeatures, state.height, state.width], 'vae_dc_attn_projected'),
-      channels: outShape.outFeatures,
-      height: state.height,
-      width: state.width,
-    },
-    getWeight(weights, shapes, `${prefix}.attn.norm_out.weight`),
-    getWeightOptional(weights, shapes, `${prefix}.attn.norm_out.bias`),
-    1e-5,
-    ops,
-    release
-  );
-  release(projected.buffer);
-  const size = normed.channels * normed.height * normed.width;
-  const combined = await ops.residualAdd(
-    reshapeTensor(normed.tensor, [size], 'vae_dc_attn_main'),
-    reshapeTensor(state.tensor, [size], 'vae_dc_attn_residual'),
-    size,
-    { useVec4: true }
-  );
-  release(normed.tensor.buffer);
-  release(state.tensor.buffer);
-  return {
-    tensor: reshapeTensor(combined, [normed.channels, normed.height, normed.width], 'vae_dc_attn_out'),
-    channels: normed.channels,
-    height: normed.height,
-    width: normed.width,
-  };
-}
-async function runAutoencoderDCGlumbConv(state, weights, shapes, prefix, eps, ops, release) {
-  const invertedWeight = getWeight(weights, shapes, `${prefix}.conv_out.conv_inverted.weight`);
-  const invertedBias = getWeightOptional(weights, shapes, `${prefix}.conv_out.conv_inverted.bias`);
-  const invertedShape = getLinearShape(invertedWeight.shape, `${prefix}.conv_out.conv_inverted.weight`);
-  const hiddenChannels = Math.floor(invertedShape.outFeatures / 2);
-  const inverted = await ops.groupedPointwiseConv2d(state.tensor, invertedWeight.value, invertedBias?.value ?? null, {
-    inChannels: state.channels,
-    outChannels: invertedShape.outFeatures,
-    height: state.height,
-    width: state.width,
-    groups: 1,
-  });
-  const activated = await ops.silu(inverted, {
-    size: invertedShape.outFeatures * state.height * state.width,
-    swigluLimit: null,
-  });
-  release(inverted.buffer);
-  const depthWeight = getWeight(weights, shapes, `${prefix}.conv_out.conv_depth.weight`);
-  const depthBias = getWeightOptional(weights, shapes, `${prefix}.conv_out.conv_depth.bias`);
-  const depthShape = getConvShape(depthWeight.shape);
-  const depth = await ops.depthwiseConv2d(
-    reshapeTensor(activated, [invertedShape.outFeatures, state.height, state.width], 'vae_dc_glumb_act'),
-    depthWeight.value,
-    depthBias?.value ?? null,
-    {
-      channels: invertedShape.outFeatures,
-      height: state.height,
-      width: state.width,
-      kernelH: depthShape.kernelH,
-      kernelW: depthShape.kernelW,
-      stride: 1,
-      pad: 1,
-    }
-  );
-  release(activated.buffer);
-  const depthTokens = await channelsToTokens({ tensor: depth, channels: invertedShape.outFeatures, height: state.height, width: state.width }, ops);
-  release(depth.buffer);
-  const gated = await ops.siluRowSplit(depthTokens.tensor, {
-    numTokens: depthTokens.numTokens,
-    dim: hiddenChannels,
-    activation: 'silu',
-    swigluLimit: null,
-  });
-  release(depthTokens.tensor.buffer);
-  const gatedChannels = await tokensToChannels(gated, hiddenChannels, state.height, state.width, ops);
-  release(gated.buffer);
-  const pointWeight = getWeight(weights, shapes, `${prefix}.conv_out.conv_point.weight`);
-  const pointShape = getLinearShape(pointWeight.shape, `${prefix}.conv_out.conv_point.weight`);
-  const projected = await ops.groupedPointwiseConv2d(gatedChannels.tensor, pointWeight.value, null, {
-    inChannels: hiddenChannels,
-    outChannels: pointShape.outFeatures,
-    height: state.height,
-    width: state.width,
-    groups: 1,
-  });
-  release(gatedChannels.tensor.buffer);
-  const normed = await runChannelwiseRmsNorm(
-    {
-      tensor: reshapeTensor(projected, [pointShape.outFeatures, state.height, state.width], 'vae_dc_glumb_projected'),
-      channels: pointShape.outFeatures,
-      height: state.height,
-      width: state.width,
-    },
-    getWeight(weights, shapes, `${prefix}.conv_out.norm.weight`),
-    getWeightOptional(weights, shapes, `${prefix}.conv_out.norm.bias`),
-    eps,
-    ops,
-    release
-  );
-  release(projected.buffer);
-  const size = normed.channels * normed.height * normed.width;
-  const combined = await ops.residualAdd(
-    reshapeTensor(normed.tensor, [size], 'vae_dc_glumb_main'),
-    reshapeTensor(state.tensor, [size], 'vae_dc_glumb_residual'),
-    size,
-    { useVec4: true }
-  );
-  release(normed.tensor.buffer);
-  release(state.tensor.buffer);
-  return {
-    tensor: reshapeTensor(combined, [normed.channels, normed.height, normed.width], 'vae_dc_glumb_out'),
-    channels: normed.channels,
-    height: normed.height,
-    width: normed.width,
-  };
-}
-async function runAutoencoderDCEfficientVitBlock(state, weights, shapes, prefix, attentionHeadDim, qkvMultiscales, eps, ops, release, recorder) {
-  const attended = await runAutoencoderDCAttention(
-    state,
-    weights,
-    shapes,
-    prefix,
-    attentionHeadDim,
-    qkvMultiscales,
-    1e-15,
-    ops,
-    release,
-    recorder
-  );
-  return runAutoencoderDCGlumbConv(attended, weights, shapes, prefix, eps, ops, release);
-}
-async function decodeLatentsAutoencoderDC(state, config, weights, shapes, ops, release, recorder) {
-  const blockTypes = normalizePerBlockValue(config.decoder_block_types, config.decoder_block_out_channels.length, 'decoder_block_types');
-  const layersPerBlock = normalizePerBlockValue(config.decoder_layers_per_block, config.decoder_block_out_channels.length, 'decoder_layers_per_block');
-  const qkvMultiscales = normalizePerBlockValue(config.decoder_qkv_multiscales, config.decoder_block_out_channels.length, 'decoder_qkv_multiscales');
-  const normTypes = normalizePerBlockValue(config.decoder_norm_types, config.decoder_block_out_channels.length, 'decoder_norm_types');
-  const actFns = normalizePerBlockValue(config.decoder_act_fns, config.decoder_block_out_channels.length, 'decoder_act_fns');
-  const rmsNormEps = 1e-5;
-  state = await runAutoencoderDCInputProjection(state, weights, shapes, config, ops, release);
-  for (let blockIdx = blockTypes.length - 1; blockIdx >= 0; blockIdx--) {
-    const prefix = `vae.decoder.up_blocks.${blockIdx}`;
-    const hasUpsample = weights.has(`${prefix}.0.conv.weight`);
-    if (hasUpsample) {
-      state = await runAutoencoderDCUpBlock(state, weights, shapes, `${prefix}.0`, config, ops, release, recorder);
-    }
-    if (normTypes[blockIdx] !== 'rms_norm') {
-      throw new Error(
-        `Unsupported AutoencoderDC norm type "${normTypes[blockIdx]}" in block ${blockIdx}.`
-      );
-    }
-    if (actFns[blockIdx] !== 'silu') {
-      throw new Error(
-        `Unsupported AutoencoderDC activation "${actFns[blockIdx]}" in block ${blockIdx}.`
-      );
-    }
-    const startIndex = hasUpsample ? 1 : 0;
-    const blockType = blockTypes[blockIdx];
-    const numLayers = layersPerBlock[blockIdx];
-    for (let layerOffset = 0; layerOffset < numLayers; layerOffset++) {
-      const layerPrefix = `${prefix}.${startIndex + layerOffset}`;
-      if (blockType === 'ResBlock') {
-        state = await runAutoencoderDCResBlock(state, weights, shapes, layerPrefix, rmsNormEps, ops, release);
-        continue;
-      }
-      if (blockType === 'EfficientViTBlock') {
-        state = await runAutoencoderDCEfficientVitBlock(
-          state,
-          weights,
-          shapes,
-          layerPrefix,
-          config.attention_head_dim,
-          qkvMultiscales[blockIdx],
-          rmsNormEps,
-          ops,
-          release,
-          recorder
-        );
-        continue;
-      }
-      throw new Error(`Unsupported AutoencoderDC block type "${blockType}" in block ${blockIdx}.`);
-    }
-  }
-  const normed = await runChannelwiseRmsNorm(
-    state,
-    getWeight(weights, shapes, 'vae.decoder.norm_out.weight'),
-    getWeightOptional(weights, shapes, 'vae.decoder.norm_out.bias'),
-    rmsNormEps,
-    ops,
-    release
-  );
-  release(state.tensor.buffer);
-  const activated = await ops.relu(normed.tensor, {
-    count: normed.channels * normed.height * normed.width,
-  });
-  release(normed.tensor.buffer);
-  return applyConv2D(
-    {
-      tensor: reshapeTensor(activated, [normed.channels, normed.height, normed.width], 'vae_dc_norm_out'),
-      channels: normed.channels,
-      height: normed.height,
-      width: normed.width,
-    },
-    weights,
-    shapes,
-    'vae.decoder.conv_out',
-    { pad: 1 },
-    ops,
-    release
-  );
-}
-async function decodeLatentsGPU(latents, options) {
-  const device = getDevice();
-  if (!device) {
-    throw new Error('VAE GPU decode requires a WebGPU device.');
-  }
-  const profileTarget = options.profile ?? null;
-  const wantsProfile = profileTarget === true || typeof profileTarget === 'object';
-  const localRecorder = wantsProfile
-    ? new CommandRecorder(device, 'vae_decode', { profile: true })
-    : null;
-  const recorder = localRecorder;
-  const ops = createKernelOps(recorder);
-  const release = createBufferReleaser(recorder);
-  const config = options.modelConfig?.components?.vae?.config || {};
-  const runtime = options.runtime || {};
-  const weightsEntry = options.weights;
-  if (!weightsEntry?.weights || !weightsEntry?.shapes) {
-    throw new Error('VAE GPU decode requires loaded weights.');
-  }
-  const weights = weightsEntry.weights;
-  const shapes = weightsEntry.shapes;
-  const scalingFactor = config.scaling_factor;
-  if (!Number.isFinite(scalingFactor) || scalingFactor === 0) {
-    throw new Error('VAE decode requires a valid scaling_factor in config.');
-  }
-  const shiftFactor = Number.isFinite(config.shift_factor) ? config.shift_factor : 0.0;
-  const isAutoencoderDC = config._class_name === 'AutoencoderDC' || Array.isArray(config.decoder_block_types);
-  const scaledLatents = new Float32Array(latents.length);
-  for (let i = 0; i < latents.length; i++) {
-    scaledLatents[i] = latents[i] / scalingFactor + shiftFactor;
-  }
-  const latentBuffer = acquireBuffer(scaledLatents.byteLength, undefined, 'vae_latents');
-  device.queue.writeBuffer(latentBuffer, 0, scaledLatents);
-  let state = {
-    tensor: createTensor(latentBuffer, 'f32', [options.latentChannels, options.latentHeight, options.latentWidth], 'vae_latents_f32'),
-    channels: options.latentChannels,
-    height: options.latentHeight,
-    width: options.latentWidth,
-  };
-  const computeDtype = runtime.latent?.dtype;
-  if (!computeDtype) {
-    throw new Error('VAE decode requires runtime.latent.dtype.');
-  }
-  if (computeDtype !== 'f16') {
-    throw new Error(
-      `VAE GPU decode requires runtime.latent.dtype="f16"; got "${computeDtype}".`
-    );
-  }
-  const casted = await ops.castF32ToF16(state.tensor);
-  release(state.tensor.buffer);
-  state = {
-    tensor: reshapeTensor(casted, [state.channels, state.height, state.width], 'vae_latents_f16'),
-    channels: state.channels,
-    height: state.height,
-    width: state.width,
-  };
-  if (isAutoencoderDC) {
-    state = await decodeLatentsAutoencoderDC(state, config, weights, shapes, ops, release, recorder);
-  } else {
-    const numGroups = config.norm_num_groups;
-    if (!Number.isFinite(numGroups) || numGroups <= 0) {
-      throw new Error('VAE decode requires norm_num_groups in config.');
-    }
-    const eps = runtime.decode?.groupNormEps;
-    if (!Number.isFinite(eps)) {
-      throw new Error('VAE decode requires runtime.decode.groupNormEps.');
-    }
-    state = await applyConv2D(state, weights, shapes, 'vae.decoder.conv_in', { pad: 1 }, ops, release);
-    const midResnetPrefix = 'vae.decoder.mid_block.resnets.';
-    const midResnetIds = buildIndexList(weights, midResnetPrefix);
-    for (const idx of midResnetIds) {
-      state = await runResnetBlock(state, weights, shapes, `${midResnetPrefix}${idx}`, { numGroups, eps }, ops, release);
-    }
-    const midAttentionPrefix = 'vae.decoder.mid_block.attentions.';
-    const midAttentionIds = buildIndexList(weights, midAttentionPrefix);
-    for (const idx of midAttentionIds) {
-      state = await runMidBlockAttention(
-        state,
-        weights,
-        shapes,
-        `${midAttentionPrefix}${idx}`,
-        {
-          numGroups,
-          eps,
-          modelConfig: config,
-        },
-        ops,
-        release
-      );
-    }
-    const upBlockPrefix = 'vae.decoder.up_blocks.';
-    const upBlocks = buildIndexList(weights, upBlockPrefix);
-    for (const blockIdx of upBlocks) {
-      const resnetPrefix = `${upBlockPrefix}${blockIdx}.resnets.`;
-      const resnetIds = buildIndexList(weights, resnetPrefix);
-      for (const idx of resnetIds) {
-        state = await runResnetBlock(state, weights, shapes, `${resnetPrefix}${idx}`, { numGroups, eps }, ops, release);
-      }
-      const upsampleWeightName = `${upBlockPrefix}${blockIdx}.upsamplers.0.conv.weight`;
-      if (weights.has(upsampleWeightName)) {
-        const upsample = await ops.upsample2d(state.tensor, {
-          channels: state.channels,
-          height: state.height,
-          width: state.width,
-          scale: 2,
-        });
-        release(state.tensor.buffer);
-        state = {
-          tensor: reshapeTensor(upsample, [state.channels, state.height * 2, state.width * 2], 'vae_upsample'),
-          channels: state.channels,
-          height: state.height * 2,
-          width: state.width * 2,
-        };
-        state = await applyConv2D(state, weights, shapes, `${upBlockPrefix}${blockIdx}.upsamplers.0.conv`, { pad: 1 }, ops, release);
-      }
-    }
-    const normOut = getWeight(weights, shapes, 'vae.decoder.conv_norm_out.weight');
-    const normOutBias = getWeight(weights, shapes, 'vae.decoder.conv_norm_out.bias');
-    const normed = await ops.groupNorm(state.tensor, normOut.value, normOutBias.value, {
-      channels: state.channels,
-      height: state.height,
-      width: state.width,
-      numGroups,
-      eps,
-    });
-    release(state.tensor.buffer);
-    const siluOut = await ops.silu(normed, { size: state.channels * state.height * state.width, swigluLimit: null });
-    release(normed.buffer);
-    state = {
-      tensor: reshapeTensor(siluOut, [state.channels, state.height, state.width], 'vae_norm_out'),
-      channels: state.channels,
-      height: state.height,
-      width: state.width,
-    };
-    state = await applyConv2D(state, weights, shapes, 'vae.decoder.conv_out', { pad: 1 }, ops, release);
-  }
-  const outputSize = state.channels * state.height * state.width * dtypeBytes(state.tensor.dtype);
-  if (localRecorder) {
-    localRecorder.submit();
-  }
-  const outputRaw = await readBuffer(state.tensor.buffer, outputSize);
-  releaseBuffer(state.tensor.buffer);
-  if (localRecorder) {
-    const timings = await localRecorder.resolveProfileTimings();
-    if (profileTarget && typeof profileTarget === 'object') {
-      profileTarget.totalMs = sumProfileTimings(timings) ?? null;
-      profileTarget.timings = timings ?? null;
-    }
-  }
-  const output = state.tensor.dtype === 'f16'
-    ? new Uint16Array(outputRaw)
-    : new Float32Array(outputRaw);
-  const outHeight = state.height;
-  const outWidth = state.width;
-  if (outHeight !== options.height || outWidth !== options.width) {
-    log.warn('Diffusion', `VAE output size ${outWidth}x${outHeight} differs from request ${options.width}x${options.height}.`);
-  }
-  const pixels = new Uint8ClampedArray(outWidth * outHeight * 4);
-  const height = outHeight;
-  const width = outWidth;
-  for (let y = 0; y < height; y++) {
-    for (let x = 0; x < width; x++) {
-      const outIndex = (y * width + x) * 4;
-      const base = (y * width + x);
-      const rIdx = base;
-      const gIdx = base + height * width;
-      const bIdx = base + 2 * height * width;
-      const r = state.tensor.dtype === 'f16' ? f16ToF32(output[rIdx]) : output[rIdx];
-      const g = state.tensor.dtype === 'f16' ? f16ToF32(output[gIdx]) : output[gIdx];
-      const b = state.tensor.dtype === 'f16' ? f16ToF32(output[bIdx]) : output[bIdx];
-      pixels[outIndex] = clamp(Math.round((r * 0.5 + 0.5) * 255), 0, 255);
-      pixels[outIndex + 1] = clamp(Math.round((g * 0.5 + 0.5) * 255), 0, 255);
-      pixels[outIndex + 2] = clamp(Math.round((b * 0.5 + 0.5) * 255), 0, 255);
-      pixels[outIndex + 3] = 255;
-    }
-  }
-  return pixels;
-}
-export async function decodeLatents(latents, options) {
-  if (!options?.weights || !getDevice()) {
-    throw new Error(
-      'Diffusion decode requires GPU VAE weights and a WebGPU device. ' +
-      'CPU decode fallback is unsupported.'
-    );
-  }
-  return decodeLatentsGPU(latents, options);
-}