npm - @genai-fi/nanogpt - Versions diffs - 0.19.0 → 0.20.0 - Mend

@genai-fi/nanogpt 0.19.0 → 0.20.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (482) hide show

package/package.json +9 -10
package/dist/Generator.d.ts +0 -82
package/dist/Generator.js +0 -11941
package/dist/RealDiv-CGwv0liw.js +0 -365
package/dist/Reshape-BW__R4mZ.js +0 -79
package/dist/Reshape-CPBkTIH2.js +0 -14
package/dist/TeachableLLM.d.ts +0 -70
package/dist/TeachableLLM.js +0 -273
package/dist/Trainer.d.ts +0 -43
package/dist/Trainer.js +0 -244
package/dist/_commonjsHelpers-ByX85dGu.js +0 -33
package/dist/axis_util-GTVlo58H.js +0 -55
package/dist/backend.d.ts +0 -2
package/dist/backend.js +0 -13
package/dist/backend_util-GaFarB78.js +0 -425
package/dist/backend_webgpu-BqASlsbV.js +0 -545
package/dist/binary_op_util-pKXltfxI.js +0 -192
package/dist/broadcast_to-eS93CCN_.js +0 -28
package/dist/checks/appendCache.d.ts +0 -1
package/dist/checks/appendCache.js +0 -22
package/dist/checks/attentionMask.d.ts +0 -1
package/dist/checks/attentionMask.js +0 -37
package/dist/checks/check.d.ts +0 -9
package/dist/checks/check.js +0 -20
package/dist/checks/gelu.d.ts +0 -1
package/dist/checks/gelu.js +0 -18
package/dist/checks/index.d.ts +0 -26
package/dist/checks/index.js +0 -28
package/dist/checks/matMulGelu.d.ts +0 -1
package/dist/checks/matMulGelu.js +0 -28
package/dist/checks/normRMS.d.ts +0 -1
package/dist/checks/normRMS.js +0 -16
package/dist/checks/normRMSGrad.d.ts +0 -1
package/dist/checks/normRMSGrad.js +0 -12
package/dist/checks/packUnpack.d.ts +0 -1
package/dist/checks/packUnpack.js +0 -18
package/dist/checks/qkv.d.ts +0 -1
package/dist/checks/qkv.js +0 -34
package/dist/checks/rope.d.ts +0 -1
package/dist/checks/rope.js +0 -36
package/dist/checks/weights.d.ts +0 -14
package/dist/checks/weights.js +0 -31
package/dist/clip_by_value-DDA7rrcT.js +0 -12
package/dist/complex-DI35Q-gW.js +0 -11
package/dist/complex_util-Yc1A_gV1.js +0 -55
package/dist/concat-CAQpCret.js +0 -17
package/dist/concat_util-D18dJ4fD.js +0 -22
package/dist/data/docx.d.ts +0 -2
package/dist/data/docx.js +0 -15
package/dist/data/parquet.d.ts +0 -2
package/dist/data/parquet.js +0 -17
package/dist/data/pdf.d.ts +0 -2
package/dist/data/pdf.js +0 -14
package/dist/data/textLoader.d.ts +0 -7
package/dist/data/textLoader.js +0 -108
package/dist/dataset-CGGp1z9P.js +0 -1124
package/dist/dropout_util--NxWuYg2.js +0 -27
package/dist/expand_dims-Bkd1YD5x.js +0 -11
package/dist/exports_initializers-CYzKLjN7.js +0 -7
package/dist/floor-BQtb-Azg.js +0 -9
package/dist/gather-qIqEqaGn.js +0 -9
package/dist/gelu-B220X1Go.js +0 -26
package/dist/gpgpu_math-BwvV12df.js +0 -2022
package/dist/index-CUXkjxiT.js +0 -3516
package/dist/index-CieiGp4Y.js +0 -349
package/dist/index-CjOWnMXP.js +0 -7308
package/dist/index-Cp39cXWe.js +0 -1016
package/dist/index-D5v913EJ.js +0 -4
package/dist/index-DmeWGGmS.js +0 -1074
package/dist/index-DvYrXKkX.js +0 -113
package/dist/index-Ksja3su6.js +0 -151
package/dist/index-xuotMAFm.js +0 -118
package/dist/inference/types.d.ts +0 -16
package/dist/inference/types.js +0 -1
package/dist/jszip.min-BZhlzntC.js +0 -2313
package/dist/kernel_funcs_utils-pq0CK9co.js +0 -306
package/dist/layers/BaseLayer.d.ts +0 -44
package/dist/layers/BaseLayer.js +0 -74
package/dist/layers/CausalSelfAttention.d.ts +0 -39
package/dist/layers/CausalSelfAttention.js +0 -86
package/dist/layers/LoRA.d.ts +0 -14
package/dist/layers/LoRA.js +0 -58
package/dist/layers/MLP.d.ts +0 -17
package/dist/layers/MLP.js +0 -44
package/dist/layers/PositionEmbedding.d.ts +0 -8
package/dist/layers/PositionEmbedding.js +0 -31
package/dist/layers/RMSNorm.d.ts +0 -12
package/dist/layers/RMSNorm.js +0 -22
package/dist/layers/RoPECache.d.ts +0 -18
package/dist/layers/RoPECache.js +0 -50
package/dist/layers/TiedEmbedding.d.ts +0 -13
package/dist/layers/TiedEmbedding.js +0 -36
package/dist/layers/TransformerBlock.d.ts +0 -27
package/dist/layers/TransformerBlock.js +0 -40
package/dist/layers/WeightStore.d.ts +0 -20
package/dist/layers/WeightStore.js +0 -76
package/dist/loader/load.d.ts +0 -6
package/dist/loader/load.js +0 -68
package/dist/loader/loadHF.d.ts +0 -8
package/dist/loader/loadHF.js +0 -22
package/dist/loader/loadTransformers.d.ts +0 -4
package/dist/loader/loadTransformers.js +0 -44
package/dist/loader/loadZipMeta.d.ts +0 -3
package/dist/loader/loadZipMeta.js +0 -16
package/dist/loader/newZipLoad.d.ts +0 -3
package/dist/loader/newZipLoad.js +0 -31
package/dist/loader/oldZipLoad.d.ts +0 -9
package/dist/loader/oldZipLoad.js +0 -80
package/dist/loader/save.d.ts +0 -16
package/dist/loader/save.js +0 -90
package/dist/loader/types.d.ts +0 -67
package/dist/loader/types.js +0 -1
package/dist/main.d.ts +0 -50
package/dist/main.js +0 -109
package/dist/matMul16-BcVC_E62.js +0 -80
package/dist/matMulGelu-JNLZqKQp.js +0 -163
package/dist/mat_mul-DhG0Newp.js +0 -11
package/dist/mod-CSdCpRjf.js +0 -11
package/dist/models/NanoGPTV1.d.ts +0 -16
package/dist/models/NanoGPTV1.js +0 -99
package/dist/models/NanoGPTV2.d.ts +0 -16
package/dist/models/NanoGPTV2.js +0 -90
package/dist/models/config.d.ts +0 -27
package/dist/models/config.js +0 -50
package/dist/models/factory.d.ts +0 -3
package/dist/models/factory.js +0 -16
package/dist/models/model.d.ts +0 -44
package/dist/models/model.js +0 -134
package/dist/non_max_suppression_impl-B2W7YjZB.js +0 -102
package/dist/not_equal-hurPF26l.js +0 -64
package/dist/ones-BytntneX.js +0 -14
package/dist/ops/adamAdjust.d.ts +0 -2
package/dist/ops/adamAdjust.js +0 -9
package/dist/ops/adamMoments.d.ts +0 -2
package/dist/ops/adamMoments.js +0 -9
package/dist/ops/add16.d.ts +0 -2
package/dist/ops/add16.js +0 -9
package/dist/ops/appendCache.d.ts +0 -2
package/dist/ops/appendCache.js +0 -22
package/dist/ops/attentionMask.d.ts +0 -2
package/dist/ops/attentionMask.js +0 -10
package/dist/ops/concat16.d.ts +0 -2
package/dist/ops/concat16.js +0 -9
package/dist/ops/cpu/adamAdjust.d.ts +0 -1
package/dist/ops/cpu/adamAdjust.js +0 -18
package/dist/ops/cpu/adamMoments.d.ts +0 -1
package/dist/ops/cpu/adamMoments.js +0 -16
package/dist/ops/cpu/appendCache.d.ts +0 -1
package/dist/ops/cpu/appendCache.js +0 -23
package/dist/ops/cpu/attentionMask.d.ts +0 -1
package/dist/ops/cpu/attentionMask.js +0 -22
package/dist/ops/cpu/fusedSoftmax.d.ts +0 -9
package/dist/ops/cpu/fusedSoftmax.js +0 -29
package/dist/ops/cpu/gatherSub.d.ts +0 -1
package/dist/ops/cpu/gatherSub.js +0 -18
package/dist/ops/cpu/gelu.d.ts +0 -1
package/dist/ops/cpu/gelu.js +0 -40
package/dist/ops/cpu/matMul16.d.ts +0 -1
package/dist/ops/cpu/matMul16.js +0 -15
package/dist/ops/cpu/matMulGelu.d.ts +0 -1
package/dist/ops/cpu/matMulGelu.js +0 -53
package/dist/ops/cpu/matMulMul.d.ts +0 -1
package/dist/ops/cpu/matMulMul.js +0 -23
package/dist/ops/cpu/mulDropout.d.ts +0 -1
package/dist/ops/cpu/mulDropout.js +0 -23
package/dist/ops/cpu/normRMS.d.ts +0 -1
package/dist/ops/cpu/normRMS.js +0 -39
package/dist/ops/cpu/qkv.d.ts +0 -5
package/dist/ops/cpu/qkv.js +0 -41
package/dist/ops/cpu/rope.d.ts +0 -6
package/dist/ops/cpu/rope.js +0 -38
package/dist/ops/cpu/scatterSub.d.ts +0 -1
package/dist/ops/cpu/scatterSub.js +0 -23
package/dist/ops/dot16.d.ts +0 -2
package/dist/ops/dot16.js +0 -42
package/dist/ops/dropout.d.ts +0 -2
package/dist/ops/dropout.js +0 -14
package/dist/ops/dropout16.d.ts +0 -2
package/dist/ops/dropout16.js +0 -25
package/dist/ops/gatherSub.d.ts +0 -2
package/dist/ops/gatherSub.js +0 -9
package/dist/ops/gelu.d.ts +0 -3
package/dist/ops/gelu.js +0 -8
package/dist/ops/globalNorm.d.ts +0 -2
package/dist/ops/globalNorm.js +0 -13
package/dist/ops/grads/add16.d.ts +0 -1
package/dist/ops/grads/add16.js +0 -26
package/dist/ops/grads/attentionMask.d.ts +0 -1
package/dist/ops/grads/attentionMask.js +0 -21
package/dist/ops/grads/dropout16.d.ts +0 -1
package/dist/ops/grads/dropout16.js +0 -2
package/dist/ops/grads/gelu.d.ts +0 -2
package/dist/ops/grads/gelu.js +0 -5
package/dist/ops/grads/matMul16.d.ts +0 -2
package/dist/ops/grads/matMul16.js +0 -9
package/dist/ops/grads/matMulGelu.d.ts +0 -1
package/dist/ops/grads/matMulGelu.js +0 -17
package/dist/ops/grads/mul16.d.ts +0 -1
package/dist/ops/grads/mul16.js +0 -4
package/dist/ops/grads/normRMS.d.ts +0 -3
package/dist/ops/grads/normRMS.js +0 -33
package/dist/ops/grads/pack16.d.ts +0 -2
package/dist/ops/grads/pack16.js +0 -6
package/dist/ops/grads/qkv.d.ts +0 -3
package/dist/ops/grads/qkv.js +0 -34
package/dist/ops/grads/rope.d.ts +0 -2
package/dist/ops/grads/rope.js +0 -5
package/dist/ops/grads/softmax16.d.ts +0 -2
package/dist/ops/grads/softmax16.js +0 -25
package/dist/ops/grads/unpack16.d.ts +0 -2
package/dist/ops/grads/unpack16.js +0 -5
package/dist/ops/grads/utils.d.ts +0 -4
package/dist/ops/grads/utils.js +0 -14
package/dist/ops/log.d.ts +0 -0
package/dist/ops/log.js +0 -1
package/dist/ops/matMul16.d.ts +0 -15
package/dist/ops/matMul16.js +0 -13
package/dist/ops/matMulGelu.d.ts +0 -3
package/dist/ops/matMulGelu.js +0 -14
package/dist/ops/matMulMul.d.ts +0 -2
package/dist/ops/matMulMul.js +0 -9
package/dist/ops/mul16.d.ts +0 -2
package/dist/ops/mul16.js +0 -39
package/dist/ops/mulDrop.d.ts +0 -2
package/dist/ops/mulDrop.js +0 -9
package/dist/ops/normRMS.d.ts +0 -2
package/dist/ops/normRMS.js +0 -19
package/dist/ops/pack16.d.ts +0 -2
package/dist/ops/pack16.js +0 -5
package/dist/ops/qkv.d.ts +0 -2
package/dist/ops/qkv.js +0 -10
package/dist/ops/reshape16.d.ts +0 -2
package/dist/ops/reshape16.js +0 -41
package/dist/ops/rope.d.ts +0 -3
package/dist/ops/rope.js +0 -7
package/dist/ops/scatterSub.d.ts +0 -2
package/dist/ops/scatterSub.js +0 -9
package/dist/ops/slice16.d.ts +0 -2
package/dist/ops/slice16.js +0 -9
package/dist/ops/softmax16.d.ts +0 -2
package/dist/ops/softmax16.js +0 -9
package/dist/ops/sub16.d.ts +0 -2
package/dist/ops/sub16.js +0 -8
package/dist/ops/sum16.d.ts +0 -2
package/dist/ops/sum16.js +0 -13
package/dist/ops/transpose16.d.ts +0 -3
package/dist/ops/transpose16.js +0 -40
package/dist/ops/unpack16.d.ts +0 -2
package/dist/ops/unpack16.js +0 -6
package/dist/ops/webgl/adamAdjust.d.ts +0 -1
package/dist/ops/webgl/adamAdjust.js +0 -49
package/dist/ops/webgl/adamMoments.d.ts +0 -1
package/dist/ops/webgl/adamMoments.js +0 -40
package/dist/ops/webgl/appendCache.d.ts +0 -1
package/dist/ops/webgl/appendCache.js +0 -44
package/dist/ops/webgl/attentionMask.d.ts +0 -1
package/dist/ops/webgl/attentionMask.js +0 -45
package/dist/ops/webgl/dropout16.d.ts +0 -1
package/dist/ops/webgl/dropout16.js +0 -11
package/dist/ops/webgl/fusedSoftmax.d.ts +0 -11
package/dist/ops/webgl/fusedSoftmax.js +0 -80
package/dist/ops/webgl/gatherSub.d.ts +0 -1
package/dist/ops/webgl/gatherSub.js +0 -27
package/dist/ops/webgl/gelu.d.ts +0 -2
package/dist/ops/webgl/gelu.js +0 -50
package/dist/ops/webgl/log.d.ts +0 -17
package/dist/ops/webgl/log.js +0 -23
package/dist/ops/webgl/matMul16.d.ts +0 -1
package/dist/ops/webgl/matMul16.js +0 -45
package/dist/ops/webgl/matMulGelu.d.ts +0 -21
package/dist/ops/webgl/matMulGelu.js +0 -9
package/dist/ops/webgl/matMulMul.d.ts +0 -14
package/dist/ops/webgl/matMulMul.js +0 -28
package/dist/ops/webgl/mulDropout.d.ts +0 -1
package/dist/ops/webgl/mulDropout.js +0 -41
package/dist/ops/webgl/normRMS.d.ts +0 -1
package/dist/ops/webgl/normRMS.js +0 -93
package/dist/ops/webgl/qkv.d.ts +0 -1
package/dist/ops/webgl/qkv.js +0 -46
package/dist/ops/webgl/rope.d.ts +0 -1
package/dist/ops/webgl/rope.js +0 -56
package/dist/ops/webgl/scatterSub.d.ts +0 -1
package/dist/ops/webgl/scatterSub.js +0 -27
package/dist/ops/webgpu/adamAdjust.d.ts +0 -1
package/dist/ops/webgpu/adamAdjust.js +0 -57
package/dist/ops/webgpu/adamMoments.d.ts +0 -1
package/dist/ops/webgpu/adamMoments.js +0 -60
package/dist/ops/webgpu/add16.d.ts +0 -1
package/dist/ops/webgpu/add16.js +0 -13
package/dist/ops/webgpu/appendCache.d.ts +0 -1
package/dist/ops/webgpu/appendCache.js +0 -105
package/dist/ops/webgpu/attentionMask.d.ts +0 -1
package/dist/ops/webgpu/attentionMask.js +0 -26
package/dist/ops/webgpu/attentionMask32_program.d.ts +0 -19
package/dist/ops/webgpu/attentionMask32_program.js +0 -54
package/dist/ops/webgpu/clipScale.d.ts +0 -1
package/dist/ops/webgpu/clipScale.js +0 -58
package/dist/ops/webgpu/concat16.d.ts +0 -19
package/dist/ops/webgpu/concat16.js +0 -126
package/dist/ops/webgpu/dropout16.d.ts +0 -1
package/dist/ops/webgpu/dropout16.js +0 -51
package/dist/ops/webgpu/gatherSub.d.ts +0 -1
package/dist/ops/webgpu/gatherSub.js +0 -39
package/dist/ops/webgpu/gelu.d.ts +0 -14
package/dist/ops/webgpu/gelu.js +0 -141
package/dist/ops/webgpu/index.d.ts +0 -0
package/dist/ops/webgpu/index.js +0 -26
package/dist/ops/webgpu/matMul16.d.ts +0 -1
package/dist/ops/webgpu/matMul16.js +0 -65
package/dist/ops/webgpu/matMul16_program.d.ts +0 -42
package/dist/ops/webgpu/matMul16_program.js +0 -343
package/dist/ops/webgpu/mul16.d.ts +0 -1
package/dist/ops/webgpu/mul16.js +0 -13
package/dist/ops/webgpu/norm2.d.ts +0 -1
package/dist/ops/webgpu/norm2.js +0 -76
package/dist/ops/webgpu/normRMS.d.ts +0 -1
package/dist/ops/webgpu/normRMS.js +0 -34
package/dist/ops/webgpu/normRMS16_program.d.ts +0 -10
package/dist/ops/webgpu/normRMS16_program.js +0 -25
package/dist/ops/webgpu/normRMS32_program.d.ts +0 -10
package/dist/ops/webgpu/normRMS32_program.js +0 -25
package/dist/ops/webgpu/normRMSGrad.d.ts +0 -1
package/dist/ops/webgpu/normRMSGrad.js +0 -284
package/dist/ops/webgpu/pack16.d.ts +0 -1
package/dist/ops/webgpu/pack16.js +0 -18
package/dist/ops/webgpu/pack16_program.d.ts +0 -19
package/dist/ops/webgpu/pack16_program.js +0 -92
package/dist/ops/webgpu/qkv.d.ts +0 -1
package/dist/ops/webgpu/qkv.js +0 -24
package/dist/ops/webgpu/rope.d.ts +0 -1
package/dist/ops/webgpu/rope.js +0 -135
package/dist/ops/webgpu/scatterSub.d.ts +0 -1
package/dist/ops/webgpu/scatterSub.js +0 -40
package/dist/ops/webgpu/slice16.d.ts +0 -7
package/dist/ops/webgpu/slice16.js +0 -69
package/dist/ops/webgpu/softmax16.d.ts +0 -17
package/dist/ops/webgpu/softmax16.js +0 -21
package/dist/ops/webgpu/softmax16_program.d.ts +0 -13
package/dist/ops/webgpu/softmax16_program.js +0 -73
package/dist/ops/webgpu/softmax16_subgroup_program.d.ts +0 -17
package/dist/ops/webgpu/softmax16_subgroup_program.js +0 -75
package/dist/ops/webgpu/softmax16grad.d.ts +0 -1
package/dist/ops/webgpu/softmax16grad.js +0 -37
package/dist/ops/webgpu/sub16.d.ts +0 -1
package/dist/ops/webgpu/sub16.js +0 -13
package/dist/ops/webgpu/sum16.d.ts +0 -1
package/dist/ops/webgpu/sum16.js +0 -38
package/dist/ops/webgpu/transpose16.d.ts +0 -1
package/dist/ops/webgpu/transpose16.js +0 -34
package/dist/ops/webgpu/transpose16_program.d.ts +0 -16
package/dist/ops/webgpu/transpose16_program.js +0 -50
package/dist/ops/webgpu/transpose16_shared_program.d.ts +0 -15
package/dist/ops/webgpu/transpose16_shared_program.js +0 -70
package/dist/ops/webgpu/unpack16.d.ts +0 -1
package/dist/ops/webgpu/unpack16.js +0 -48
package/dist/ops/webgpu/utils/binary_op.d.ts +0 -35
package/dist/ops/webgpu/utils/binary_op.js +0 -139
package/dist/ops/webgpu/utils/deviceInfo.d.ts +0 -7
package/dist/ops/webgpu/utils/deviceInfo.js +0 -11
package/dist/ops/webgpu/utils/reductions.d.ts +0 -43
package/dist/ops/webgpu/utils/reductions.js +0 -275
package/dist/ops-CsXeTq1P.js +0 -476
package/dist/pack16-bqltoUlR.js +0 -39
package/dist/papaparse.min-C0cScC2i.js +0 -418
package/dist/parquet-Bqjmp2vo.js +0 -44231
package/dist/patches/webgpu_backend.d.ts +0 -18
package/dist/patches/webgpu_backend.js +0 -56
package/dist/patches/webgpu_base.d.ts +0 -21
package/dist/patches/webgpu_base.js +0 -34
package/dist/patches/webgpu_program.d.ts +0 -36
package/dist/patches/webgpu_program.js +0 -400
package/dist/pdf-NIhmP3sq.js +0 -19477
package/dist/rand_util-CZ7yLoUm.js +0 -50
package/dist/random_normal-IBRrha8a.js +0 -14
package/dist/random_width-DN5ZtQkM.js +0 -9796
package/dist/range-C-CjF-LI.js +0 -10
package/dist/relu-J_X6MUzx.js +0 -9
package/dist/reshape-BDOuCSNW.js +0 -9
package/dist/resize_nearest_neighbor-BojqlfRe.js +0 -150
package/dist/rope-DcrZM_e6.js +0 -24
package/dist/scatter_nd_util-ByNJaL6I.js +0 -46
package/dist/segment_util-Dasb2Zaf.js +0 -43
package/dist/selu_util-BLhIqRkw.js +0 -44
package/dist/shared-3agzAqQ_.js +0 -53
package/dist/shared-CagdqkLh.js +0 -2143
package/dist/slice-BzS11Qh0.js +0 -12
package/dist/slice_util-CC35pLmT.js +0 -153
package/dist/softmax-D4q1LJN7.js +0 -12
package/dist/split-C2Sj255c.js +0 -9
package/dist/squeeze-ho4wLUek.js +0 -10
package/dist/stack-DudVrtmG.js +0 -11
package/dist/step-BTxPtq1r.js +0 -261
package/dist/sum-BpiwSWvg.js +0 -11
package/dist/tensor-BWFldCso.js +0 -8
package/dist/tensor1d-LMGMIUlr.js +0 -11
package/dist/tensor2d-BnXMKScO.js +0 -14
package/dist/tensor4d-C6UCG_u8.js +0 -14
package/dist/tfjs_backend-BGnG-ppu.js +0 -654
package/dist/tile-CFy-xTO6.js +0 -11
package/dist/tokeniser/BaseTokeniser.d.ts +0 -33
package/dist/tokeniser/BaseTokeniser.js +0 -124
package/dist/tokeniser/CharTokeniser.d.ts +0 -24
package/dist/tokeniser/CharTokeniser.js +0 -107
package/dist/tokeniser/bpe.d.ts +0 -28
package/dist/tokeniser/bpe.js +0 -173
package/dist/tokeniser/messages.d.ts +0 -61
package/dist/tokeniser/messages.js +0 -1
package/dist/tokeniser/type.d.ts +0 -34
package/dist/tokeniser/type.js +0 -1
package/dist/training/AdamW.d.ts +0 -36
package/dist/training/AdamW.js +0 -138
package/dist/training/BasicTrainer.d.ts +0 -63
package/dist/training/BasicTrainer.js +0 -265
package/dist/training/DatasetBuilder.d.ts +0 -26
package/dist/training/DatasetBuilder.js +0 -86
package/dist/training/Evaluator.d.ts +0 -19
package/dist/training/Evaluator.js +0 -39
package/dist/training/LRScheduler.d.ts +0 -12
package/dist/training/LRScheduler.js +0 -34
package/dist/training/PreTrainer.d.ts +0 -11
package/dist/training/PreTrainer.js +0 -20
package/dist/training/SFTTrainer.d.ts +0 -12
package/dist/training/SFTTrainer.js +0 -22
package/dist/training/loss.d.ts +0 -3
package/dist/training/loss.js +0 -24
package/dist/training/orthoGrad.d.ts +0 -2
package/dist/training/orthoGrad.js +0 -10
package/dist/training/sparseCrossEntropy.d.ts +0 -7
package/dist/training/sparseCrossEntropy.js +0 -69
package/dist/training/tasks/ConversationTask.d.ts +0 -18
package/dist/training/tasks/ConversationTask.js +0 -40
package/dist/training/tasks/PretrainingTask.d.ts +0 -17
package/dist/training/tasks/PretrainingTask.js +0 -47
package/dist/training/tasks/StartSentenceTask.d.ts +0 -18
package/dist/training/tasks/StartSentenceTask.js +0 -49
package/dist/training/tasks/Task.d.ts +0 -22
package/dist/training/tasks/Task.js +0 -68
package/dist/training/tasks/splitter.d.ts +0 -5
package/dist/training/tasks/splitter.js +0 -21
package/dist/training/types.d.ts +0 -78
package/dist/training/types.js +0 -1
package/dist/training/validation.d.ts +0 -17
package/dist/training/validation.js +0 -84
package/dist/transpose-9kRxIXWR.js +0 -36
package/dist/unsorted_segment_sum-DJvk5xnh.js +0 -277
package/dist/utilities/arrayClose.d.ts +0 -1
package/dist/utilities/arrayClose.js +0 -20
package/dist/utilities/datasetID.d.ts +0 -2
package/dist/utilities/datasetID.js +0 -21
package/dist/utilities/dummy.d.ts +0 -9
package/dist/utilities/dummy.js +0 -43
package/dist/utilities/multinomialCPU.d.ts +0 -2
package/dist/utilities/multinomialCPU.js +0 -13
package/dist/utilities/naming.d.ts +0 -4
package/dist/utilities/naming.js +0 -1
package/dist/utilities/packed.d.ts +0 -4
package/dist/utilities/packed.js +0 -15
package/dist/utilities/parameters.d.ts +0 -11
package/dist/utilities/parameters.js +0 -57
package/dist/utilities/performance.d.ts +0 -2
package/dist/utilities/performance.js +0 -16
package/dist/utilities/profile.d.ts +0 -17
package/dist/utilities/profile.js +0 -38
package/dist/utilities/safetensors.d.ts +0 -3
package/dist/utilities/safetensors.js +0 -83
package/dist/utilities/sentences.d.ts +0 -5
package/dist/utilities/sentences.js +0 -41
package/dist/utilities/tokenParse.d.ts +0 -1
package/dist/utilities/tokenParse.js +0 -21
package/dist/utilities/topP.d.ts +0 -1
package/dist/utilities/topP.js +0 -13
package/dist/utilities/waitForModel.d.ts +0 -2
package/dist/utilities/waitForModel.js +0 -12
package/dist/utilities/weights.d.ts +0 -12
package/dist/utilities/weights.js +0 -45
package/dist/utilities/yielder.d.ts +0 -1
package/dist/utilities/yielder.js +0 -7
package/dist/variable-Ck482e3n.js +0 -7
package/dist/webgpu_program-B4HmApL1.js +0 -525
package/dist/webgpu_util-DYlGSwOJ.js +0 -64
package/dist/zeros-DvZpK8s6.js +0 -13
package/dist/zeros_like-CWjDdwr-.js +0 -721

package/dist/ops/webgpu/matMul16_program.d.ts DELETED Viewed

@@ -1,42 +0,0 @@
-import { WebGPUProgram } from '@tensorflow/tfjs-backend-webgpu';
-export default class MatMul16ProgramGeneric implements WebGPUProgram {
-    variableNames: string[];
-    outputShape: number[];
-    shaderKey: string;
-    dispatchLayout: {
-        x: number[];
-        y: number[];
-        z: number[];
-    };
-    dispatch: [number, number, number];
-    workgroupSize: [number, number, number];
-    dimInner: number;
-    transposeA: boolean;
-    transposeB: boolean;
-    broadcastBatch: boolean;
-    tileInner: number;
-    uniforms?: string;
-    scale: boolean;
-    scaleA: boolean;
-    scaleB: boolean;
-    activation?: 'gelu' | 'relu2' | 'relu';
-    causalMask: boolean;
-    outputComponent?: number | undefined;
-    variableComponents?: number[];
-    outputIndexSnippet?: string;
-    outputStrideSnippet?: string;
-    constructor(batch: number, O1: number, O2: number, I1: number, I2: number, transposeA?: boolean, transposeB?: boolean);
-    private addUniform;
-    setOutputShape(shape: number[], perm?: number[]): void;
-    useScale(): void;
-    useScaleA(): void;
-    useScaleB(): void;
-    useActivation(activation: 'gelu' | 'relu2' | 'relu'): void;
-    useCausalMask(): void;
-    private activationSnippet;
-    private readASnippet;
-    private readBSnippet;
-    private baseIndexSnippets;
-    private offsetSnippets;
-    getUserCode(): string;
-}

package/dist/ops/webgpu/matMul16_program.js DELETED Viewed

@@ -1,343 +0,0 @@
-import { U as f } from "../../index-CUXkjxiT.js";
-import { e as p } from "../../webgpu_program-B4HmApL1.js";
-class B {
-  variableNames = ["A", "B"];
-  outputShape;
-  shaderKey = "MatMul16TB";
-  dispatchLayout;
-  dispatch;
-  workgroupSize = [8, 8, 1];
-  // 8x8 threads for 32x32 tile
-  dimInner;
-  transposeA = !1;
-  transposeB = !0;
-  broadcastBatch = !0;
-  tileInner = 32;
-  uniforms;
-  scale = !1;
-  scaleA = !1;
-  scaleB = !1;
-  activation;
-  causalMask = !1;
-  outputComponent;
-  variableComponents;
-  outputIndexSnippet;
-  outputStrideSnippet;
-  constructor(e, t, o, a, i, r = !1, s = !1) {
-    if (this.transposeA = r, this.transposeB = s, this.variableComponents = [2, 2], this.outputComponent = 2, this.shaderKey = `MatMul16TB_${t}_${o}_${a}_${i}_${r ? "TA" : ""}${s ? "TB" : ""}`, r) {
-      if (this.outputShape = [e, a, i / 2], this.dimInner = t, t !== o)
-        throw new Error("Inner dimensions of A and B must match for MatMul16 transposeA");
-    } else if (s) {
-      if (this.outputShape = [e, t, o / 2], this.dimInner = i, i !== a)
-        throw new Error("Inner dimensions of A and B must match for MatMul16 transposeB");
-    } else if (this.outputShape = [e, t, i / 2], this.dimInner = a, a !== o)
-      throw new Error("Inner dimensions of A and B must match for MatMul16");
-    if (this.dimInner % this.tileInner !== 0)
-      throw new Error(`Inner dimension ${this.dimInner} must be multiple of ${this.tileInner}`);
-    if (this.dispatchLayout = { x: [2], y: [1], z: [0] }, this.dispatch = [
-      Math.ceil(this.outputShape[2] / (this.workgroupSize[0] * 2)),
-      // 4 unpacked cols per thread = 2 packed cols
-      Math.ceil(this.outputShape[1] / (this.workgroupSize[1] * 4)),
-      // 4 rows per thread
-      this.outputShape[0]
-    ], i % 32 !== 0)
-      throw new Error("Head size must be even for MatMul16 transposeB");
-    if (a % 32 !== 0)
-      throw new Error("Head size must be even for MatMul16 transposeB");
-    if (t % 32 !== 0)
-      throw new Error("Sequence length must be multiple of 32 for MatMul16 transposeB");
-    if (o % 32 !== 0)
-      throw new Error("Sequence length must be multiple of 32 for MatMul16 transposeB");
-    this.outputIndexSnippet = "var idx0 = getOutputIndexFromCoords(vec3<i32>(batch, gRow, gColPacked));", this.outputStrideSnippet = "idx0 = idx0 + uniforms.outShapeStrides[1];  // Next row";
-  }
-  addUniform(e) {
-    this.uniforms ? this.uniforms += `, ${e}` : this.uniforms = e;
-  }
-  /* Note: this is done after constructor because it shouldn't affect dispatch */
-  setOutputShape(e, t) {
-    const o = f(e), a = f(this.outputShape);
-    if (o !== a)
-      throw new Error(`New shape size ${o} must match current size ${a}`);
-    function i(c, u) {
-      return [`${c} / ${u}`, `${c} % ${u}`];
-    }
-    const r = this.outputShape;
-    let s = [];
-    if (e.length === r.length + 1)
-      if (e[0] * e[1] === r[0])
-        s = [
-          ...i("batch", e[1]),
-          // batch / B2, batch % B2
-          "gRow",
-          "gColPacked"
-        ], this.shaderKey += `_batchSplit_${e[1]}`;
-      else if (e[e.length - 2] * e[e.length - 1] === r[r.length - 1])
-        s = [
-          "batch",
-          "gRow",
-          ...i("gColPacked", e[e.length - 1])
-          // gColPacked / N2, gColPacked % N2
-        ], this.shaderKey += `_colSplit_${e[e.length - 1]}`;
-      else
-        throw new Error("Unsupported output shape split");
-    else if (e.length === r.length)
-      s = ["batch", "gRow", "gColPacked"];
-    else if (e.length === 2 && r[0] === 1)
-      s = ["gRow", "gColPacked"], this.shaderKey += "_batchRemoved";
-    else
-      throw new Error(`Unsupported output shape rank change: ${r.length} -> ${e.length}}`);
-    let n = [];
-    if (t) {
-      if (t.length !== e.length)
-        throw new Error("Permutation length must match output rank");
-      n = t.map((c) => s[c]), this.shaderKey += `_perm_${t.join("")}`;
-    } else
-      n = s;
-    const l = n.findIndex((c) => c === "gRow"), h = `vec${e.length}<i32>(${n.join(", ")})`;
-    this.outputIndexSnippet = `var idx0: i32 = getOutputIndexFromCoords(${h});`, this.outputStrideSnippet = `idx0 = idx0 + uniforms.outShapeStrides${l === 0 ? "" : `[${l}]`}; `, t ? this.outputShape = t.map((c) => e[c]) : this.outputShape = e;
-  }
-  useScale() {
-    this.addUniform("scale: f32"), this.scale = !0, this.shaderKey += "_scaled";
-  }
-  useScaleA() {
-    this.addUniform("scaleA: f32"), this.scaleA = !0, this.shaderKey += "_scaledA";
-  }
-  useScaleB() {
-    this.addUniform("scaleB: f32"), this.scaleB = !0, this.shaderKey += "_scaledB";
-  }
-  useActivation(e) {
-    this.activation = e, this.shaderKey += `_${e}`;
-  }
-  useCausalMask() {
-    this.causalMask = !0, this.addUniform("pastLen: i32"), this.shaderKey += "_causalMask";
-  }
-  activationSnippet() {
-    return this.activation === "gelu" ? `
-                // TODO: revisit after https://github.com/gpuweb/gpuweb/issues/4458 is resolved
-                fn tanhComplete(x: vec4<f32>) -> vec4<f32> {
-                    return vec4<f32>(
-                        select(tanh(x.x), sign(x.x), abs(x.x) > 15.0f),
-                        select(tanh(x.y), sign(x.y), abs(x.y) > 15.0f),
-                        select(tanh(x.z), sign(x.z), abs(x.z) > 15.0f),
-                        select(tanh(x.w), sign(x.w), abs(x.w) > 15.0f),
-                    );
-                }
-                fn activation(x : vec4<f32>) -> vec4<f32> {
-                    let x3 = x * x * x;
-                    var inner = fma(vec4<f32>(${0.044715}f), x3, x);
-                    inner = ${0.7978845608028654}f * inner;
-                    inner = tanhComplete(inner);
-                    inner = 0.5f * (1.0f + inner);
-                    return x * inner;
-                }
-                ` : this.activation === "relu2" ? `
-                fn activation(x : vec4<f32>) -> vec4<f32> {
-                    let y = max(x, vec4<f32>(0.0));
-                    return y * y;
-                }
-                ` : this.activation === "relu" ? `
-                fn activation(x : vec4<f32>) -> vec4<f32> {
-                    return max(x, vec4<f32>(0.0));
-                }
-                ` : "";
-  }
-  /* Transpose when writing to shared memory */
-  readASnippet() {
-    const e = `
-            var col = i32(localId.x);
-            var row = i32(localId.y) * 4;
-            var packedA: vec2<i32> = A[offsetA + row * strideA + col];
-            var Arow1 = vec4<f32>(
-                unpack2x16float(u32(packedA.x)),
-                unpack2x16float(u32(packedA.y))
-            );
-            packedA = A[offsetA + (row + 1) * strideA + col];
-            var Arow2 = vec4<f32>(
-                unpack2x16float(u32(packedA.x)),
-                unpack2x16float(u32(packedA.y))
-            );
-            packedA = A[offsetA + (row + 2) * strideA + col];
-            var Arow3 = vec4<f32>(
-                unpack2x16float(u32(packedA.x)),
-                unpack2x16float(u32(packedA.y))
-            );
-            packedA = A[offsetA + (row + 3) * strideA + col];
-            var Arow4 = vec4<f32>(
-                unpack2x16float(u32(packedA.x)),
-                unpack2x16float(u32(packedA.y))
-            );
-            ${this.scaleA ? "Arow1 = Arow1 * uniforms.scaleA;" : ""}
-            ${this.scaleA ? "Arow2 = Arow2 * uniforms.scaleA;" : ""}
-            ${this.scaleA ? "Arow3 = Arow3 * uniforms.scaleA;" : ""}
-            ${this.scaleA ? "Arow4 = Arow4 * uniforms.scaleA;" : ""}
-        `;
-    return this.transposeA ? `{
-                ${e}
-                mm_Asub[row][col] = Arow1;
-                mm_Asub[row + 1][col] = Arow2;
-                mm_Asub[row + 2][col] = Arow3;
-                mm_Asub[row + 3][col] = Arow4;
-        }` : `{
-                ${e}
-                col = i32(localId.x) * 4;
-                row = i32(localId.y);
-                mm_Asub[col][row] = vec4<f32>(Arow1.x, Arow2.x, Arow3.x, Arow4.x);
-                mm_Asub[col + 1][row] = vec4<f32>(Arow1.y, Arow2.y, Arow3.y, Arow4.y);
-                mm_Asub[col + 2][row] = vec4<f32>(Arow1.z, Arow2.z, Arow3.z, Arow4.z);
-                mm_Asub[col + 3][row] = vec4<f32>(Arow1.w, Arow2.w, Arow3.w, Arow4.w);
-        }`;
-  }
-  /* Transpose when writing to shared memory */
-  readBSnippet() {
-    const e = `
-            var col = i32(localId.x);
-            var row = i32(localId.y) * 4;
-            var packedB: vec2<i32> = B[offsetB + row * strideB + col];
-            var Brow1 = vec4<f32>(
-                unpack2x16float(u32(packedB.x)),
-                unpack2x16float(u32(packedB.y))
-            );
-            packedB = B[offsetB + (row + 1) * strideB + col];
-            var Brow2 = vec4<f32>(
-                unpack2x16float(u32(packedB.x)),
-                unpack2x16float(u32(packedB.y))
-            );
-            packedB = B[offsetB + (row + 2) * strideB + col];
-            var Brow3 = vec4<f32>(
-                unpack2x16float(u32(packedB.x)),
-                unpack2x16float(u32(packedB.y))
-            );
-            packedB = B[offsetB + (row + 3) * strideB + col];
-            var Brow4 = vec4<f32>(
-                unpack2x16float(u32(packedB.x)),
-                unpack2x16float(u32(packedB.y))
-            );
-            ${this.scaleB ? "Brow1 = Brow1 * uniforms.scaleB;" : ""}
-            ${this.scaleB ? "Brow2 = Brow2 * uniforms.scaleB;" : ""}
-            ${this.scaleB ? "Brow3 = Brow3 * uniforms.scaleB;" : ""}
-            ${this.scaleB ? "Brow4 = Brow4 * uniforms.scaleB;" : ""}
-        `;
-    return this.transposeB ? `{
-                ${e}
-                col = i32(localId.x) * 4;
-                row = i32(localId.y);
-                mm_Bsub[col][row] = vec4<f32>(Brow1.x, Brow2.x, Brow3.x, Brow4.x);
-                mm_Bsub[col + 1][row] = vec4<f32>(Brow1.y, Brow2.y, Brow3.y, Brow4.y);
-                mm_Bsub[col + 2][row] = vec4<f32>(Brow1.z, Brow2.z, Brow3.z, Brow4.z);
-                mm_Bsub[col + 3][row] = vec4<f32>(Brow1.w, Brow2.w, Brow3.w, Brow4.w);
-            }` : `{
-                ${e}
-                mm_Bsub[row][col] = Brow1;
-                mm_Bsub[row + 1][col] = Brow2;
-                mm_Bsub[row + 2][col] = Brow3;
-                mm_Bsub[row + 3][col] = Brow4;
-            }`;
-  }
-  baseIndexSnippets() {
-    const e = `
-            let strideA = uniforms.aShape.z / 2;
-            let strideB = uniforms.bShape.z / 2;
-        `;
-    let t = "";
-    this.transposeB ? t = "let baseB = getIndexFromCoords3D(vec3<i32>(batchB, globalColStart, 0), vec3<i32>(uniforms.bShape.x, uniforms.bShape.y, strideB));" : t = "let baseB = getIndexFromCoords3D(vec3<i32>(batchB, 0, globalColStart / 4), vec3<i32>(uniforms.bShape.x, uniforms.bShape.y, strideB));";
-    let o = "";
-    return this.transposeA ? o = "let baseA = getIndexFromCoords3D(vec3<i32>(batchA, 0, globalRowStart / 4), vec3<i32>(uniforms.aShape.x, uniforms.aShape.y, strideA));" : o = "let baseA = getIndexFromCoords3D(vec3<i32>(batchA, globalRowStart, 0), vec3<i32>(uniforms.aShape.x, uniforms.aShape.y, strideA));", `
-            ${e}
-            ${o}
-            ${t}
-        `;
-  }
-  offsetSnippets() {
-    let e = "";
-    this.transposeA ? e = "let offsetA = baseA + kStart * strideA;" : e = "let offsetA = baseA + kStart / 4;";
-    let t = "";
-    return this.transposeB ? t = "let offsetB = baseB + kStart / 4;" : t = "let offsetB = baseB + kStart * strideB;", `
-            ${e}
-            ${t}
-        `;
-  }
-  getUserCode() {
-    const e = this.transposeA, t = this.tileInner, o = this.workgroupSize[1] * 4, a = this.workgroupSize[0] * 4, i = e ? o : t, r = e ? t : o, s = this.dimInner, n = Math.ceil(s / t);
-    return `
-            var<workgroup> mm_Asub : array<array<vec4<f32>, ${i / 4 + (this.transposeA ? 0 : 1)}>, ${r}>;
-            var<workgroup> mm_Bsub : array<array<vec4<f32>, ${a / 4 + (this.transposeB ? 1 : 0)}>, ${t}>;
-            ${this.activation ? this.activationSnippet() : ""}
-            ${p()} {
-                let batch = i32(globalId.z);
-                let batchA = ${this.broadcastBatch ? "batch % uniforms.aShape[0]" : "batch"};
-                let batchB = ${this.broadcastBatch ? "batch % uniforms.bShape[0]" : "batch"};
-                var kStart = 0;
-                let localRow = i32(localId.y);
-                let localCol = i32(localId.x);
-                let globalRowStart = i32(workgroupId.y) * ${o};
-                let globalColStart = i32(workgroupId.x) * ${a};
-                // 4 rows x 4 cols accumulator
-                // acc[i] holds row i (4 cols)
-                var acc = array<vec4<f32>, 4>(
-                    vec4<f32>(0.0), vec4<f32>(0.0), vec4<f32>(0.0), vec4<f32>(0.0)
-                );
-                ${this.baseIndexSnippets()}
-                for (var t = 0; t < ${n}; t++) {
-                    ${this.offsetSnippets()}
-                    ${this.readASnippet()}
-                    ${this.readBSnippet()}
-                    kStart = kStart + ${t};
-                    workgroupBarrier();
-                    for (var k = 0; k < ${t}; k++) {
-                        // Load 4 columns of B as a vec4
-                        let bVec = mm_Bsub[k][localCol];
-                        let aVec = mm_Asub[k][localRow];
-                        // Compute 4 rows
-                        for (var r = 0; r < 4; r = r + 1) {
-                            acc[r] = fma(vec4<f32>(aVec[r]), bVec, acc[r]);
-                        }
-                    }
-                    workgroupBarrier();
-                }
-                // Write out 4 rows x 2 packed cols (4 unpacked cols)
-                let gRow = globalRowStart + localRow * 4;
-                let gColPacked = i32(workgroupId.x) * ${this.workgroupSize[0] * 2} + localCol * 2;
-                ${this.outputIndexSnippet}
-                for (var i = 0; i < 4; i = i + 1) {
-                    ${this.causalMask ? `
-                    // Causal Masking: mask if col > row + pastLen
-                    let r = gRow + i;
-                    let cBase = gColPacked * 2;
-                    let cVec = vec4<i32>(cBase, cBase + 1, cBase + 2, cBase + 3);
-                    let mask = cVec > vec4<i32>(r + uniforms.pastLen);
-                    acc[i] = select(acc[i], vec4<f32>(-uniforms.INFINITY), mask);
-                    ` : ""}
-                    ${this.activation ? "acc[i] = activation(acc[i]);" : ""}
-                    ${this.scale ? "acc[i] = acc[i] * uniforms.scale;" : ""}
-                    result[idx0 / 2] = vec2<i32>(
-                        i32(pack2x16float(acc[i].xy)),
-                        i32(pack2x16float(acc[i].zw))
-                    );
-                    ${this.outputStrideSnippet}
-                }
-            }
-        `;
-  }
-}
-export {
-  B as default
-};

package/dist/ops/webgpu/mul16.d.ts DELETED Viewed

	@@ -1 +0,0 @@
1	- export {};

package/dist/ops/webgpu/mul16.js DELETED Viewed

@@ -1,13 +0,0 @@
-import { c as t } from "../../index-CUXkjxiT.js";
-import { BinaryOpScalarProgram as s, BinaryOpProgram as c } from "./utils/binary_op.js";
-import { B as a } from "../../binary_op_util-pKXltfxI.js";
-function m(n) {
-  const { a: e, b: r } = n.inputs, o = n.backend, p = r.shape.length === 0 ? new s(a.MUL, e.shape) : new c(a.MUL, e.shape, r.shape);
-  return o.runWebGPUProgram(p, [e, r], "packedF16");
-}
-const i = {
-  kernelName: "Mul16",
-  backendName: "webgpu",
-  kernelFunc: m
-};
-t(i);

package/dist/ops/webgpu/norm2.d.ts DELETED Viewed

	@@ -1 +0,0 @@
1	- export {};

package/dist/ops/webgpu/norm2.js DELETED Viewed

@@ -1,76 +0,0 @@
-import { reduce as g, ReduceProgram as h } from "./utils/reductions.js";
-import { c as w, U as S } from "../../index-CUXkjxiT.js";
-import k from "./utils/deviceInfo.js";
-class v extends h {
-  shaderKey = "norm2";
-  atomic = !0;
-  utilityFunctions = `
-        fn atomicAddF32(sum: ptr<storage, atomic<i32>, read_write>, value: f32) -> f32 {
-            var old = atomicLoad(sum);
-            loop {
-                let new_value = value + bitcast<f32>(old);
-                let exchange_result = atomicCompareExchangeWeak(sum, old, bitcast<i32>(new_value));
-                if (exchange_result.exchanged) {
-                    return new_value;
-                }
-                old = exchange_result.old_value;
-            }
-        }
-    `;
-  constructor(o, r, i) {
-    super(
-      o,
-      r,
-      {
-        reductionOp: "sum",
-        elementwise: !1,
-        forceWorkgroupSize: i
-      },
-      !1
-    ), this.uniforms += "lossScaling: f32, index: i32";
-  }
-  getPreprocessSnippet() {
-    return `
-            candidate = candidate * uniforms.lossScaling;
-            candidate = candidate * candidate;
-        `;
-  }
-  getWriteSnippet() {
-    return `
-            if (tid == 0) {
-                atomicAddF32(&result[uniforms.index], bestValue);
-            }
-        `;
-  }
-}
-function x(t) {
-  const { x: o, output: r } = t.inputs, { invLossScaling: i, index: c } = t.attrs, n = t.backend, u = [], d = k(n);
-  let e = Math.min(512, n.device.limits.maxComputeWorkgroupSizeX);
-  const a = 4, s = S(o.shape);
-  for (; s % (e * a) !== 0 && e > 1; )
-    e /= 2;
-  if (e === 1)
-    throw new Error(`Cannot find suitable workgroup size for Norm2Program with reduce size ${s}`);
-  const l = {
-    inSize: e * a,
-    outSize: 1,
-    batchSize: s / (e * a),
-    windowSize: e
-  }, m = new v(d, l, e), p = g(
-    m,
-    [o],
-    n,
-    [
-      { type: "float32", data: [i] },
-      { type: "int32", data: [c] }
-    ],
-    r
-  );
-  return u.forEach((f) => f.dispose()), p;
-}
-const z = {
-  kernelName: "Norm2",
-  backendName: "webgpu",
-  kernelFunc: x
-};
-w(z);

package/dist/ops/webgpu/normRMS.d.ts DELETED Viewed

	@@ -1 +0,0 @@
1	- export {};

package/dist/ops/webgpu/normRMS.js DELETED Viewed

@@ -1,34 +0,0 @@
-import { c as k, a6 as N } from "../../index-CUXkjxiT.js";
-import { createReduceInfo as w, reduce as S } from "./utils/reductions.js";
-import { isPackedTensor as d } from "../../utilities/packed.js";
-import { p as f } from "../../pack16-bqltoUlR.js";
-import b from "./normRMS16_program.js";
-import z from "./normRMS32_program.js";
-import G from "./utils/deviceInfo.js";
-function u(t) {
-  const { x: e, gamma: o } = t.inputs, m = t.backend, c = G(m), p = d(e), i = o ? d(o) : !1, n = p || i, r = !n || n ? e : f(e), a = !n || !o ? o : f(o), h = a ? [r, a] : [r], s = w(h, -1), l = n ? new b(c, s, !!o) : new z(c, s, !!o);
-  if (a && N(a.shape, [r.shape[r.shape.length - 1]], "Error in RMSNorm: "), e.shape.length !== 3)
-    throw new Error(`rmsNormGPU: input rank ${e.shape.length} not supported, only rank 3 is supported`);
-  if (s.inSize !== r.shape[r.shape.length - 1])
-    throw new Error(
-      `rmsNormGPU: reduction size ${s.inSize} does not match expected size ${r.shape[r.shape.length - 1]}`
-    );
-  if (s.batchSize !== e.shape[0] * e.shape[1])
-    throw new Error(
-      `rmsNormGPU: batch size ${s.batchSize} does not match expected size ${e.shape[0] * e.shape[1]}`
-    );
-  const g = S(l, h, m);
-  return n && !p && r.dispose(), n && !i && a && a.dispose(), g;
-}
-const P = {
-  kernelName: "RMSNorm",
-  backendName: "webgpu",
-  kernelFunc: u
-};
-k(P);
-const M = {
-  kernelName: "RMSNormNoGamma",
-  backendName: "webgpu",
-  kernelFunc: u
-};
-k(M);

package/dist/ops/webgpu/normRMS16_program.d.ts DELETED Viewed

@@ -1,10 +0,0 @@
-import { backend_util } from '@tensorflow/tfjs-core';
-import { ReduceProgram } from './utils/reductions';
-import { DeviceInformation } from './utils/deviceInfo';
-export default class RMSProgram16 extends ReduceProgram {
-    private hasGamma;
-    constructor(deviceInfo: DeviceInformation, reduceInfo: backend_util.ReduceInfo, hasGamma?: boolean);
-    getPreprocessSnippet(): string;
-    getPostprocessSnippet(): string;
-    getWriteSnippet(): string;
-}

package/dist/ops/webgpu/normRMS16_program.js DELETED Viewed

@@ -1,25 +0,0 @@
-import { ReduceProgram as s } from "./utils/reductions.js";
-class i extends s {
-  hasGamma;
-  constructor(a, t, e = !1) {
-    super(a, t, { reductionOp: "mean", elementwise: !0 }, !0), this.shaderKey = "RMSNorm16", e && this.variableNames.push("gamma"), this.variableComponents = [1, 1], this.hasGamma = e;
-  }
-  getPreprocessSnippet() {
-    return "candidate = candidate * candidate;";
-  }
-  getPostprocessSnippet() {
-    return "bestValue = inverseSqrt(bestValue + 1e-8);";
-  }
-  getWriteSnippet() {
-    return `
-            let X = unpack2x16float(u32(x[offset + k]));
-            ${this.hasGamma ? "let gamma = unpack2x16float(u32(gamma[k]));" : ""}
-            let normalized = X * bestValue;
-            let outVal = normalized ${this.hasGamma ? " * gamma" : ""};
-            result[offset + k] = i32(pack2x16float(outVal));
-        `;
-  }
-}
-export {
-  i as default
-};

package/dist/ops/webgpu/normRMS32_program.d.ts DELETED Viewed

@@ -1,10 +0,0 @@
-import { backend_util } from '@tensorflow/tfjs-core';
-import { ReduceProgram } from './utils/reductions';
-import { DeviceInformation } from './utils/deviceInfo';
-export default class RMSProgram32 extends ReduceProgram {
-    private hasGamma;
-    constructor(deviceInfo: DeviceInformation, reduceInfo: backend_util.ReduceInfo, hasGamma?: boolean);
-    protected getPreprocessSnippet(): string;
-    protected getPostprocessSnippet(): string;
-    protected getWriteSnippet(): string;
-}

package/dist/ops/webgpu/normRMS32_program.js DELETED Viewed

@@ -1,25 +0,0 @@
-import { ReduceProgram as s } from "./utils/reductions.js";
-class i extends s {
-  hasGamma;
-  constructor(a, t, e = !1) {
-    super(a, t, { reductionOp: "mean", elementwise: !0 }, !1), this.shaderKey = "RMSNorm32", e && this.variableNames.push("gamma"), this.variableComponents = [1, 1], this.hasGamma = e;
-  }
-  getPreprocessSnippet() {
-    return "candidate = candidate * candidate;";
-  }
-  getPostprocessSnippet() {
-    return "bestValue = inverseSqrt(bestValue + 1e-8);";
-  }
-  getWriteSnippet() {
-    return `
-            let X = f32(x[offset + k]);
-            ${this.hasGamma ? "let gamma = gamma[k];" : ""}
-            let normalized = X * bestValue;
-            let outVal = normalized ${this.hasGamma ? " * gamma" : ""};
-            result[offset + k] = f32(outVal);
-        `;
-  }
-}
-export {
-  i as default
-};

package/dist/ops/webgpu/normRMSGrad.d.ts DELETED Viewed

	@@ -1 +0,0 @@
1	- export {};