npm - @genai-fi/nanogpt - Versions diffs - 0.20.0 → 0.20.2 - Mend

@genai-fi/nanogpt 0.20.0 → 0.20.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (433) hide show

package/dist/BaseTokeniser-DSg9zcYq.js +221 -0
package/dist/DatasetBuilder-DgURD85T.js +712 -0
package/dist/Generator.d.ts +82 -0
package/dist/Generator.js +2 -0
package/dist/RealDiv-DBu0FQqT.js +362 -0
package/dist/Reshape-CABOPB9d.js +94 -0
package/dist/Reshape-DqO3r8BC.js +17 -0
package/dist/TeachableLLM.d.ts +70 -0
package/dist/TeachableLLM.js +2 -0
package/dist/Trainer.d.ts +43 -0
package/dist/Trainer.js +2 -0
package/dist/backend.d.ts +2 -0
package/dist/backend.js +13 -0
package/dist/backend_util-Cg-roD1p.js +399 -0
package/dist/binary_op_util-CrYk9LXL.js +103 -0
package/dist/checks/appendCache.d.ts +1 -0
package/dist/checks/appendCache.js +55 -0
package/dist/checks/attentionMask.d.ts +1 -0
package/dist/checks/attentionMask.js +56 -0
package/dist/checks/check.d.ts +9 -0
package/dist/checks/check.js +32 -0
package/dist/checks/gelu.d.ts +1 -0
package/dist/checks/gelu.js +46 -0
package/dist/checks/index.d.ts +26 -0
package/dist/checks/index.js +28 -0
package/dist/checks/matMulGelu.d.ts +1 -0
package/dist/checks/matMulGelu.js +84 -0
package/dist/checks/normRMS.d.ts +1 -0
package/dist/checks/normRMS.js +28 -0
package/dist/checks/normRMSGrad.d.ts +1 -0
package/dist/checks/normRMSGrad.js +22 -0
package/dist/checks/packUnpack.d.ts +1 -0
package/dist/checks/packUnpack.js +46 -0
package/dist/checks/qkv.d.ts +1 -0
package/dist/checks/qkv.js +34 -0
package/dist/checks/rope.d.ts +1 -0
package/dist/checks/rope.js +30 -0
package/dist/checks/weights.d.ts +14 -0
package/dist/checks/weights.js +27 -0
package/dist/chunk-BPntVaq0.js +23 -0
package/dist/complex_util-CkazZsaH.js +60 -0
package/dist/concat_util-CWDZCBlA.js +19 -0
package/dist/data/docx.d.ts +2 -0
package/dist/data/docx.js +3046 -0
package/dist/data/pdf.d.ts +2 -0
package/dist/data/pdf.js +17 -0
package/dist/data/textLoader.d.ts +7 -0
package/dist/data/textLoader.js +613 -0
package/dist/dist-BewPQWjc.js +7572 -0
package/dist/dist-DVmq73nz.js +8775 -0
package/dist/dist-DXwIvKxl.js +896 -0
package/dist/dist-VEU5mfO0.js +7545 -0
package/dist/gelu-Bf1HW1RY.js +27 -0
package/dist/gpgpu_math-DvLcCH6u.js +1612 -0
package/dist/inference/types.d.ts +16 -0
package/dist/inference/types.js +0 -0
package/dist/kernel_funcs_utils-HiXOOx3f.js +229 -0
package/dist/layers/BaseLayer.d.ts +44 -0
package/dist/layers/BaseLayer.js +76 -0
package/dist/layers/CausalSelfAttention.d.ts +39 -0
package/dist/layers/CausalSelfAttention.js +99 -0
package/dist/layers/LoRA.d.ts +14 -0
package/dist/layers/LoRA.js +48 -0
package/dist/layers/MLP.d.ts +17 -0
package/dist/layers/MLP.js +34 -0
package/dist/layers/PositionEmbedding.d.ts +8 -0
package/dist/layers/PositionEmbedding.js +27 -0
package/dist/layers/RMSNorm.d.ts +12 -0
package/dist/layers/RMSNorm.js +20 -0
package/dist/layers/RoPECache.d.ts +18 -0
package/dist/layers/RoPECache.js +337 -0
package/dist/layers/TiedEmbedding.d.ts +13 -0
package/dist/layers/TiedEmbedding.js +32 -0
package/dist/layers/TransformerBlock.d.ts +27 -0
package/dist/layers/TransformerBlock.js +51 -0
package/dist/layers/WeightStore.d.ts +20 -0
package/dist/layers/WeightStore.js +69 -0
package/dist/loader/load.d.ts +6 -0
package/dist/loader/load.js +2 -0
package/dist/loader/loadHF.d.ts +8 -0
package/dist/loader/loadHF.js +2 -0
package/dist/loader/loadTransformers.d.ts +4 -0
package/dist/loader/loadTransformers.js +2 -0
package/dist/loader/loadZipMeta.d.ts +3 -0
package/dist/loader/loadZipMeta.js +16 -0
package/dist/loader/newZipLoad.d.ts +3 -0
package/dist/loader/newZipLoad.js +2 -0
package/dist/loader/oldZipLoad.d.ts +9 -0
package/dist/loader/oldZipLoad.js +2 -0
package/dist/loader/save.d.ts +16 -0
package/dist/loader/save.js +2 -0
package/dist/loader/types.d.ts +68 -0
package/dist/loader/types.js +0 -0
package/dist/main-D5CbfCiV.js +13500 -0
package/dist/main.d.ts +50 -0
package/dist/main.js +16 -0
package/dist/matMul16-BNfZSnNM.js +81 -0
package/dist/matMulGelu-CPTntosE.js +162 -0
package/dist/models/NanoGPTV1.d.ts +16 -0
package/dist/models/NanoGPTV1.js +2 -0
package/dist/models/NanoGPTV2.d.ts +16 -0
package/dist/models/NanoGPTV2.js +2 -0
package/dist/models/config.d.ts +27 -0
package/dist/models/config.js +37 -0
package/dist/models/factory.d.ts +3 -0
package/dist/models/factory.js +2 -0
package/dist/models/model.d.ts +44 -0
package/dist/models/model.js +2 -0
package/dist/ops/adamAdjust.d.ts +2 -0
package/dist/ops/adamAdjust.js +18 -0
package/dist/ops/adamMoments.d.ts +2 -0
package/dist/ops/adamMoments.js +16 -0
package/dist/ops/add16.d.ts +2 -0
package/dist/ops/add16.js +12 -0
package/dist/ops/appendCache.d.ts +2 -0
package/dist/ops/appendCache.js +25 -0
package/dist/ops/attentionMask.d.ts +2 -0
package/dist/ops/attentionMask.js +16 -0
package/dist/ops/concat16.d.ts +2 -0
package/dist/ops/concat16.js +8 -0
package/dist/ops/cpu/adamAdjust.d.ts +1 -0
package/dist/ops/cpu/adamAdjust.js +16 -0
package/dist/ops/cpu/adamMoments.d.ts +1 -0
package/dist/ops/cpu/adamMoments.js +16 -0
package/dist/ops/cpu/appendCache.d.ts +1 -0
package/dist/ops/cpu/appendCache.js +65 -0
package/dist/ops/cpu/attentionMask.d.ts +1 -0
package/dist/ops/cpu/attentionMask.js +16 -0
package/dist/ops/cpu/fusedSoftmax.d.ts +9 -0
package/dist/ops/cpu/fusedSoftmax.js +22 -0
package/dist/ops/cpu/gatherSub.d.ts +1 -0
package/dist/ops/cpu/gatherSub.js +12 -0
package/dist/ops/cpu/gelu.d.ts +1 -0
package/dist/ops/cpu/gelu.js +36 -0
package/dist/ops/cpu/matMul16.d.ts +1 -0
package/dist/ops/cpu/matMul16.js +14 -0
package/dist/ops/cpu/matMulGelu.d.ts +1 -0
package/dist/ops/cpu/matMulGelu.js +41 -0
package/dist/ops/cpu/matMulMul.d.ts +1 -0
package/dist/ops/cpu/matMulMul.js +20 -0
package/dist/ops/cpu/mulDropout.d.ts +1 -0
package/dist/ops/cpu/mulDropout.js +20 -0
package/dist/ops/cpu/normRMS.d.ts +1 -0
package/dist/ops/cpu/normRMS.js +35 -0
package/dist/ops/cpu/qkv.d.ts +5 -0
package/dist/ops/cpu/qkv.js +73 -0
package/dist/ops/cpu/rope.d.ts +6 -0
package/dist/ops/cpu/rope.js +81 -0
package/dist/ops/cpu/scatterSub.d.ts +1 -0
package/dist/ops/cpu/scatterSub.js +12 -0
package/dist/ops/dot16.d.ts +2 -0
package/dist/ops/dot16.js +29 -0
package/dist/ops/dropout.d.ts +2 -0
package/dist/ops/dropout.js +11 -0
package/dist/ops/dropout16.d.ts +2 -0
package/dist/ops/dropout16.js +22 -0
package/dist/ops/gatherSub.d.ts +2 -0
package/dist/ops/gatherSub.js +13 -0
package/dist/ops/gelu.d.ts +3 -0
package/dist/ops/gelu.js +2 -0
package/dist/ops/globalNorm.d.ts +2 -0
package/dist/ops/globalNorm.js +19 -0
package/dist/ops/grads/add16.d.ts +1 -0
package/dist/ops/grads/add16.js +27 -0
package/dist/ops/grads/attentionMask.d.ts +1 -0
package/dist/ops/grads/attentionMask.js +26 -0
package/dist/ops/grads/dropout16.d.ts +1 -0
package/dist/ops/grads/dropout16.js +1 -0
package/dist/ops/grads/gelu.d.ts +2 -0
package/dist/ops/grads/gelu.js +2 -0
package/dist/ops/grads/matMul16.d.ts +2 -0
package/dist/ops/grads/matMul16.js +2 -0
package/dist/ops/grads/matMulGelu.d.ts +1 -0
package/dist/ops/grads/matMulGelu.js +22 -0
package/dist/ops/grads/mul16.d.ts +1 -0
package/dist/ops/grads/mul16.js +1 -0
package/dist/ops/grads/normRMS.d.ts +3 -0
package/dist/ops/grads/normRMS.js +37 -0
package/dist/ops/grads/pack16.d.ts +2 -0
package/dist/ops/grads/pack16.js +2 -0
package/dist/ops/grads/qkv.d.ts +3 -0
package/dist/ops/grads/qkv.js +46 -0
package/dist/ops/grads/rope.d.ts +2 -0
package/dist/ops/grads/rope.js +2 -0
package/dist/ops/grads/softmax16.d.ts +2 -0
package/dist/ops/grads/softmax16.js +23 -0
package/dist/ops/grads/unpack16.d.ts +2 -0
package/dist/ops/grads/unpack16.js +2 -0
package/dist/ops/grads/utils.d.ts +4 -0
package/dist/ops/grads/utils.js +12 -0
package/dist/ops/log.d.ts +0 -0
package/dist/ops/log.js +1 -0
package/dist/ops/matMul16.d.ts +15 -0
package/dist/ops/matMul16.js +2 -0
package/dist/ops/matMulGelu.d.ts +3 -0
package/dist/ops/matMulGelu.js +20 -0
package/dist/ops/matMulMul.d.ts +2 -0
package/dist/ops/matMulMul.js +16 -0
package/dist/ops/mul16.d.ts +2 -0
package/dist/ops/mul16.js +43 -0
package/dist/ops/mulDrop.d.ts +2 -0
package/dist/ops/mulDrop.js +15 -0
package/dist/ops/normRMS.d.ts +2 -0
package/dist/ops/normRMS.js +22 -0
package/dist/ops/pack16.d.ts +2 -0
package/dist/ops/pack16.js +2 -0
package/dist/ops/qkv.d.ts +2 -0
package/dist/ops/qkv.js +16 -0
package/dist/ops/reshape16.d.ts +2 -0
package/dist/ops/reshape16.js +33 -0
package/dist/ops/rope.d.ts +3 -0
package/dist/ops/rope.js +2 -0
package/dist/ops/scatterSub.d.ts +2 -0
package/dist/ops/scatterSub.js +13 -0
package/dist/ops/slice16.d.ts +2 -0
package/dist/ops/slice16.js +11 -0
package/dist/ops/softmax16.d.ts +2 -0
package/dist/ops/softmax16.js +9 -0
package/dist/ops/sub16.d.ts +2 -0
package/dist/ops/sub16.js +11 -0
package/dist/ops/sum16.d.ts +2 -0
package/dist/ops/sum16.js +13 -0
package/dist/ops/transpose16.d.ts +3 -0
package/dist/ops/transpose16.js +32 -0
package/dist/ops/unpack16.d.ts +2 -0
package/dist/ops/unpack16.js +2 -0
package/dist/ops/webgl/adamAdjust.d.ts +1 -0
package/dist/ops/webgl/adamAdjust.js +82 -0
package/dist/ops/webgl/adamMoments.d.ts +1 -0
package/dist/ops/webgl/adamMoments.js +44 -0
package/dist/ops/webgl/appendCache.d.ts +1 -0
package/dist/ops/webgl/appendCache.js +53 -0
package/dist/ops/webgl/attentionMask.d.ts +1 -0
package/dist/ops/webgl/attentionMask.js +64 -0
package/dist/ops/webgl/dropout16.d.ts +1 -0
package/dist/ops/webgl/dropout16.js +12 -0
package/dist/ops/webgl/fusedSoftmax.d.ts +11 -0
package/dist/ops/webgl/fusedSoftmax.js +70 -0
package/dist/ops/webgl/gatherSub.d.ts +1 -0
package/dist/ops/webgl/gatherSub.js +28 -0
package/dist/ops/webgl/gelu.d.ts +2 -0
package/dist/ops/webgl/gelu.js +48 -0
package/dist/ops/webgl/log.d.ts +17 -0
package/dist/ops/webgl/log.js +14 -0
package/dist/ops/webgl/matMul16.d.ts +1 -0
package/dist/ops/webgl/matMul16.js +37 -0
package/dist/ops/webgl/matMulGelu.d.ts +21 -0
package/dist/ops/webgl/matMulGelu.js +2 -0
package/dist/ops/webgl/matMulMul.d.ts +14 -0
package/dist/ops/webgl/matMulMul.js +24 -0
package/dist/ops/webgl/mulDropout.d.ts +1 -0
package/dist/ops/webgl/mulDropout.js +32 -0
package/dist/ops/webgl/normRMS.d.ts +1 -0
package/dist/ops/webgl/normRMS.js +114 -0
package/dist/ops/webgl/qkv.d.ts +1 -0
package/dist/ops/webgl/qkv.js +54 -0
package/dist/ops/webgl/rope.d.ts +1 -0
package/dist/ops/webgl/rope.js +72 -0
package/dist/ops/webgl/scatterSub.d.ts +1 -0
package/dist/ops/webgl/scatterSub.js +28 -0
package/dist/ops/webgpu/adamAdjust.d.ts +1 -0
package/dist/ops/webgpu/adamAdjust.js +77 -0
package/dist/ops/webgpu/adamMoments.d.ts +1 -0
package/dist/ops/webgpu/adamMoments.js +76 -0
package/dist/ops/webgpu/add16.d.ts +1 -0
package/dist/ops/webgpu/add16.js +14 -0
package/dist/ops/webgpu/appendCache.d.ts +1 -0
package/dist/ops/webgpu/appendCache.js +130 -0
package/dist/ops/webgpu/attentionMask.d.ts +1 -0
package/dist/ops/webgpu/attentionMask.js +42 -0
package/dist/ops/webgpu/attentionMask32_program.d.ts +19 -0
package/dist/ops/webgpu/attentionMask32_program.js +62 -0
package/dist/ops/webgpu/clipScale.d.ts +1 -0
package/dist/ops/webgpu/clipScale.js +45 -0
package/dist/ops/webgpu/concat16.d.ts +19 -0
package/dist/ops/webgpu/concat16.js +111 -0
package/dist/ops/webgpu/dropout16.d.ts +1 -0
package/dist/ops/webgpu/dropout16.js +59 -0
package/dist/ops/webgpu/gatherSub.d.ts +1 -0
package/dist/ops/webgpu/gatherSub.js +52 -0
package/dist/ops/webgpu/gelu.d.ts +14 -0
package/dist/ops/webgpu/gelu.js +147 -0
package/dist/ops/webgpu/index.d.ts +0 -0
package/dist/ops/webgpu/index.js +26 -0
package/dist/ops/webgpu/matMul16.d.ts +1 -0
package/dist/ops/webgpu/matMul16.js +70 -0
package/dist/ops/webgpu/matMul16_program.d.ts +42 -0
package/dist/ops/webgpu/matMul16_program.js +303 -0
package/dist/ops/webgpu/mul16.d.ts +1 -0
package/dist/ops/webgpu/mul16.js +14 -0
package/dist/ops/webgpu/norm2.d.ts +1 -0
package/dist/ops/webgpu/norm2.js +46 -0
package/dist/ops/webgpu/normRMS.d.ts +1 -0
package/dist/ops/webgpu/normRMS.js +26 -0
package/dist/ops/webgpu/normRMS16_program.d.ts +10 -0
package/dist/ops/webgpu/normRMS16_program.js +28 -0
package/dist/ops/webgpu/normRMS32_program.d.ts +10 -0
package/dist/ops/webgpu/normRMS32_program.js +28 -0
package/dist/ops/webgpu/normRMSGrad.d.ts +1 -0
package/dist/ops/webgpu/normRMSGrad.js +225 -0
package/dist/ops/webgpu/pack16.d.ts +1 -0
package/dist/ops/webgpu/pack16.js +21 -0
package/dist/ops/webgpu/pack16_program.d.ts +19 -0
package/dist/ops/webgpu/pack16_program.js +93 -0
package/dist/ops/webgpu/qkv.d.ts +1 -0
package/dist/ops/webgpu/qkv.js +64 -0
package/dist/ops/webgpu/rope.d.ts +1 -0
package/dist/ops/webgpu/rope.js +163 -0
package/dist/ops/webgpu/scatterSub.d.ts +1 -0
package/dist/ops/webgpu/scatterSub.js +53 -0
package/dist/ops/webgpu/slice16.d.ts +7 -0
package/dist/ops/webgpu/slice16.js +74 -0
package/dist/ops/webgpu/softmax16.d.ts +17 -0
package/dist/ops/webgpu/softmax16.js +18 -0
package/dist/ops/webgpu/softmax16_program.d.ts +13 -0
package/dist/ops/webgpu/softmax16_program.js +89 -0
package/dist/ops/webgpu/softmax16_subgroup_program.d.ts +17 -0
package/dist/ops/webgpu/softmax16_subgroup_program.js +70 -0
package/dist/ops/webgpu/softmax16grad.d.ts +1 -0
package/dist/ops/webgpu/softmax16grad.js +31 -0
package/dist/ops/webgpu/sub16.d.ts +1 -0
package/dist/ops/webgpu/sub16.js +14 -0
package/dist/ops/webgpu/sum16.d.ts +1 -0
package/dist/ops/webgpu/sum16.js +29 -0
package/dist/ops/webgpu/transpose16.d.ts +1 -0
package/dist/ops/webgpu/transpose16.js +37 -0
package/dist/ops/webgpu/transpose16_program.d.ts +16 -0
package/dist/ops/webgpu/transpose16_program.js +51 -0
package/dist/ops/webgpu/transpose16_shared_program.d.ts +15 -0
package/dist/ops/webgpu/transpose16_shared_program.js +79 -0
package/dist/ops/webgpu/unpack16.d.ts +1 -0
package/dist/ops/webgpu/unpack16.js +60 -0
package/dist/ops/webgpu/utils/binary_op.d.ts +35 -0
package/dist/ops/webgpu/utils/binary_op.js +141 -0
package/dist/ops/webgpu/utils/deviceInfo.d.ts +7 -0
package/dist/ops/webgpu/utils/deviceInfo.js +11 -0
package/dist/ops/webgpu/utils/reductions.d.ts +43 -0
package/dist/ops/webgpu/utils/reductions.js +263 -0
package/dist/pack16-Ck-spx_F.js +39 -0
package/dist/patches/webgpu_backend.d.ts +18 -0
package/dist/patches/webgpu_backend.js +43 -0
package/dist/patches/webgpu_base.d.ts +21 -0
package/dist/patches/webgpu_base.js +22 -0
package/dist/patches/webgpu_program.d.ts +36 -0
package/dist/patches/webgpu_program.js +293 -0
package/dist/pdf-UoDqCYzz.js +16726 -0
package/dist/picomatch-3tUnMMbd.js +1063 -0
package/dist/rope-CbeGlsV8.js +25 -0
package/dist/selu_util-zkAx5doH.js +24 -0
package/dist/shared-D1coEFea.js +1314 -0
package/dist/shared-DOgWaqvL.js +5 -0
package/dist/slice_util-Dgb3ANWI.js +208 -0
package/dist/tfjs_backend-BjuQ5FqB.js +614 -0
package/dist/tokeniser/BaseTokeniser.d.ts +33 -0
package/dist/tokeniser/BaseTokeniser.js +2 -0
package/dist/tokeniser/CharTokeniser.d.ts +24 -0
package/dist/tokeniser/CharTokeniser.js +92 -0
package/dist/tokeniser/bpe.d.ts +28 -0
package/dist/tokeniser/bpe.js +170 -0
package/dist/tokeniser/messages.d.ts +61 -0
package/dist/tokeniser/messages.js +0 -0
package/dist/tokeniser/type.d.ts +34 -0
package/dist/tokeniser/type.js +0 -0
package/dist/training/AdamW.d.ts +36 -0
package/dist/training/AdamW.js +128 -0
package/dist/training/BasicTrainer.d.ts +63 -0
package/dist/training/BasicTrainer.js +265 -0
package/dist/training/DatasetBuilder.d.ts +26 -0
package/dist/training/DatasetBuilder.js +2 -0
package/dist/training/Evaluator.d.ts +19 -0
package/dist/training/Evaluator.js +48 -0
package/dist/training/LRScheduler.d.ts +12 -0
package/dist/training/LRScheduler.js +38 -0
package/dist/training/PreTrainer.d.ts +11 -0
package/dist/training/PreTrainer.js +22 -0
package/dist/training/SFTTrainer.d.ts +12 -0
package/dist/training/SFTTrainer.js +24 -0
package/dist/training/loss.d.ts +3 -0
package/dist/training/loss.js +19 -0
package/dist/training/orthoGrad.d.ts +2 -0
package/dist/training/orthoGrad.js +10 -0
package/dist/training/sparseCrossEntropy.d.ts +7 -0
package/dist/training/sparseCrossEntropy.js +47 -0
package/dist/training/tasks/ConversationTask.d.ts +18 -0
package/dist/training/tasks/ConversationTask.js +38 -0
package/dist/training/tasks/PretrainingTask.d.ts +17 -0
package/dist/training/tasks/PretrainingTask.js +42 -0
package/dist/training/tasks/StartSentenceTask.d.ts +18 -0
package/dist/training/tasks/StartSentenceTask.js +45 -0
package/dist/training/tasks/Task.d.ts +22 -0
package/dist/training/tasks/Task.js +55 -0
package/dist/training/tasks/splitter.d.ts +5 -0
package/dist/training/tasks/splitter.js +18 -0
package/dist/training/types.d.ts +78 -0
package/dist/training/types.js +0 -0
package/dist/training/validation.d.ts +17 -0
package/dist/training/validation.js +2 -0
package/dist/utilities/arrayClose.d.ts +1 -0
package/dist/utilities/arrayClose.js +16 -0
package/dist/utilities/datasetID.d.ts +2 -0
package/dist/utilities/datasetID.js +18 -0
package/dist/utilities/dummy.d.ts +9 -0
package/dist/utilities/dummy.js +36 -0
package/dist/utilities/multinomialCPU.d.ts +2 -0
package/dist/utilities/multinomialCPU.js +9 -0
package/dist/utilities/naming.d.ts +4 -0
package/dist/utilities/naming.js +0 -0
package/dist/utilities/packed.d.ts +4 -0
package/dist/utilities/packed.js +13 -0
package/dist/utilities/parameters.d.ts +11 -0
package/dist/utilities/parameters.js +38 -0
package/dist/utilities/performance.d.ts +2 -0
package/dist/utilities/performance.js +16 -0
package/dist/utilities/profile.d.ts +17 -0
package/dist/utilities/profile.js +33 -0
package/dist/utilities/safetensors.d.ts +3 -0
package/dist/utilities/safetensors.js +53 -0
package/dist/utilities/sentences.d.ts +5 -0
package/dist/utilities/sentences.js +32 -0
package/dist/utilities/tokenParse.d.ts +1 -0
package/dist/utilities/tokenParse.js +17 -0
package/dist/utilities/topP.d.ts +1 -0
package/dist/utilities/topP.js +12 -0
package/dist/utilities/waitForModel.d.ts +2 -0
package/dist/utilities/waitForModel.js +12 -0
package/dist/utilities/weights.d.ts +12 -0
package/dist/utilities/weights.js +40 -0
package/dist/utilities/yielder.d.ts +1 -0
package/dist/utilities/yielder.js +7 -0
package/dist/webgpu-Dt7BMzWz.js +525 -0
package/dist/webgpu_program-WOyIVMlZ.js +392 -0
package/dist/webgpu_util-B_F3SShA.js +106 -0
package/package.json +1 -1

package/dist/main.d.ts ADDED Viewed

@@ -0,0 +1,50 @@
+import { default as PretrainingTask } from './training/tasks/PretrainingTask';
+import { default as StartSentenceTask } from './training/tasks/StartSentenceTask';
+import { default as ConversationTask } from './training/tasks/ConversationTask';
+import { pack16 } from './ops/pack16';
+import { unpack16 } from './ops/unpack16';
+import { default as CausalSelfAttention } from './layers/CausalSelfAttention';
+import { default as MLP } from './layers/MLP';
+import { default as TransformerBlock } from './layers/TransformerBlock';
+import { default as RoPECache } from './layers/RoPECache';
+export { default as NanoGPT } from './models/NanoGPTV1';
+export { default as TeachableLLM } from './TeachableLLM';
+export { default as CharTokeniser } from './tokeniser/CharTokeniser';
+export { default as BPETokeniser } from './tokeniser/bpe';
+export { default as waitForModel } from './utilities/waitForModel';
+export { default as generateDatasetID } from './utilities/datasetID';
+export { default as loadTextData } from './data/textLoader';
+export type { DatasetMetadata, ModelMode } from './loader/types';
+export { default as Generator, type IGenerator } from './Generator';
+export { default as Evaluator } from './training/Evaluator';
+export { default as Trainer } from './Trainer';
+export type { IGenerateOptions } from './Generator';
+export { type ModelForwardAttributes, default as Model } from './models/model';
+export type { ITokeniser, Conversation, Roles } from './tokeniser/type';
+export type { TrainingOptions, TrainingLogEntry } from './training/types';
+export type { GPTConfig } from './models/config';
+export { estimateParameterCount, estimateMemoryUsage, estimateTrainingMemoryUsage, estimateResources, validateConfig, } from './utilities/parameters';
+export { default as topP } from './utilities/topP';
+export { Task, tokensFromTasks } from './training/tasks/Task';
+export declare const tasks: {
+    PretrainingTask: typeof PretrainingTask;
+    StartSentenceTask: typeof StartSentenceTask;
+    ConversationTask: typeof ConversationTask;
+};
+declare const ops: {
+    pack16: typeof pack16;
+    unpack16: typeof unpack16;
+};
+export { ops };
+export { selectBackend } from './backend';
+export { default as performanceTest } from './utilities/performance';
+export declare const layers: {
+    CausalSelfAttention: typeof CausalSelfAttention;
+    MLP: typeof MLP;
+    TransformerBlock: typeof TransformerBlock;
+    RoPECache: typeof RoPECache;
+};
+export { AdamWOptimizer } from './training/AdamW';
+export { default as checks } from './checks';
+export type { TensorStatistics } from './checks/weights';
+export { sentenceEmbeddings, sentenceEmbeddingsTensor } from './utilities/sentences';

package/dist/main.js ADDED Viewed

@@ -0,0 +1,16 @@
+import { a as e, b as t, i as n, n as r, r as i, s as a, t as o, y as s } from "./main-D5CbfCiV.js";
+import c from "./tokeniser/CharTokeniser.js";
+import l from "./tokeniser/bpe.js";
+import { AdamWOptimizer as u } from "./training/AdamW.js";
+import d from "./utilities/topP.js";
+import f from "./training/Evaluator.js";
+import p from "./utilities/waitForModel.js";
+import m from "./utilities/datasetID.js";
+import h from "./data/textLoader.js";
+import { estimateMemoryUsage as g, estimateParameterCount as _, estimateResources as v, estimateTrainingMemoryUsage as y, validateConfig as b } from "./utilities/parameters.js";
+import { Task as x, tokensFromTasks as S } from "./training/tasks/Task.js";
+import { selectBackend as C } from "./backend.js";
+import w from "./utilities/performance.js";
+import T from "./checks/index.js";
+import { sentenceEmbeddings as E, sentenceEmbeddingsTensor as D } from "./utilities/sentences.js";
+export { u as AdamWOptimizer, l as BPETokeniser, c as CharTokeniser, f as Evaluator, a as Generator, t as Model, s as NanoGPT, x as Task, n as TeachableLLM, e as Trainer, T as checks, g as estimateMemoryUsage, _ as estimateParameterCount, v as estimateResources, y as estimateTrainingMemoryUsage, m as generateDatasetID, o as layers, h as loadTextData, r as ops, w as performanceTest, C as selectBackend, E as sentenceEmbeddings, D as sentenceEmbeddingsTensor, i as tasks, S as tokensFromTasks, d as topP, b as validateConfig, p as waitForModel };

package/dist/matMul16-BNfZSnNM.js ADDED Viewed

@@ -0,0 +1,81 @@
+import { Fi as e, ii as t } from "./dist-BewPQWjc.js";
+import { t as n } from "./gelu-Bf1HW1RY.js";
+import { isPackedTensor as r } from "./utilities/packed.js";
+import { transpose16 as i } from "./ops/transpose16.js";
+import { reshape16 as a } from "./ops/reshape16.js";
+import { mul16 as o } from "./ops/mul16.js";
+import "./ops/webgl/matMul16.js";
+import "./ops/cpu/matMul16.js";
+import { t as s } from "./pack16-Ck-spx_F.js";
+//#region lib/ops/grads/matMul16.ts
+var c = {
+	kernelName: "MatMul16",
+	inputsToSave: ["A", "B"],
+	outputsToSave: [],
+	gradFunc: (e, t, r) => {
+		let [s, c] = t;
+		if (Array.isArray(e)) throw Error("Expected dy to be a single Tensor");
+		let u = e, { transposeA: p, transposeB: m, scale: h, activation: g, originalShape: _, perm: v } = r;
+		if (v && _) {
+			let e = Array(v.length);
+			for (let t = 0; t < v.length; ++t) e[v[t]] = t;
+			let t = u;
+			u = i(u, e), t.dispose();
+		}
+		if (_) {
+			let e = u;
+			u = a(u, _), e.dispose();
+		}
+		if (g === "gelu") {
+			let e = u, t = l(s, c, p, m);
+			u = n(e, t), e.dispose(), t.dispose();
+		} else if (g === "relu2") {
+			let e = u, t = l(s, c, p, m, {
+				activation: "relu",
+				scale: 2
+			});
+			u = o(e, t), e.dispose(), t.dispose();
+		}
+		if (!p && !m) return {
+			A: () => h === void 0 ? l(u, c, !1, !0) : d(u, c, h, !1, !0),
+			B: () => h === void 0 ? l(s, u, !0, !1) : f(s, u, h, !0, !1)
+		};
+		if (!p && m) return {
+			A: () => h === void 0 ? l(u, c, !1, !1) : d(u, c, h, !1, !1),
+			B: () => h === void 0 ? l(s, u, !0, !1) : f(s, u, h, !0, !1)
+		};
+		if (p && !m) return {
+			A: () => h === void 0 ? l(c, u, !1, !0) : f(c, u, h, !1, !0),
+			B: () => h === void 0 ? l(s, u, !1, !1) : f(s, u, h, !1, !1)
+		};
+		throw Error("Gradient for transposeA=true and transposeB=true is not supported yet.");
+	}
+};
+e(c);
+//#endregion
+//#region lib/ops/matMul16.ts
+function l(e, n, i = !1, a = !1, o = {}) {
+	let c = r(e), l = r(n), u = c || l, d = !u || c ? e : s(e), f = !u || l ? n : s(n), p = t().runKernel("MatMul16", {
+		A: d,
+		B: f
+	}, {
+		transposeA: i,
+		transposeB: a,
+		...o
+	});
+	return u && !c && d.dispose(), u && !l && f.dispose(), p;
+}
+function u(e, t, n, r = !1, i = !1) {
+	return l(e, t, r, i, { scale: n });
+}
+function d(e, t, n, r = !1, i = !1) {
+	return l(e, t, r, i, { scaleA: n });
+}
+function f(e, t, n, r = !1, i = !1) {
+	return l(e, t, r, i, { scaleB: n });
+}
+function p(e, t, n = !1, r = !1) {
+	return l(e, t, n, r, { activation: "gelu" });
+}
+//#endregion
+export { u as a, f as i, p as n, c as o, d as r, l as t };

package/dist/matMulGelu-CPTntosE.js ADDED Viewed

@@ -0,0 +1,162 @@
+import { Ci as e, Ii as t, In as n, Ps as r, di as i, gr as a, ii as o, oc as s } from "./dist-BewPQWjc.js";
+import { a as c } from "./gpgpu_math-DvLcCH6u.js";
+import { t as l } from "./Reshape-CABOPB9d.js";
+//#region node_modules/@tensorflow/tfjs-backend-webgl/dist/mulmat_packed_gpu.js
+var u = class {
+	constructor(e, t, n, r = !1, i = !1, a = !1, o = null, s = !1, l = !1) {
+		this.variableNames = ["matrixA", "matrixB"], this.packedInputs = !0, this.packedOutput = !0, this.outputShape = n, this.enableShapeUniforms = c(this.outputShape.length);
+		let u = r ? e[1] : e[2], d = Math.ceil(u / 2), f = r ? "i * 2, rc.y" : "rc.y, i * 2", p = i ? "rc.z, i * 2" : "i * 2, rc.z", m = r ? ["a.xxyy", "a.zzww"] : ["a.xxzz", "a.yyww"], h = i ? ["b.xzxz", "b.ywyw"] : ["b.xyxy", "b.zwzw"], g = "", _ = "";
+		o && (g = s ? `vec4 activation(vec4 a) {
+          vec4 b = getPreluActivationWeightsAtOutCoords();
+          ${o}
+        }` : l ? `vec4 activation(vec4 a) {
+          vec4 b = getLeakyreluAlphaAtOutCoords();
+          ${o}
+        }` : `vec4 activation(vec4 x) {
+          ${o}
+        }`, _ = "result = activation(result);");
+		let v = a ? "result += getBiasAtOutCoords();" : "";
+		a && this.variableNames.push("bias"), s && this.variableNames.push("preluActivationWeights"), l && this.variableNames.push("leakyreluAlpha");
+		let y = "rc.x", b = "rc.x";
+		e[0] < t[0] ? y = `imod(rc.x, ${e[0]})` : t[0] < e[0] && (b = `imod(rc.x, ${t[0]})`), this.userCode = `
+      ${g}
+      // Don't use uniform for sharedDimensionPacked for performance.
+      const float sharedDimension = ${d}.0;
+      vec4 dot2x2ARowBCol(ivec3 rc) {
+        vec4 result = vec4(0);
+        int batchA = ${y};
+        int batchB = ${b};
+        for (int i = 0; i < ${d}; i++) {
+          vec4 a = getMatrixA(batchA, ${f});
+          vec4 b = getMatrixB(batchB, ${p});
+          // These swizzled products need to be separately added.
+          // See: https://github.com/tensorflow/tfjs/issues/1735
+          result += (${m[0]} * ${h[0]});
+          result += (${m[1]} * ${h[1]});
+        }
+        return result;
+      }
+      void main() {
+        ivec3 rc = getOutputCoords();
+        vec4 result = dot2x2ARowBCol(rc);
+        ${v}
+        ${_}
+        setOutput(result);
+      }
+    `;
+	}
+}, d = .7978845608028654, f = .044715, p = `
+    vec4 x3 = x * x * x;
+    vec4 inner = x + ${f} * x3;
+    inner = ${d} * inner;
+    inner = vec4(
+        abs(inner[0]) > 15.0 ? sign(inner[0]) : tanh(inner[0]),
+        abs(inner[1]) > 15.0 ? sign(inner[1]) : tanh(inner[1]),
+        abs(inner[2]) > 15.0 ? sign(inner[2]) : tanh(inner[2]),
+        abs(inner[3]) > 15.0 ? sign(inner[3]) : tanh(inner[3])
+    );
+    inner = 0.5 * (1.0 + inner);
+    vec4 result = x * inner;
+    return result;
+`, m = `
+    vec4 a2 = a * a;
+    vec4 a3 = a2 * a;
+    vec4 u  = ${d} * (a + ${f} * a3);
+    vec4 t = vec4(
+        abs(u[0]) > 15.0 ? sign(u[0]) : tanh(u[0]),
+        abs(u[1]) > 15.0 ? sign(u[1]) : tanh(u[1]),
+        abs(u[2]) > 15.0 ? sign(u[2]) : tanh(u[2]),
+        abs(u[3]) > 15.0 ? sign(u[3]) : tanh(u[3])
+    );
+    vec4 sech2 = 1.0 - t * t;
+    vec4 du_dx = ${d} * (1.0 + 3.0 * ${f} * a2);
+    vec4 dgelu = 0.5 * (1.0 + t) + 0.5 * a * sech2 * du_dx;
+    return dgelu * b;
+`, h = 1e3;
+function g({ a: t, b: i, transposeA: a, transposeB: o, backend: c, activationSnippet: d, multiplier: f }) {
+	let p = t.shape.length, m = i.shape.length, h = a ? t.shape[p - 2] : t.shape[p - 1], g = o ? i.shape[m - 1] : i.shape[m - 2], _ = a ? t.shape[p - 1] : t.shape[p - 2], v = o ? i.shape[m - 2] : i.shape[m - 1], y = t.shape.slice(0, -2), b = i.shape.slice(0, -2), x = s(y), S = s(b), C = n(t.shape.slice(0, -2), i.shape.slice(0, -2)).concat([_, v]);
+	r(h === g, () => `Error in matMul: inner shapes (${h}) and (${g}) of Tensors with shapes ${t.shape} and ${i.shape} and transposeA=${a} and transposeB=${o} must match.`);
+	let w = a ? [
+		x,
+		h,
+		_
+	] : [
+		x,
+		_,
+		h
+	], T = o ? [
+		S,
+		v,
+		g
+	] : [
+		S,
+		g,
+		v
+	], E = l({
+		inputs: { x: t },
+		backend: c,
+		attrs: { shape: w }
+	}), D = l({
+		inputs: { x: i },
+		backend: c,
+		attrs: { shape: T }
+	}), O = [E, D], k = Math.max(x, S), A = d, j = e(t.dtype, i.dtype), M = new u(w, T, [
+		k,
+		_,
+		v
+	], a, o, !1, A, !!f, !1), N = [E, D];
+	f && N.push(f);
+	let P = c.runWebGLProgram(M, N, j), F = l({
+		inputs: { x: P },
+		backend: c,
+		attrs: { shape: C }
+	});
+	O.push(P);
+	for (let e of O) c.disposeIntermediateTensorInfo(e);
+	return F;
+}
+function _(e) {
+	let { inputs: t, backend: n } = e, { x: r, kernel: i } = t;
+	if (r === void 0 || i === void 0) throw Error("BatchMatMul requires two input tensors.");
+	return g({
+		a: r,
+		b: i,
+		transposeA: !1,
+		transposeB: !1,
+		backend: n,
+		activationSnippet: p
+	});
+}
+t({
+	kernelName: "MatMulGelu",
+	backendName: "webgl",
+	kernelFunc: _
+});
+function v(e) {
+	let { dy: t, x: n, kernel: r } = e.inputs, s = e.backend;
+	return i(() => {
+		let e = o().makeTensorFromTensorInfo(g({
+			a: n,
+			b: r,
+			transposeA: !1,
+			transposeB: !1,
+			backend: s,
+			activationSnippet: m,
+			multiplier: t
+		}));
+		return [a(e, r, !1, !0), a(n, e, !0, !1)];
+	});
+}
+t({
+	kernelName: "MatMulGeluGrad",
+	backendName: "webgl",
+	kernelFunc: v
+});
+//#endregion
+export { u as i, g as n, _ as r, h as t };

package/dist/models/NanoGPTV1.d.ts ADDED Viewed

@@ -0,0 +1,16 @@
+import { GPTConfigV1 } from './config';
+import { Tensor } from '@tensorflow/tfjs-core';
+import { default as Model, ModelForwardAttributes } from './model';
+export default class NanoGPTV1 extends Model<ModelForwardAttributes, GPTConfigV1> {
+    private wte;
+    private wpe?;
+    private blocks;
+    private lnF;
+    private ropeCache?;
+    constructor(config?: Partial<GPTConfigV1>);
+    getClassName(): string;
+    private inputPhase;
+    forward(attrs: ModelForwardAttributes, idx: Tensor): Tensor;
+    project(embeddings: Tensor): Tensor;
+    dispose(): void;
+}

package/dist/models/NanoGPTV1.js ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { y as e } from "../main-D5CbfCiV.js";
2	+ export { e as default };

package/dist/models/NanoGPTV2.d.ts ADDED Viewed

@@ -0,0 +1,16 @@
+import { GPTConfigV2 } from './config';
+import { Tensor } from '@tensorflow/tfjs-core';
+import { default as Model, ModelForwardAttributes } from './model';
+export default class NanoGPTV2 extends Model<ModelForwardAttributes, GPTConfigV2> {
+    private wte;
+    private wpe?;
+    private blocks;
+    private lnF;
+    private ropeCache?;
+    constructor(config?: Partial<GPTConfigV2>);
+    getClassName(): string;
+    private inputPhase;
+    forward(attrs: ModelForwardAttributes, idx: Tensor): Tensor;
+    project(embeddings: Tensor): Tensor;
+    dispose(): void;
+}

package/dist/models/NanoGPTV2.js ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { v as e } from "../main-D5CbfCiV.js";
2	+ export { e as default };

package/dist/models/config.d.ts ADDED Viewed

@@ -0,0 +1,27 @@
+export interface LoRAConfig {
+    rank: number;
+    alpha: number;
+    variables: string[];
+}
+export interface GPTConfigBase {
+    modelType?: string;
+    vocabSize: number;
+    blockSize: number;
+    nLayer: number;
+    nHead: number;
+    nEmbed: number;
+    mlpFactor: number;
+    loraConfig?: Map<string, LoRAConfig>;
+    loraName?: string;
+}
+export interface GPTConfigV1 extends GPTConfigBase {
+    modelType: 'GenAI_NanoGPT_v1';
+    useRope: boolean;
+}
+export interface GPTConfigV2 extends GPTConfigBase {
+    modelType: 'GenAI_NanoGPT_v2';
+    windowSize?: string;
+}
+export type GPTConfig = GPTConfigV1 | GPTConfigV2;
+export declare const defaultConfig: GPTConfig;
+export declare function validateConfig(config: unknown): asserts config is GPTConfig;

package/dist/models/config.js ADDED Viewed

@@ -0,0 +1,37 @@
+//#region lib/models/config.ts
+var e = {
+	modelType: "GenAI_NanoGPT_v2",
+	vocabSize: 2e3,
+	blockSize: 128,
+	nLayer: 6,
+	nHead: 4,
+	nEmbed: 256,
+	mlpFactor: 4
+};
+function t(e, t) {
+	if (typeof e[t] != "number" || Number.isNaN(e[t])) throw Error(`Invalid config: "${t}" must be a number.`);
+}
+function n(e) {
+	let n = (e) => typeof e == "object" && !!e && !Array.isArray(e);
+	if (!n(e)) throw Error("Invalid config: expected an object.");
+	if (t(e, "vocabSize"), t(e, "blockSize"), t(e, "nLayer"), t(e, "nHead"), t(e, "nEmbed"), t(e, "mlpFactor"), e.loraConfig !== void 0) {
+		if (!n(e.loraConfig)) throw Error("Invalid config: \"loraConfig\" must be an object.");
+		let r = Object.values(e.loraConfig);
+		if (!r.every((e) => n(e))) throw Error("Invalid config: each entry in \"loraConfig\" must be an object.");
+		if (!r.every((e) => "rank" in e && "alpha" in e && "variables" in e)) throw Error("Invalid config: each LoRA config must have \"rank\", \"alpha\", and \"variables\" fields.");
+		r.forEach((e) => {
+			if (t(e, "rank"), t(e, "alpha"), !Array.isArray(e.variables) || !e.variables.every((e) => typeof e == "string")) throw Error("Invalid config: \"variables\" must be a string array.");
+		});
+	}
+	if (e.modelType === "GenAI_NanoGPT_v1") {
+		if (typeof e.useRope != "boolean") throw Error("Invalid config: \"useRope\" must be a boolean for GenAI_NanoGPT_v1.");
+		return;
+	}
+	if (e.modelType === "GenAI_NanoGPT_v2") {
+		if (e.windowSize !== void 0 && typeof e.windowSize != "string") throw Error("Invalid config: \"windowSize\" must be a string for GenAI_NanoGPT_v2.");
+		return;
+	}
+	throw Error("Invalid config: \"modelType\" must be \"GenAI_NanoGPT_v1\" or \"GenAI_NanoGPT_v2\".");
+}
+//#endregion
+export { e as defaultConfig, n as validateConfig };

package/dist/models/factory.d.ts ADDED Viewed

@@ -0,0 +1,3 @@
+import { GPTConfig } from '../../models/config';
+import { default as Model, ModelForwardAttributes } from './model';
+export default function createModelInstance(config: GPTConfig): Model<ModelForwardAttributes, GPTConfig>;

package/dist/models/factory.js ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { _ as e } from "../main-D5CbfCiV.js";
2	+ export { e as default };

package/dist/models/model.d.ts ADDED Viewed

@@ -0,0 +1,44 @@
+import { Tensor } from '@tensorflow/tfjs-core';
+import { ForwardAttributes, default as BaseLayer } from '../layers/BaseLayer';
+import { AttentionScores, KVCache } from '../layers/CausalSelfAttention';
+import { TransformersMetadata } from '../../loader/types';
+import { GPTConfig, LoRAConfig } from './config';
+import { default as LoRA } from '../../layers/LoRA';
+export interface ModelForwardAttributes extends ForwardAttributes {
+    cache?: KVCache[];
+    attentionScores?: AttentionScores;
+    seed?: number;
+    skipLogits?: boolean;
+    ropePositionOffset?: number;
+}
+export interface TrainingState {
+    steps: number;
+    learningRate: number;
+    batchSize: number;
+    loss: number;
+    tokensProcessed: number;
+    duration: number;
+}
+export default abstract class Model<T extends ModelForwardAttributes, C extends GPTConfig = GPTConfig> extends BaseLayer<T, C> {
+    lossScaling: number;
+    trainingState: TrainingState | null;
+    metaData: TransformersMetadata;
+    private loraLayer?;
+    private loraMap;
+    constructor(config: C);
+    createLoRA(name: string, loraConfig: LoRAConfig): void;
+    deleteLoRA(name: string): void;
+    renameLoRA(oldName: string, newName: string): void;
+    mergeLoRA(name: string): void;
+    attachLoRA(name: string): void;
+    detachLoRA(): void;
+    hasLoRA(name?: string): boolean;
+    listLoRAs(): string[];
+    get lora(): LoRA | null;
+    abstract getClassName(): string;
+    abstract forward(attrs: T, idx: Tensor): Tensor;
+    abstract project(embeddings: Tensor): Tensor;
+    abstract dispose(): void;
+    getNumParams(): number;
+    protected validateInput(idx: Tensor): void;
+}

package/dist/models/model.js ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { b as e } from "../main-D5CbfCiV.js";
2	+ export { e as default };

package/dist/ops/adamAdjust.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function adamAdjust(moments: Tensor, value: Tensor, beta1: number, beta2: number, epsilon: number, learningRate: number, weightDecay?: number): Tensor;

package/dist/ops/adamAdjust.js ADDED Viewed

@@ -0,0 +1,18 @@
+import { ii as e } from "../dist-BewPQWjc.js";
+import "./cpu/adamAdjust.js";
+import "./webgl/adamAdjust.js";
+//#region lib/ops/adamAdjust.ts
+function t(t, n, r, i, a, o, s = 0) {
+	return e().runKernel("AdamAdjust", {
+		moments: t,
+		value: n
+	}, {
+		beta1: r,
+		beta2: i,
+		epsilon: a,
+		learningRate: o,
+		weightDecay: s
+	});
+}
+//#endregion
+export { t as adamAdjust };

package/dist/ops/adamMoments.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Scalar, Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function adamMoments(moments: Tensor, gradient: Tensor, beta1: number, beta2: number, scaling: Scalar): Tensor;

package/dist/ops/adamMoments.js ADDED Viewed

@@ -0,0 +1,16 @@
+import { ii as e } from "../dist-BewPQWjc.js";
+import "./cpu/adamMoments.js";
+import "./webgl/adamMoments.js";
+//#region lib/ops/adamMoments.ts
+function t(t, n, r, i, a) {
+	return e().runKernel("AdamMoments", {
+		moments: t,
+		gradient: n,
+		scaling: a
+	}, {
+		beta1: r,
+		beta2: i
+	});
+}
+//#endregion
+export { t as adamMoments };

package/dist/ops/add16.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function add16(a: Tensor, b: Tensor): Tensor;

package/dist/ops/add16.js ADDED Viewed

@@ -0,0 +1,12 @@
+import { ii as e, qr as t } from "../dist-BewPQWjc.js";
+import { isPackedTensor as n } from "../utilities/packed.js";
+import "./grads/add16.js";
+//#region lib/ops/add16.ts
+function r(r, i) {
+	return !n(r) && !n(i) ? t(r, i) : e().runKernel("Add16", {
+		a: r,
+		b: i
+	});
+}
+//#endregion
+export { r as add16 };

package/dist/ops/appendCache.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function appendCache(item: Tensor, maxSize: number, pastLen: number, cache?: Tensor): Tensor;

package/dist/ops/appendCache.js ADDED Viewed

@@ -0,0 +1,25 @@
+import { _r as e, ii as t, kt as n } from "../dist-BewPQWjc.js";
+import { isPackedTensor as r } from "../utilities/packed.js";
+import "./cpu/appendCache.js";
+import "./webgl/appendCache.js";
+//#region lib/ops/appendCache.ts
+function i(i, a, o, s) {
+	if (!s) {
+		let t = i.shape[2], o = r(i);
+		return e([i, n([
+			i.shape[0],
+			i.shape[1],
+			a - t,
+			i.shape[3]
+		], o ? "int32" : i.dtype)], 2);
+	}
+	return t().runKernel("AppendCache", {
+		cache: s,
+		item: i
+	}, {
+		maxSize: a,
+		pastLen: o
+	});
+}
+//#endregion
+export { i as appendCache };

package/dist/ops/attentionMask.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function attentionMask(q: Tensor, k: Tensor, divisor: number, pastLen?: number): Tensor;

package/dist/ops/attentionMask.js ADDED Viewed

@@ -0,0 +1,16 @@
+import { ii as e } from "../dist-BewPQWjc.js";
+import "./cpu/attentionMask.js";
+import "./webgl/attentionMask.js";
+import "./grads/attentionMask.js";
+//#region lib/ops/attentionMask.ts
+function t(t, n, r, i) {
+	return e().runKernel("AttentionMask", {
+		q: t,
+		k: n
+	}, {
+		divisor: r,
+		pastLen: i || 0
+	});
+}
+//#endregion
+export { t as attentionMask };

package/dist/ops/concat16.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import { Rank, Tensor } from '@tensorflow/tfjs-core';
2	+ export declare function concat16<R extends Rank = Rank>(x: Tensor<R>[], axis?: number): Tensor<R>;

package/dist/ops/concat16.js ADDED Viewed

@@ -0,0 +1,8 @@
+import { _r as e, ii as t } from "../dist-BewPQWjc.js";
+import { isPackedTensor as n } from "../utilities/packed.js";
+//#region lib/ops/concat16.ts
+function r(r, i) {
+	return n(r[0]) ? t().runKernel("Concat16", r, { axis: i ?? -1 }) : e(r, i);
+}
+//#endregion
+export { r as concat16 };

package/dist/ops/cpu/adamAdjust.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export {};

package/dist/ops/cpu/adamAdjust.js ADDED Viewed

@@ -0,0 +1,16 @@
+import { Gr as e, Ii as t, Wr as n, gn as r, qr as i } from "../../dist-BewPQWjc.js";
+//#region lib/ops/cpu/adamAdjust.ts
+function a(t) {
+	let { moments: a, value: o } = t.inputs, { beta1: s, beta2: c, epsilon: l, learningRate: u } = t.attrs, d = a.shape.length, f = Array(d).fill(0), p = a.shape.slice();
+	p[d - 1] = 1;
+	let m = f.slice();
+	m[d - 1] = 1;
+	let h = p.slice(), g = a.slice(f, p).squeeze([d - 1]), _ = a.slice(m, h).squeeze([d - 1]);
+	return i(n(e(e(g, s), i(r(e(_, c)), l ?? 1e-8)), -u), o);
+}
+t({
+	kernelName: "AdamAdjust",
+	backendName: "cpu",
+	kernelFunc: a
+});
+//#endregion

package/dist/ops/cpu/adamMoments.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export {};

package/dist/ops/cpu/adamMoments.js ADDED Viewed

@@ -0,0 +1,16 @@
+import { Ii as e, V as t } from "../../dist-BewPQWjc.js";
+//#region lib/ops/cpu/adamMoments.ts
+function n(e) {
+	let { moments: n, gradient: r } = e.inputs, { beta1: i, beta2: a } = e.attrs, o = n.shape.length, s = Array(o).fill(0), c = n.shape.slice();
+	c[o - 1] = 1;
+	let l = s.slice();
+	l[o - 1] = 1;
+	let u = c.slice(), d = n.slice(s, c).squeeze([o - 1]), f = n.slice(l, u).squeeze([o - 1]);
+	return t([d.mul(i).add(r.mul(1 - i)), f.mul(a).add(r.square().mul(1 - a))], -1);
+}
+e({
+	kernelName: "AdamMoments",
+	backendName: "cpu",
+	kernelFunc: n
+});
+//#endregion

package/dist/ops/cpu/appendCache.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export {};