npm - @genai-fi/nanogpt - Versions diffs - 0.9.1 → 0.10.0 - Mend

@genai-fi/nanogpt 0.9.1 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (343) hide show

package/README.md +352 -14
package/dist/Generator.js +69 -78
package/dist/{RealDiv-D4EzDsC0.js → RealDiv-DgA3z9oO.js} +32 -206
package/dist/Reshape-CF6odzV4.js +16 -0
package/dist/Reshape-_kILl6tK.js +81 -0
package/dist/TeachableLLM.js +28 -22
package/dist/Trainer.d.ts +2 -0
package/dist/Trainer.js +3 -2
package/dist/{axis_util-TbGYJ208.js → axis_util-BvHEw88j.js} +7 -23
package/dist/backend.d.ts +2 -1
package/dist/backend.js +10 -4
package/dist/backend_util-D-rUb2ty.js +474 -0
package/dist/backend_webgpu-B0u2ndUn.js +547 -0
package/dist/binary_op_util-pKXltfxI.js +192 -0
package/dist/broadcast_to-CwF7XIeu.js +30 -0
package/dist/checks/appendCache.js +2 -2
package/dist/checks/attentionMask.js +3 -3
package/dist/checks/check.d.ts +1 -1
package/dist/checks/check.js +8 -8
package/dist/checks/gelu.js +2 -2
package/dist/checks/index.d.ts +2 -0
package/dist/checks/index.js +7 -5
package/dist/checks/matMulGelu.js +6 -6
package/dist/checks/normRMS.js +7 -7
package/dist/checks/normRMSGrad.js +3 -3
package/dist/checks/packUnpack.d.ts +1 -0
package/dist/checks/packUnpack.js +18 -0
package/dist/checks/qkv.js +12 -27
package/dist/checks/rope.js +2 -2
package/dist/checks/weights.js +18 -16
package/dist/complex-CSlYz-2T.js +13 -0
package/dist/complex_util-Yc1A_gV1.js +55 -0
package/dist/concat-BHlIJeyT.js +19 -0
package/dist/concat_util-DcJk7YHS.js +22 -0
package/dist/data/docx.js +1 -1
package/dist/data/parquet.js +2 -2
package/dist/data/pdf.js +1 -1
package/dist/data/textLoader.js +1 -1
package/dist/{dataset-DlZtKmBq.js → dataset-0xP8GjwI.js} +136 -236
package/dist/dropout-C1pM3f11.js +99 -0
package/dist/expand_dims-BPG4fwBP.js +13 -0
package/dist/exports_initializers-xuidcwI4.js +7 -0
package/dist/gather-DykLGqmW.js +10 -0
package/dist/{gelu-Bp_-935b.js → gelu-CNLFZWea.js} +11 -10
package/dist/{gpgpu_math-CDaYiyE_.js → gpgpu_math-DDVJCn6-.js} +90 -265
package/dist/{index-C4L8Cm77.js → index-CieiGp4Y.js} +14 -14
package/dist/index-CjOj7j-u.js +7308 -0
package/dist/{index-Tf7vU29b.js → index-Cp39cXWe.js} +3 -10
package/dist/{index-Dwqa6Zy2.js → index-DvYrXKkX.js} +2 -2
package/dist/index-ZyQhjEPo.js +2157 -0
package/dist/{jszip.min-CjP2V1VV.js → jszip.min-Bz5-11Bk.js} +56 -57
package/dist/kernel_funcs_utils-Dg_-E44D.js +308 -0
package/dist/layers/BaseLayer.d.ts +1 -0
package/dist/layers/BaseLayer.js +7 -6
package/dist/layers/CausalSelfAttention.d.ts +0 -1
package/dist/layers/CausalSelfAttention.js +56 -55
package/dist/layers/MLP.js +15 -16
package/dist/layers/PositionEmbedding.js +5 -14
package/dist/layers/RMSNorm.js +3 -3
package/dist/layers/RoPECache.d.ts +2 -0
package/dist/layers/RoPECache.js +22 -17
package/dist/layers/TiedEmbedding.js +22 -17
package/dist/layers/TransformerBlock.js +21 -20
package/dist/loader/load.js +1 -1
package/dist/loader/loadTransformers.js +1 -1
package/dist/loader/oldZipLoad.js +39 -33
package/dist/loader/save.js +1 -1
package/dist/log_sum_exp-DWI-76TI.js +41 -0
package/dist/main.d.ts +8 -0
package/dist/main.js +63 -52
package/dist/matMul16--R5hOwDG.js +77 -0
package/dist/mat_mul-DeAh4uTH.js +12 -0
package/dist/mod-Gt1rMB4n.js +12 -0
package/dist/models/NanoGPTV1.js +40 -31
package/dist/models/model.d.ts +2 -0
package/dist/models/model.js +37 -29
package/dist/{mulmat_packed_gpu-BT60jmzP.js → mulmat_packed_gpu-BMFhLwta.js} +1 -17
package/dist/{non_max_suppression_impl-CsEgBuMA.js → non_max_suppression_impl-B2W7YjZB.js} +0 -32
package/dist/ones-CAMiP4I2.js +15 -0
package/dist/ops/adamAdjust.js +1 -1
package/dist/ops/adamMoments.d.ts +1 -1
package/dist/ops/adamMoments.js +4 -4
package/dist/ops/add16.d.ts +2 -0
package/dist/ops/add16.js +9 -0
package/dist/ops/appendCache.js +16 -9
package/dist/ops/attentionMask.js +4 -4
package/dist/ops/concat16.d.ts +2 -0
package/dist/ops/concat16.js +9 -0
package/dist/ops/cpu/adamAdjust.js +14 -13
package/dist/ops/cpu/adamMoments.js +10 -9
package/dist/ops/cpu/appendCache.js +9 -8
package/dist/ops/cpu/attentionMask.js +15 -14
package/dist/ops/cpu/fusedSoftmax.js +13 -12
package/dist/ops/cpu/gatherSub.js +9 -24
package/dist/ops/cpu/gelu.js +13 -12
package/dist/ops/cpu/matMul16.d.ts +1 -0
package/dist/ops/cpu/matMul16.js +16 -0
package/dist/ops/cpu/matMulGelu.js +18 -16
package/dist/ops/cpu/matMulMul.js +8 -7
package/dist/ops/cpu/mulDropout.js +4 -3
package/dist/ops/cpu/normRMS.js +11 -10
package/dist/ops/cpu/qkv.js +17 -13
package/dist/ops/cpu/rope.js +23 -22
package/dist/ops/cpu/scatterSub.js +16 -30
package/dist/ops/dot16.d.ts +2 -0
package/dist/ops/dot16.js +42 -0
package/dist/ops/gatherSub.js +1 -1
package/dist/ops/gelu.js +2 -2
package/dist/ops/grads/add16.d.ts +1 -0
package/dist/ops/grads/add16.js +27 -0
package/dist/ops/grads/attentionMask.js +12 -19
package/dist/ops/grads/gelu.js +4 -3
package/dist/ops/grads/matMul16.d.ts +2 -0
package/dist/ops/grads/matMul16.js +9 -0
package/dist/ops/grads/matMulGelu.js +8 -7
package/dist/ops/grads/normRMS.js +8 -7
package/dist/ops/grads/{fusedSoftmax.d.ts → pack16.d.ts} +1 -1
package/dist/ops/grads/pack16.js +7 -0
package/dist/ops/grads/qkv.d.ts +3 -1
package/dist/ops/grads/qkv.js +28 -22
package/dist/ops/grads/rope.d.ts +2 -1
package/dist/ops/grads/rope.js +6 -13
package/dist/ops/grads/softmax16.d.ts +2 -0
package/dist/ops/grads/softmax16.js +26 -0
package/dist/ops/grads/unpack16.d.ts +2 -0
package/dist/ops/grads/unpack16.js +6 -0
package/dist/ops/grads/utils.d.ts +3 -0
package/dist/ops/grads/utils.js +10 -0
package/dist/ops/matMul16.d.ts +15 -0
package/dist/ops/matMul16.js +13 -0
package/dist/ops/matMulGelu.js +1 -1
package/dist/ops/matMulMul.js +1 -1
package/dist/ops/mul16.d.ts +2 -0
package/dist/ops/mul16.js +8 -0
package/dist/ops/mulDrop.js +1 -1
package/dist/ops/normRMS.js +1 -1
package/dist/ops/pack16.d.ts +2 -0
package/dist/ops/pack16.js +6 -0
package/dist/ops/qkv.d.ts +1 -1
package/dist/ops/qkv.js +8 -4
package/dist/ops/reshape16.d.ts +2 -0
package/dist/ops/reshape16.js +43 -0
package/dist/ops/rope.d.ts +1 -1
package/dist/ops/rope.js +8 -10
package/dist/ops/scatterSub.js +1 -1
package/dist/ops/slice16.d.ts +2 -0
package/dist/ops/slice16.js +9 -0
package/dist/ops/softmax16.d.ts +2 -0
package/dist/ops/softmax16.js +12 -0
package/dist/ops/sub16.d.ts +2 -0
package/dist/ops/sub16.js +8 -0
package/dist/ops/sum16.d.ts +2 -0
package/dist/ops/sum16.js +13 -0
package/dist/ops/transpose16.d.ts +3 -0
package/dist/ops/transpose16.js +41 -0
package/dist/ops/unpack16.d.ts +2 -0
package/dist/ops/unpack16.js +6 -0
package/dist/ops/webgl/adamAdjust.js +3 -2
package/dist/ops/webgl/adamMoments.js +2 -1
package/dist/ops/webgl/appendCache.js +2 -1
package/dist/ops/webgl/attentionMask.js +5 -4
package/dist/ops/webgl/fusedSoftmax.js +6 -4
package/dist/ops/webgl/gatherSub.js +7 -6
package/dist/ops/webgl/gelu.js +3 -2
package/dist/ops/webgl/log.js +12 -27
package/dist/ops/webgl/matMul16.d.ts +1 -0
package/dist/ops/webgl/matMul16.js +37 -0
package/dist/ops/webgl/matMulGelu.js +17 -15
package/dist/ops/webgl/matMulMul.js +13 -12
package/dist/ops/webgl/mulDropout.js +9 -8
package/dist/ops/webgl/normRMS.js +8 -7
package/dist/ops/webgl/qkv.js +6 -5
package/dist/ops/webgl/rope.js +11 -10
package/dist/ops/webgl/scatterSub.js +6 -5
package/dist/ops/webgpu/adamAdjust.js +12 -10
package/dist/ops/webgpu/adamMoments.js +27 -22
package/dist/ops/webgpu/add16.d.ts +1 -0
package/dist/ops/webgpu/add16.js +14 -0
package/dist/ops/webgpu/appendCache.js +64 -17
package/dist/ops/webgpu/attentionMask.js +19 -62
package/dist/ops/webgpu/attentionMask32_program.d.ts +19 -0
package/dist/ops/webgpu/attentionMask32_program.js +54 -0
package/dist/ops/webgpu/concat16.d.ts +19 -0
package/dist/ops/webgpu/concat16.js +128 -0
package/dist/ops/webgpu/gatherSub.js +9 -7
package/dist/ops/webgpu/gelu.js +78 -31
package/dist/ops/webgpu/index.js +12 -0
package/dist/ops/webgpu/matMul16.d.ts +1 -0
package/dist/ops/webgpu/matMul16.js +58 -0
package/dist/ops/webgpu/matMul16_program.d.ts +42 -0
package/dist/ops/webgpu/matMul16_program.js +336 -0
package/dist/ops/webgpu/mul16.d.ts +1 -0
package/dist/ops/webgpu/mul16.js +14 -0
package/dist/ops/webgpu/normRMS.js +21 -40
package/dist/ops/webgpu/normRMS16_program.d.ts +9 -0
package/dist/ops/webgpu/normRMS16_program.js +24 -0
package/dist/ops/webgpu/normRMS32_program.d.ts +9 -0
package/dist/ops/webgpu/normRMS32_program.js +24 -0
package/dist/ops/webgpu/normRMSGrad.js +113 -64
package/dist/ops/webgpu/pack16.d.ts +1 -0
package/dist/ops/webgpu/pack16.js +19 -0
package/dist/ops/webgpu/pack16_program.d.ts +19 -0
package/dist/ops/webgpu/pack16_program.js +92 -0
package/dist/ops/webgpu/qkv.js +20 -55
package/dist/ops/webgpu/rope.js +77 -22
package/dist/ops/webgpu/scatterSub.js +9 -7
package/dist/ops/webgpu/slice16.d.ts +7 -0
package/dist/ops/webgpu/slice16.js +71 -0
package/dist/{variable-Bm2OFwGI.js → ops/webgpu/softmax16.d.ts} +2 -8
package/dist/ops/webgpu/softmax16.js +23 -0
package/dist/ops/webgpu/softmax16_program.d.ts +13 -0
package/dist/ops/webgpu/softmax16_program.js +73 -0
package/dist/ops/webgpu/softmax16_subgroup_program.d.ts +17 -0
package/dist/ops/webgpu/softmax16_subgroup_program.js +75 -0
package/dist/ops/webgpu/softmax16grad.d.ts +1 -0
package/dist/ops/webgpu/softmax16grad.js +38 -0
package/dist/ops/webgpu/sub16.d.ts +1 -0
package/dist/ops/webgpu/sub16.js +14 -0
package/dist/ops/webgpu/sum16.d.ts +1 -0
package/dist/ops/webgpu/sum16.js +40 -0
package/dist/ops/webgpu/transpose16.d.ts +1 -0
package/dist/ops/webgpu/transpose16.js +35 -0
package/dist/ops/webgpu/transpose16_program.d.ts +16 -0
package/dist/ops/webgpu/transpose16_program.js +50 -0
package/dist/ops/webgpu/transpose16_shared_program.d.ts +15 -0
package/dist/ops/webgpu/transpose16_shared_program.js +71 -0
package/dist/ops/webgpu/unpack16.d.ts +1 -0
package/dist/ops/webgpu/unpack16.js +49 -0
package/dist/ops/webgpu/utils/binary_op.d.ts +19 -0
package/dist/ops/webgpu/utils/binary_op.js +79 -0
package/dist/ops/webgpu/utils/deviceInfo.d.ts +7 -0
package/dist/ops/webgpu/utils/deviceInfo.js +11 -0
package/dist/ops/webgpu/utils/reductions.d.ts +32 -4
package/dist/ops/webgpu/utils/reductions.js +236 -45
package/dist/ops-CNI3TwqM.js +645 -0
package/dist/pack16-CFUqumar.js +41 -0
package/dist/{papaparse.min-C8l2Kvo1.js → papaparse.min-C0cScC2i.js} +2 -8
package/dist/{parquet-C0Tlmv9c.js → parquet-BE8MU_ge.js} +201 -278
package/dist/patches/PackedTensor.d.ts +12 -0
package/dist/patches/PackedTensor.js +11 -0
package/dist/patches/engine.d.ts +261 -0
package/dist/patches/engine.js +10 -0
package/dist/patches/tape.d.ts +12 -0
package/dist/patches/tape.js +5 -0
package/dist/patches/webgpu_backend.d.ts +18 -0
package/dist/patches/webgpu_backend.js +57 -0
package/dist/{tensor-CZr4dh61.js → patches/webgpu_base.d.ts} +5 -8
package/dist/patches/webgpu_base.js +34 -0
package/dist/patches/webgpu_program.d.ts +36 -0
package/dist/patches/webgpu_program.js +401 -0
package/dist/{pdf-kJD-f258.js → pdf-NIhmP3sq.js} +424 -428
package/dist/random_width-DY6Kk2Dl.js +10051 -0
package/dist/range-BMS52eQi.js +11 -0
package/dist/reciprocal-CTmshQ9J.js +10 -0
package/dist/{register_all_kernels-DIGpEwcf.js → register_all_kernels-Bwu1PTuU.js} +719 -9766
package/dist/relu-yZ2-7WxU.js +10 -0
package/dist/reshape-DevtBWtf.js +10 -0
package/dist/rope-B5UUMsPi.js +32 -0
package/dist/{scatter_nd_util-BQdz--Gn.js → scatter_nd_util-5EL-8VAQ.js} +1 -1
package/dist/selu_util-D1w6yyTO.js +303 -0
package/dist/{shared-DuP7ue-R.js → shared-BRksrJb3.js} +1 -17
package/dist/shared-BuAXb4CI.js +2145 -0
package/dist/sin-BGfy2HZo.js +16 -0
package/dist/slice-D_gkkqZK.js +13 -0
package/dist/slice_util-DtEldBfK.js +261 -0
package/dist/softmax-ZHVebtR1.js +13 -0
package/dist/split-DrfihRpZ.js +10 -0
package/dist/squeeze-DZEpeblb.js +11 -0
package/dist/stack-yOIAalTq.js +13 -0
package/dist/sum-_fzj5ZTB.js +12 -0
package/dist/tensor-DdQUJZlz.js +909 -0
package/dist/tensor-f35l8Odg.js +8 -0
package/dist/tensor1d-CeZuc-Rv.js +12 -0
package/dist/tensor2d-G4Ys2GxX.js +15 -0
package/dist/tensor4d-B8roDgtc.js +15 -0
package/dist/tensor_util-DV-FP5Q3.js +523 -0
package/dist/tfjs_backend-kNyO5L2d.js +653 -0
package/dist/tile-BzyEiF-F.js +13 -0
package/dist/tokeniser/CharTokeniser.js +1 -1
package/dist/tokeniser/bpe.js +1 -1
package/dist/training/Adam.d.ts +2 -1
package/dist/training/Adam.js +12 -28
package/dist/training/AdamExt.d.ts +1 -0
package/dist/training/AdamExt.js +2 -2
package/dist/training/DatasetBuilder.js +3 -20
package/dist/training/FullTrainer.js +55 -48
package/dist/training/Trainer.d.ts +11 -6
package/dist/training/Trainer.js +51 -39
package/dist/training/sparseCrossEntropy.js +3 -3
package/dist/transpose-DKELTqhe.js +38 -0
package/dist/utilities/arrayClose.js +7 -7
package/dist/utilities/dummy.js +35 -27
package/dist/utilities/multinomialCPU.js +2 -2
package/dist/utilities/packed.d.ts +7 -0
package/dist/utilities/packed.js +716 -0
package/dist/utilities/performance.js +1 -1
package/dist/utilities/profile.js +1 -1
package/dist/utilities/safetensors.js +2 -2
package/dist/utilities/sentences.d.ts +5 -0
package/dist/utilities/sentences.js +41 -0
package/dist/utilities/weights.js +2 -2
package/dist/variable-Bhn5bHYv.js +7 -0
package/dist/{webgpu_program-DkQJOJSd.js → webgpu_program-Cigz-7RF.js} +15 -44
package/dist/webgpu_util-BBCnKm2X.js +65 -0
package/dist/zeros-2gldETuK.js +14 -0
package/package.json +4 -3
package/dist/Reshape-Bowtk9BP.js +0 -127
package/dist/Reshape-DUqYftGC.js +0 -30
package/dist/backend_util-CJIiDoV1.js +0 -749
package/dist/broadcast_to-DzlNweb8.js +0 -44
package/dist/concat-B912vBbo.js +0 -33
package/dist/dropout-C-csYCLj.js +0 -193
package/dist/exports_initializers-B8iZMgQ0.js +0 -16
package/dist/gather-Dnpgw-YQ.js +0 -25
package/dist/index-BzFyqcy-.js +0 -4457
package/dist/index-C1rx_Ajs.js +0 -12076
package/dist/kernel_funcs_utils-DKLK0Mg3.js +0 -466
package/dist/log_sum_exp-DO6z8tSE.js +0 -103
package/dist/mat_mul-DzjTFx-u.js +0 -27
package/dist/mod-Dobti4j4.js +0 -27
package/dist/ones-tIJeHlq-.js +0 -29
package/dist/ops/fusedSoftmax.d.ts +0 -2
package/dist/ops/fusedSoftmax.js +0 -10
package/dist/ops/grads/fusedSoftmax.js +0 -22
package/dist/ops-LuCMAnmM.js +0 -1525
package/dist/random_width-CXVRloNK.js +0 -13670
package/dist/range-CWcz7xFA.js +0 -26
package/dist/reciprocal-C4rNcM-S.js +0 -25
package/dist/relu-BjCh_SYb.js +0 -25
package/dist/reshape-CnIwVG1c.js +0 -25
package/dist/selu_util-OtRzVwW5.js +0 -719
package/dist/shared-DmRsFyaJ.js +0 -3134
package/dist/sin-gpDNRxE0.js +0 -47
package/dist/slice-d0Vo9XTN.js +0 -28
package/dist/softmax-D7Jj3p_P.js +0 -28
package/dist/split-DK2k5eHf.js +0 -25
package/dist/stack-DFatutCx.js +0 -27
package/dist/sum-CJ0ULhmt.js +0 -27
package/dist/tensor1d-vML0r3q6.js +0 -27
package/dist/tensor2d-D76QGjF3.js +0 -30
package/dist/tensor4d-Df1WlVDY.js +0 -30
package/dist/webgpu_util-pLEV9tks.js +0 -80
package/dist/zeros-Bj5rMYA7.js +0 -52

package/dist/patches/PackedTensor.d.ts ADDED Viewed

@@ -0,0 +1,12 @@
+import { Rank } from '@tensorflow/tfjs-core/dist/types';
+import { Tensor, Variable } from '@tensorflow/tfjs-core/dist/tensor';
+import { TensorInfo } from '@tensorflow/tfjs-core/dist/tensor_info';
+export interface PackedTensorInfo extends TensorInfo {
+    packed?: boolean;
+}
+export declare class PackableTensor<R extends Rank = Rank> extends Tensor<R> implements PackedTensorInfo {
+    packed: boolean;
+}
+export declare class PackableVariable<R extends Rank = Rank> extends Variable<R> implements PackedTensorInfo {
+    packed: boolean;
+}

package/dist/patches/PackedTensor.js ADDED Viewed

@@ -0,0 +1,11 @@
+import { T as e, V as s } from "../tensor-DdQUJZlz.js";
+class r extends e {
+  packed = !1;
+}
+class c extends s {
+  packed = !1;
+}
+export {
+  r as PackableTensor,
+  c as PackableVariable
+};

package/dist/patches/engine.d.ts ADDED Viewed

@@ -0,0 +1,261 @@
+import { BackendTimingInfo, DataMover, KernelBackend } from '@tensorflow/tfjs-core/dist/backends/backend';
+import { Environment } from '@tensorflow/tfjs-core/dist/environment';
+import { NamedAttrMap } from '@tensorflow/tfjs-core/dist/kernel_registry';
+import { TensorInfo, DataId } from '@tensorflow/tfjs-core/dist/tensor_info';
+import { TapeNode } from '@tensorflow/tfjs-core/dist/tape';
+import { DataToGPUOptions, GPUData, Tensor, TensorTracker, Variable } from '@tensorflow/tfjs-core/dist/tensor';
+import { GradSaveFunc, NamedTensorMap, NamedVariableMap, TensorContainer } from '@tensorflow/tfjs-core/dist/tensor_types';
+import { BackendValues, DataType, DataValues } from '@tensorflow/tfjs-core/dist/types';
+/**
+ * A function that computes an output. The save function is for saving tensors
+ * computed in the forward pass, that we need in the backward pass.
+ */
+export type ForwardFunc<T> = (backend: KernelBackend, save?: GradSaveFunc) => T;
+/**
+ * @docalias (a: Tensor, b: Tensor,..., save?: Function) => {
+ *   value: Tensor,
+ *   gradFunc: (dy: Tensor, saved?: NamedTensorMap) => Tensor | Tensor[]
+ * }
+ */
+export type CustomGradientFunc<T extends Tensor> = (...inputs: Array<Tensor | GradSaveFunc>) => {
+    value: T;
+    gradFunc: (dy: T, saved: Tensor[]) => Tensor | Tensor[];
+};
+export type MemoryInfo = {
+    numTensors: number;
+    numDataBuffers: number;
+    numBytes: number;
+    unreliable?: boolean;
+    reasons: string[];
+};
+type KernelInfo = {
+    name: string;
+    bytesAdded: number;
+    totalBytesSnapshot: number;
+    tensorsAdded: number;
+    totalTensorsSnapshot: number;
+    inputShapes: number[][];
+    outputShapes: number[][];
+    kernelTimeMs: number | {
+        error: string;
+    } | Promise<number | {
+        error: string;
+    }>;
+    extraInfo: string | Promise<string>;
+};
+export type ProfileInfo = {
+    newBytes: number;
+    newTensors: number;
+    peakBytes: number;
+    kernels: KernelInfo[];
+    result: TensorContainer;
+    kernelNames: string[];
+};
+export interface TimingInfo extends BackendTimingInfo {
+    wallMs: number;
+}
+/** @docalias Function */
+export type ScopeFn<T extends TensorContainer> = () => T;
+interface ScopeState {
+    track: Tensor[];
+    name: string;
+    id: number;
+}
+declare class EngineState {
+    registeredVariables: NamedVariableMap;
+    nextTapeNodeId: number;
+    numBytes: number;
+    numTensors: number;
+    numStringTensors: number;
+    numDataBuffers: number;
+    activeTape: TapeNode[];
+    gradientDepth: number;
+    kernelDepth: number;
+    activeScope: ScopeState;
+    scopeStack: ScopeState[];
+    /**
+     * Keeps track of the number of data moves during a kernel execution. We
+     * maintain a stack since kernels can call other kernels, recursively.
+     */
+    numDataMovesStack: number[];
+    nextScopeId: number;
+    tensorInfo: WeakMap<object, {
+        backend: KernelBackend;
+        bytes: number;
+        dtype: DataType;
+        shape: number[];
+    }>;
+    profiling: boolean;
+    activeProfile: ProfileInfo;
+    dispose(): void;
+}
+export declare class Engine implements TensorTracker, DataMover {
+    ENV: Environment;
+    version: string;
+    state: EngineState;
+    backendName: string;
+    registry: {
+        [id: string]: KernelBackend;
+    };
+    registryFactory: {
+        [id: string]: {
+            factory: () => KernelBackend | Promise<KernelBackend>;
+            priority: number;
+        };
+    };
+    private profiler;
+    private backendInstance;
+    private pendingBackendInit;
+    private pendingBackendInitId;
+    constructor(ENV: Environment);
+    ready(): Promise<void>;
+    get backend(): KernelBackend;
+    backendNames(): string[];
+    findBackend(backendName: string): KernelBackend;
+    findBackendFactory(backendName: string): () => KernelBackend | Promise<KernelBackend>;
+    registerBackend(backendName: string, factory: () => KernelBackend | Promise<KernelBackend>, priority?: number): boolean;
+    setBackend(backendName: string): Promise<boolean>;
+    private setupRegisteredKernels;
+    private disposeRegisteredKernels;
+    /**
+     * Initializes a backend by looking up the backend name in the factory
+     * registry and calling the factory method. Returns a boolean representing
+     * whether the initialization of the backend succeeded. Throws an error if
+     * there is no backend in the factory registry.
+     */
+    private initializeBackend;
+    removeBackend(backendName: string): void;
+    private getSortedBackends;
+    private initializeBackendsAndReturnBest;
+    moveData(backend: KernelBackend, dataId: DataId): void;
+    tidy<T extends TensorContainer>(nameOrFn: string | ScopeFn<T>, fn?: ScopeFn<T>): T;
+    private scopedRun;
+    private static nextTensorId;
+    private nextTensorId;
+    private static nextVariableId;
+    private nextVariableId;
+    /**
+     * This method is called instead of the public-facing tensor.clone() when
+     * saving a tensor for backwards pass. It makes sure to add the clone
+     * operation to the tape regardless of being called inside a kernel
+     * execution.
+     */
+    private clone;
+    /**
+     * Execute a kernel with the given name and return the output tensor.
+     *
+     * @param kernelName The name of the kernel to execute.
+     * @param inputs A map of input names to tensors.
+     * @param attrs A map of attribute names to their values. An attribute is a
+     *     primitive (non-tensor) input to the kernel.
+     * @param inputsToSave A list of tensors, inputs to save for the backprop
+     *     computation.
+     * @param outputsToSave A list of booleans, specifying which output to save
+     *     for the backprop computation. These are booleans since the output
+     * tensors are not visible to the user.
+     */
+    runKernel<T extends Tensor | Tensor[]>(kernelName: string, inputs: NamedTensorMap, attrs?: NamedAttrMap): T;
+    private shouldCheckForMemLeaks;
+    private checkKernelForMemLeak;
+    /**
+     * Internal helper method to execute a kernel Func
+     *
+     * Use `runKernel` to execute kernels from outside of engine.
+     */
+    private runKernelFunc;
+    /**
+     * Saves tensors used in forward mode for use in backward mode.
+     *
+     * @param tensors the list of tensors to save.
+     */
+    private saveTensorsForBackwardMode;
+    /**
+     * Returns a list of tensors to save for a given gradient calculation.
+     *
+     * @param kernelName name of kernel to look up gradient for.
+     * @param inputs a map of input tensors.
+     * @param outputs an array of output tensors from forward mode of kernel.
+     */
+    private getTensorsForGradient;
+    /**
+     * Internal method used by public APIs for tensor creation. Makes a new
+     * tensor with the provided shape, dtype and values. It always
+     * creates a new data id and writes the values to the underlying backend.
+     */
+    makeTensor(values: DataValues, shape: number[], dtype: DataType, backend?: KernelBackend): Tensor;
+    /**
+     * Internal method used by backends. Makes a new tensor
+     * that is a wrapper around an existing data id. It doesn't create
+     * a new data id, only increments the ref count used in memory tracking.
+     * @deprecated
+     */
+    makeTensorFromDataId(dataId: DataId, shape: number[], dtype: DataType, backend?: KernelBackend): Tensor;
+    /**
+     * Internal method used by backends. Makes a new tensor that is a wrapper
+     * around an existing data id in TensorInfo. It doesn't create a new data id,
+     * only increments the ref count used in memory tracking.
+     */
+    makeTensorFromTensorInfo(tensorInfo: TensorInfo, backend?: KernelBackend): Tensor;
+    makeVariable(initialValue: Tensor, trainable?: boolean, name?: string, dtype?: DataType): Variable;
+    trackTensor(a: Tensor, backend: KernelBackend): void;
+    incRef(a: Tensor, backend: KernelBackend): void;
+    removeDataId(dataId: DataId, backend: KernelBackend): void;
+    disposeTensor(a: Tensor): void;
+    disposeVariables(): void;
+    disposeVariable(v: Variable): void;
+    memory(): MemoryInfo;
+    profile(query: () => TensorContainer | Promise<TensorContainer>): Promise<ProfileInfo>;
+    isTapeOn(): boolean;
+    private addTapeNode;
+    keep<T extends Tensor>(result: T): T;
+    private startTape;
+    private endTape;
+    /**
+     * Start a scope. Use this with endScope() to achieve the same functionality
+     * as scope() without the need for a function closure.
+     */
+    startScope(name?: string): void;
+    /**
+     * End a scope. Use this with startScope() to achieve the same functionality
+     * as scope() without the need for a function closure.
+     */
+    endScope(result?: TensorContainer): void;
+    /**
+     * Returns gradients of `f` with respect to each of the `xs`. The gradients
+     * returned are of the same length as `xs`, but some might be null if `f`
+     * was not a function of that `x`. It also takes optional dy to multiply the
+     * gradient, which defaults to `1`.
+     */
+    gradients<T extends Tensor>(f: () => T, xs: Tensor[], dy?: T, allowNoGradients?: boolean): {
+        value: T;
+        grads: Tensor[];
+    };
+    customGrad<T extends Tensor>(f: CustomGradientFunc<T>): (...args: Array<Tensor>) => T;
+    readSync(dataId: DataId): BackendValues;
+    read(dataId: DataId): Promise<BackendValues>;
+    readToGPU(dataId: DataId, options?: DataToGPUOptions): GPUData;
+    time(query: () => void): Promise<TimingInfo>;
+    /**
+     * Tracks a Tensor in the current scope to be automatically cleaned up
+     * when the current scope ends, and returns the value.
+     *
+     * @param result The Tensor to track in the current scope.
+     */
+    private track;
+    get registeredVariables(): NamedVariableMap;
+    /**
+     * Resets the engine state. Removes all backends but does not remove
+     * registered backend factories.
+     */
+    reset(): void;
+}
+export declare function getOrMakeEngine(): Engine;
+export declare const ENGINE: Engine;
+/**
+ * A implementation of the add op for use within engine and tape.
+ *
+ * This allows us to avoid a circular dependency between add.ts and engine.
+ * It is exported to be available in tape tests.
+ */
+export declare function add(a: Tensor, b: Tensor): Tensor;
+export {};

package/dist/patches/engine.js ADDED Viewed

@@ -0,0 +1,10 @@
+import "../tensor_util-DV-FP5Q3.js";
+import "../tensor-DdQUJZlz.js";
+import "./PackedTensor.js";
+import { a as t, E, c as g, g as m } from "../utilities/packed.js";
+export {
+  t as ENGINE,
+  E as Engine,
+  g as add,
+  m as getOrMakeEngine
+};

package/dist/patches/tape.d.ts ADDED Viewed

@@ -0,0 +1,12 @@
+import { Tensor } from '@tensorflow/tfjs-core/dist/tensor';
+import { TapeNode } from '@tensorflow/tfjs-core/dist/tape';
+/**
+ * Backpropagate gradients through the filtered TapeNodes.
+ *
+ * @param tensorAccumulatedGradientMap A map of Tensor to its gradient. This map
+ * is mutated by this method.
+ * @param filteredTape The filtered TapeNodes to backprop through.
+ */
+export declare function backpropagateGradients(tensorAccumulatedGradientMap: {
+    [tensorId: number]: Tensor;
+}, filteredTape: TapeNode[], tidy: (f: Function) => Tensor, add: (a: Tensor, b: Tensor) => Tensor): void;

package/dist/patches/tape.js ADDED Viewed

@@ -0,0 +1,5 @@
+import { b as p } from "../utilities/packed.js";
+import "../tensor-DdQUJZlz.js";
+export {
+  p as backpropagateGradients
+};

package/dist/patches/webgpu_backend.d.ts ADDED Viewed

@@ -0,0 +1,18 @@
+import { DataType, TensorInfo } from '@tensorflow/tfjs-core';
+import { WebGPUBackend } from '@tensorflow/tfjs-backend-webgpu/dist/webgpu';
+import { WebGPUProgram } from './webgpu_program';
+type ProgramUniform = Array<{
+    type: string;
+    data: number[];
+}>;
+interface ExtendedAdapterInfo extends GPUAdapterInfo {
+    subgroupMaxSize?: number;
+    subgroupMinSize?: number;
+}
+export default class WebGPUBackendPatch extends WebGPUBackend {
+    readonly subgroupMaxSize: number;
+    readonly subgroupMinSize: number;
+    constructor(device: GPUDevice, adapterInfo?: ExtendedAdapterInfo);
+    runWebGPUProgram(program: WebGPUProgram, inputs: TensorInfo[], outputDtype: DataType, programDefinedUniform?: ProgramUniform, output?: TensorInfo): TensorInfo;
+}
+export {};

package/dist/patches/webgpu_backend.js ADDED Viewed

@@ -0,0 +1,57 @@
+import "../index-ZyQhjEPo.js";
+import "../webgpu_util-BBCnKm2X.js";
+import { W as c } from "../backend_webgpu-B0u2ndUn.js";
+import { compileProgram as l } from "./webgpu_program.js";
+import { m } from "../webgpu_program-Cigz-7RF.js";
+import { s as P, g as y, e as M, a as n } from "../tensor-DdQUJZlz.js";
+const b = (h, s) => {
+  const i = h.limits.maxComputeWorkgroupsPerDimension, t = s.dispatchLayout, a = s.dispatch;
+  if (a.every((r) => r <= i))
+    return a;
+  n(
+    a[0] > i && t.y === void 0 && t.z === void 0,
+    () => "Dispatch size exceeds WebGPU limits in Y or Z dimension."
+  );
+  let e = Math.ceil(Math.sqrt(a[0]));
+  return e > i ? (e = Math.ceil(Math.cbrt(a[0])), n(
+    e <= i,
+    () => "Total dispatch size exceeds WebGPU maximum."
+  ), [e, e, e]) : [e, e, 1];
+};
+class U extends c {
+  subgroupMaxSize;
+  subgroupMinSize;
+  constructor(s, i) {
+    super(s, i), this.subgroupMaxSize = i?.subgroupMaxSize ?? 0, this.subgroupMinSize = i?.subgroupMinSize ?? 0;
+  }
+  runWebGPUProgram(s, i, t, a, e) {
+    if (e || (e = this.makeTensorInfo(s.outputShape, t)), P(e.shape) === 0)
+      return this.tensorMap.get(e.dataId).values = y(e.dtype, 0), e;
+    this.uploadToGPU(e.dataId), s.dispatch = b(this.device, s);
+    const r = i.map((o, p) => {
+      if (o.dtype === "complex64")
+        throw new Error(
+          "GPGPUProgram does not support complex64 input. For complex64 dtypes, please separate the program into real and imaginary parts."
+        );
+      return this.uploadToGPU(o.dataId), {
+        // Returning dtype from tensorMap because it reflects dtype
+        // of underlying buffer, rather than abstract dtype.
+        dtype: this.tensorMap.get(o.dataId).dtype,
+        shape: o.shape,
+        name: s.variableNames[p]
+      };
+    });
+    s.shaderKey = m(s, r, e);
+    const d = M().getBool("WEBGPU_ENGINE_COMPILE_ONLY");
+    return s.shaderKey in this.pipelineCache || (this.pipelineCache[s.shaderKey] = l(
+      this.device,
+      s,
+      r,
+      e,
+      d
+    )), s.pipeline = this.pipelineCache[s.shaderKey], d || this.recordAndSubmit(s, e, i, a), e;
+  }
+}
+export {
+  U as default
+};

package/dist/{tensor-CZr4dh61.js → patches/webgpu_base.d.ts} RENAMED Viewed

@@ -1,7 +1,6 @@
-import { C as t, D as a } from "./index-BzFyqcy-.js";
 /**
  * @license
- * Copyright 2018 Google LLC. All Rights Reserved.
+ * Copyright 2022 Google Inc. All Rights Reserved.
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
  * You may obtain a copy of the License at
@@ -15,10 +14,8 @@ import { C as t, D as a } from "./index-BzFyqcy-.js";
  * limitations under the License.
  * =============================================================================
  */
-function f(r, n, e) {
-  const o = t(r, e);
-  return a(r, n, o, e);
+export interface GPUOptions {
+    powerPreference?: 'low-power' | 'high-performance';
+    disableSubgroups?: boolean;
 }
-export {
-  f as t
-};
+export declare function registerWebGPUBackend(options?: GPUOptions): void;

package/dist/patches/webgpu_base.js ADDED Viewed

@@ -0,0 +1,34 @@
+import { f as n } from "../index-ZyQhjEPo.js";
+import p from "./webgpu_backend.js";
+function c(a) {
+  n(
+    "webgpu",
+    async () => {
+      const i = {
+        powerPreference: a?.powerPreference ?? "high-performance"
+      };
+      console.log("Using custom WebGPU backend with power preference:", i.powerPreference);
+      const e = await navigator.gpu.requestAdapter(i), t = {}, o = [];
+      e.features.has("timestamp-query") && o.push("timestamp-query"), e.features.has("bgra8unorm-storage") && o.push(["bgra8unorm-storage"]), !a?.disableSubgroups && e.features.has("subgroups") && o.push("subgroups"), t.requiredFeatures = o;
+      const r = e.limits;
+      t.requiredLimits = {
+        maxComputeWorkgroupStorageSize: r.maxComputeWorkgroupStorageSize,
+        maxComputeWorkgroupsPerDimension: r.maxComputeWorkgroupsPerDimension,
+        maxStorageBufferBindingSize: r.maxStorageBufferBindingSize,
+        maxBufferSize: r.maxBufferSize,
+        maxComputeWorkgroupSizeX: r.maxComputeWorkgroupSizeX,
+        maxComputeInvocationsPerWorkgroup: r.maxComputeInvocationsPerWorkgroup
+      };
+      const u = await e.requestDevice(t), s = "info" in e ? e.info : "requestAdapterInfo" in e ? (
+        // eslint-disable-next-line @typescript-eslint/no-explicit-any
+        await e.requestAdapterInfo()
+      ) : void 0;
+      return new p(u, s);
+    },
+    3
+    /*priority*/
+  );
+}
+export {
+  c as registerWebGPUBackend
+};

package/dist/patches/webgpu_program.d.ts ADDED Viewed

@@ -0,0 +1,36 @@
+import { DataType, TensorInfo } from '@tensorflow/tfjs-core';
+export declare enum PixelsOpType {
+    FROM_PIXELS = 0,
+    DRAW = 1
+}
+export interface WebGPUProgram {
+    atomic?: boolean;
+    subgroups?: boolean;
+    subgroupBuiltins?: boolean;
+    dispatch: [number, number, number];
+    dispatchLayout: {
+        x: number[];
+        y?: number[];
+        z?: number[];
+    };
+    outputComponent?: number;
+    outputShape: number[];
+    pixelsOpType?: PixelsOpType;
+    shaderKey: string;
+    size?: boolean;
+    uniforms?: string;
+    variableNames: string[];
+    variableComponents?: number[];
+    workgroupSize: [number, number, number];
+    workPerThread?: number;
+    pipeline?: GPUComputePipeline | Promise<GPUComputePipeline>;
+    getUserCode: () => string;
+}
+export declare const compileProgram: (device: GPUDevice, program: WebGPUProgram, inputsData: InputInfo[], output: TensorInfo, parallelCompilation: boolean) => GPUComputePipeline | Promise<GPUComputePipeline>;
+type InputInfo = {
+    dtype: DataType;
+    shape: number[];
+    name: string;
+};
+export declare function getStartHeaderString(useGlobalIndex: boolean, program: WebGPUProgram): string;
+export {};