npm - @genai-fi/nanogpt - Versions diffs - 0.10.2 → 0.10.3 - Mend

@genai-fi/nanogpt 0.10.2 → 0.10.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (249) hide show

package/dist/Generator.js +11761 -171
package/dist/{RealDiv-zz7FpkKX.js → RealDiv-KAPDe8zB.js} +23 -25
package/dist/Reshape-BYkmUnAv.js +14 -0
package/dist/{Reshape-CHdUjC72.js → Reshape-Zt6eb7yh.js} +18 -20
package/dist/TeachableLLM.js +10 -11
package/dist/{axis_util-BsIr9ZNu.js → axis_util-BaG7mf5A.js} +3 -3
package/dist/backend.js +2 -2
package/dist/{backend_util-B1XRLuq9.js → backend_util-RCe-rHaj.js} +72 -73
package/dist/{backend_webgpu-CqpfEImu.js → backend_webgpu-DE3ACOLx.js} +45 -47
package/dist/broadcast_to-B3eYlZm7.js +28 -0
package/dist/checks/appendCache.js +2 -2
package/dist/checks/attentionMask.js +3 -3
package/dist/checks/gelu.js +2 -2
package/dist/checks/matMulGelu.js +7 -11
package/dist/checks/normRMS.js +9 -9
package/dist/checks/normRMSGrad.js +3 -3
package/dist/checks/packUnpack.js +2 -2
package/dist/checks/qkv.js +12 -13
package/dist/checks/rope.js +2 -2
package/dist/clip_by_value-BnO7-a88.js +12 -0
package/dist/complex-DjxcVmoX.js +11 -0
package/dist/concat-BV8bt5H-.js +17 -0
package/dist/{concat_util-iBYIyuQe.js → concat_util-DpW8mL_l.js} +1 -1
package/dist/{dataset-D2P7rHAw.js → dataset-BcwmTGYc.js} +137 -139
package/dist/dropout-BcvN9JYi.js +92 -0
package/dist/expand_dims-DT4tEPwA.js +11 -0
package/dist/{exports_initializers-CZSUJoVE.js → exports_initializers-Hta_rEnm.js} +1 -1
package/dist/floor-D5QdR_le.js +9 -0
package/dist/gather-D3JcZUaI.js +9 -0
package/dist/{gelu-Bmhopi0J.js → gelu-CjNPL4OH.js} +10 -11
package/dist/{gpgpu_math-DsCcikas.js → gpgpu_math-DAOmgtXR.js} +841 -1015
package/dist/{index-DRyE072i.js → index-BwexR4lA.js} +262 -263
package/dist/index-DOvlwCh-.js +3520 -0
package/dist/{kernel_funcs_utils-CWfOAPGO.js → kernel_funcs_utils-CCzYdUZg.js} +130 -132
package/dist/layers/BaseLayer.js +15 -16
package/dist/layers/CausalSelfAttention.js +6 -6
package/dist/layers/MLP.js +4 -4
package/dist/layers/PositionEmbedding.js +7 -7
package/dist/layers/RMSNorm.js +3 -3
package/dist/layers/RoPECache.js +9 -9
package/dist/layers/TiedEmbedding.js +6 -6
package/dist/layers/TransformerBlock.js +1 -1
package/dist/loader/loadTransformers.js +1 -1
package/dist/loader/oldZipLoad.js +13 -14
package/dist/log_sum_exp-ngO0-4pK.js +39 -0
package/dist/main.js +49 -50
package/dist/{matMul16-fEAJ4smh.js → matMul16-BWRSOCWB.js} +14 -15
package/dist/matMulGelu-CzfgT6Wq.js +163 -0
package/dist/mat_mul-SjpJRLyL.js +11 -0
package/dist/mod-AnXEvvpo.js +11 -0
package/dist/models/NanoGPTV1.js +2 -2
package/dist/models/model.js +13 -14
package/dist/ones-D2rT0xk2.js +14 -0
package/dist/ops/adamAdjust.js +1 -1
package/dist/ops/adamMoments.js +1 -1
package/dist/ops/add16.js +1 -1
package/dist/ops/appendCache.js +3 -3
package/dist/ops/attentionMask.js +1 -1
package/dist/ops/concat16.js +2 -2
package/dist/ops/cpu/adamAdjust.js +13 -14
package/dist/ops/cpu/adamMoments.js +6 -7
package/dist/ops/cpu/appendCache.js +7 -8
package/dist/ops/cpu/attentionMask.js +7 -7
package/dist/ops/cpu/fusedSoftmax.js +10 -11
package/dist/ops/cpu/gatherSub.js +9 -10
package/dist/ops/cpu/gelu.js +9 -10
package/dist/ops/cpu/matMul16.js +6 -7
package/dist/ops/cpu/matMulGelu.js +5 -6
package/dist/ops/cpu/matMulMul.js +3 -4
package/dist/ops/cpu/mulDropout.js +3 -4
package/dist/ops/cpu/normRMS.js +10 -11
package/dist/ops/cpu/qkv.js +8 -9
package/dist/ops/cpu/rope.js +5 -6
package/dist/ops/cpu/scatterSub.js +17 -19
package/dist/ops/dot16.js +2 -2
package/dist/ops/gatherSub.js +1 -1
package/dist/ops/gelu.js +2 -2
package/dist/ops/grads/add16.js +11 -12
package/dist/ops/grads/attentionMask.js +5 -6
package/dist/ops/grads/gelu.js +3 -4
package/dist/ops/grads/matMul16.js +4 -5
package/dist/ops/grads/matMulGelu.js +9 -10
package/dist/ops/grads/normRMS.js +7 -8
package/dist/ops/grads/pack16.js +4 -5
package/dist/ops/grads/qkv.js +17 -19
package/dist/ops/grads/rope.js +3 -5
package/dist/ops/grads/softmax16.js +3 -4
package/dist/ops/grads/unpack16.js +3 -4
package/dist/ops/grads/utils.d.ts +1 -0
package/dist/ops/grads/utils.js +8 -4
package/dist/ops/matMul16.js +3 -3
package/dist/ops/matMulGelu.js +2 -2
package/dist/ops/matMulMul.js +1 -1
package/dist/ops/mul16.js +1 -1
package/dist/ops/mulDrop.js +1 -1
package/dist/ops/normRMS.js +1 -1
package/dist/ops/pack16.js +3 -4
package/dist/ops/qkv.js +4 -8
package/dist/ops/reshape16.js +14 -16
package/dist/ops/rope.d.ts +1 -1
package/dist/ops/rope.js +3 -8
package/dist/ops/scatterSub.js +1 -1
package/dist/ops/slice16.js +2 -2
package/dist/ops/softmax16.js +5 -8
package/dist/ops/sub16.js +1 -1
package/dist/ops/sum16.js +2 -2
package/dist/ops/transpose16.js +23 -24
package/dist/ops/unpack16.js +2 -2
package/dist/ops/webgl/adamAdjust.js +2 -3
package/dist/ops/webgl/adamMoments.js +1 -2
package/dist/ops/webgl/appendCache.js +1 -2
package/dist/ops/webgl/attentionMask.js +4 -5
package/dist/ops/webgl/fusedSoftmax.js +4 -6
package/dist/ops/webgl/gatherSub.js +6 -7
package/dist/ops/webgl/gelu.js +2 -3
package/dist/ops/webgl/log.js +11 -12
package/dist/ops/webgl/matMul16.js +10 -11
package/dist/ops/webgl/matMulGelu.js +7 -111
package/dist/ops/webgl/matMulMul.js +9 -10
package/dist/ops/webgl/mulDropout.js +8 -9
package/dist/ops/webgl/normRMS.js +2 -3
package/dist/ops/webgl/qkv.js +5 -6
package/dist/ops/webgl/rope.js +7 -8
package/dist/ops/webgl/scatterSub.js +5 -6
package/dist/ops/webgpu/adamAdjust.js +10 -12
package/dist/ops/webgpu/adamMoments.js +8 -10
package/dist/ops/webgpu/add16.js +8 -9
package/dist/ops/webgpu/appendCache.js +23 -25
package/dist/ops/webgpu/attentionMask.js +8 -10
package/dist/ops/webgpu/attentionMask32_program.js +2 -2
package/dist/ops/webgpu/concat16.js +12 -14
package/dist/ops/webgpu/gatherSub.js +11 -13
package/dist/ops/webgpu/gelu.js +28 -29
package/dist/ops/webgpu/matMul16.js +26 -28
package/dist/ops/webgpu/matMul16_program.js +4 -5
package/dist/ops/webgpu/mul16.js +9 -10
package/dist/ops/webgpu/normRMS.js +15 -17
package/dist/ops/webgpu/normRMSGrad.js +21 -28
package/dist/ops/webgpu/pack16.js +12 -13
package/dist/ops/webgpu/pack16_program.js +2 -2
package/dist/ops/webgpu/qkv.js +16 -18
package/dist/ops/webgpu/rope.js +25 -27
package/dist/ops/webgpu/scatterSub.js +7 -9
package/dist/ops/webgpu/slice16.js +21 -23
package/dist/ops/webgpu/softmax16.js +17 -19
package/dist/ops/webgpu/softmax16_program.js +2 -2
package/dist/ops/webgpu/softmax16_subgroup_program.js +2 -2
package/dist/ops/webgpu/softmax16grad.js +7 -8
package/dist/ops/webgpu/sub16.js +7 -8
package/dist/ops/webgpu/sum16.js +18 -20
package/dist/ops/webgpu/transpose16.js +19 -20
package/dist/ops/webgpu/transpose16_program.js +2 -2
package/dist/ops/webgpu/transpose16_shared_program.js +11 -12
package/dist/ops/webgpu/unpack16.js +3 -4
package/dist/ops/webgpu/utils/binary_op.js +7 -8
package/dist/ops/webgpu/utils/reductions.js +14 -22
package/dist/ops-B5yanEdW.js +476 -0
package/dist/pack16-nQ6JaLo-.js +39 -0
package/dist/patches/webgpu_backend.js +19 -20
package/dist/patches/webgpu_base.js +1 -1
package/dist/patches/webgpu_program.js +21 -22
package/dist/{random_width-BVV9HveY.js → random_width-or-CEftb.js} +2506 -2761
package/dist/range-BklejeeW.js +10 -0
package/dist/relu-CP0ZcxWO.js +9 -0
package/dist/reshape-ByE68wS9.js +9 -0
package/dist/resize_nearest_neighbor-B19mCEg2.js +175 -0
package/dist/rope-Ir4mTyD1.js +24 -0
package/dist/{scatter_nd_util-C7zXRT_h.js → scatter_nd_util-lvSiX8q4.js} +1 -1
package/dist/selu_util-kbhpTdYD.js +44 -0
package/dist/{shared-CHhxz-O5.js → shared-DT1TkE6w.js} +1 -1
package/dist/{shared-D2NP_CpY.js → shared-dntlHIDQ.js} +343 -345
package/dist/slice-BfEGSH82.js +12 -0
package/dist/{slice_util-DyjSAD0u.js → slice_util-uTKwiEpW.js} +1 -1
package/dist/{softmax-C9JQEtnO.js → softmax-CA5jFsLR.js} +4 -5
package/dist/split-CVLc0w--.js +9 -0
package/dist/squeeze-C7Z2srUo.js +10 -0
package/dist/stack-Cf4n9h0N.js +11 -0
package/dist/step-CINUs5QB.js +261 -0
package/dist/sum-DWAtNGez.js +11 -0
package/dist/tensor-DJoc7gJU.js +8 -0
package/dist/tensor1d-D11P_7Dp.js +11 -0
package/dist/{tensor2d-CSB4KOb0.js → tensor2d-Bs9wZRc7.js} +6 -7
package/dist/{tensor4d-D7bLqGqz.js → tensor4d-BARPdTaS.js} +6 -7
package/dist/{tfjs_backend-CNkSTL0c.js → tfjs_backend-y1cvNhLA.js} +255 -264
package/dist/tile-mbfagpsB.js +11 -0
package/dist/training/Adam.js +2 -2
package/dist/training/AdamExt.js +1 -1
package/dist/training/DatasetBuilder.js +2 -2
package/dist/training/FullTrainer.js +1 -1
package/dist/training/Trainer.js +2 -2
package/dist/training/sparseCrossEntropy.js +5 -5
package/dist/transpose-ClWiBS_b.js +36 -0
package/dist/unsorted_segment_sum-BDDhB_E6.js +277 -0
package/dist/utilities/dummy.js +3 -3
package/dist/utilities/multinomialCPU.js +2 -2
package/dist/utilities/packed.d.ts +1 -4
package/dist/utilities/packed.js +10 -745
package/dist/utilities/performance.js +1 -1
package/dist/utilities/profile.js +1 -1
package/dist/utilities/safetensors.js +2 -2
package/dist/utilities/sentences.js +5 -5
package/dist/utilities/weights.js +2 -2
package/dist/{variable-DzfrwYuP.js → variable-WawDEaAb.js} +1 -1
package/dist/{webgpu_program-DzaQiqel.js → webgpu_program-DuOXPQol.js} +178 -172
package/dist/{webgpu_util-0_ubCEHJ.js → webgpu_util-RxEF33Rj.js} +34 -35
package/dist/zeros-KnWaWf-X.js +13 -0
package/dist/zeros_like-DvE73F4e.js +721 -0
package/package.json +4 -2
package/dist/Reshape-CDVLyVfz.js +0 -16
package/dist/broadcast_to-B0ChcDaz.js +0 -30
package/dist/complex-BBiRlsVq.js +0 -13
package/dist/concat-DmBLPVGC.js +0 -19
package/dist/dropout-B1x1kYMa.js +0 -99
package/dist/expand_dims-ouvfxQ1n.js +0 -13
package/dist/gather-CH9sdacz.js +0 -10
package/dist/index-D6Q1lPZO.js +0 -2157
package/dist/log_sum_exp-D3ftBNY5.js +0 -41
package/dist/mat_mul-C59XWcJd.js +0 -12
package/dist/mod-DESSvHIU.js +0 -12
package/dist/mulmat_packed_gpu-Coh6qbJk.js +0 -55
package/dist/ones-jU9jlQvM.js +0 -15
package/dist/ops-BFDtP6th.js +0 -645
package/dist/pack16-CmVZs6af.js +0 -41
package/dist/patches/PackedTensor.d.ts +0 -12
package/dist/patches/PackedTensor.js +0 -11
package/dist/patches/engine.d.ts +0 -261
package/dist/patches/engine.js +0 -12
package/dist/patches/tape.d.ts +0 -12
package/dist/patches/tape.js +0 -5
package/dist/range-ZZZD60Fx.js +0 -11
package/dist/reciprocal-CrYlsAGD.js +0 -10
package/dist/register_all_kernels-nvj2k7OC.js +0 -12307
package/dist/relu-BYDneVPn.js +0 -10
package/dist/reshape-CaPQzFvz.js +0 -10
package/dist/rope-s4W2XO9B.js +0 -32
package/dist/selu_util-BGPXmd4B.js +0 -303
package/dist/sin-Djs4aQiu.js +0 -16
package/dist/slice-DvovR5wq.js +0 -13
package/dist/split-DBck65sX.js +0 -10
package/dist/squeeze-C00Ipm_7.js +0 -11
package/dist/stack-ChnHwRpX.js +0 -13
package/dist/sum-ywRJj3Zr.js +0 -12
package/dist/tensor-0r5yOo2R.js +0 -8
package/dist/tensor-CzmOBsdf.js +0 -909
package/dist/tensor1d-BlUT89BP.js +0 -12
package/dist/tensor_util-DfwaWayG.js +0 -523
package/dist/tile-CR074jmp.js +0 -13
package/dist/transpose-DH4gmHvu.js +0 -38
package/dist/zeros-DBFVbpv5.js +0 -14

package/dist/loader/oldZipLoad.js CHANGED Viewed

@@ -1,22 +1,22 @@
-import "../utilities/packed.js";
-import { H as y } from "../index-D6Q1lPZO.js";
+import { ae as y } from "../index-DOvlwCh-.js";
+import "../random_width-or-CEftb.js";
+import "../zeros_like-DvE73F4e.js";
+import "../Generator.js";
+import "../index-Cp39cXWe.js";
+import "../dataset-BcwmTGYc.js";
 import "../ops/cpu/attentionMask.js";
 import "../ops/webgl/attentionMask.js";
 import "../ops/grads/attentionMask.js";
-import "../random_width-BVV9HveY.js";
-import "../register_all_kernels-nvj2k7OC.js";
-import "../index-Cp39cXWe.js";
-import "../dataset-D2P7rHAw.js";
 import "../ops/cpu/rope.js";
 import "../ops/webgl/rope.js";
-import "../rope-s4W2XO9B.js";
+import "../rope-Ir4mTyD1.js";
 import "../ops/cpu/appendCache.js";
 import "../ops/webgl/appendCache.js";
 import "../ops/grads/softmax16.js";
-import "../matMul16-fEAJ4smh.js";
+import "../matMul16-BWRSOCWB.js";
 import "../ops/webgl/matMul16.js";
 import "../ops/cpu/matMul16.js";
-import "../pack16-CmVZs6af.js";
+import "../pack16-nQ6JaLo-.js";
 import "../ops/transpose16.js";
 import "../ops/reshape16.js";
 import "../ops/cpu/qkv.js";
@@ -35,7 +35,6 @@ import h from "../tokeniser/CharTokeniser.js";
 import k from "../tokeniser/bpe.js";
 import { dummyPassAsync as g } from "../utilities/dummy.js";
 import b from "../models/factory.js";
-import "../Generator.js";
 import "../index-DvYrXKkX.js";
 import "../ops/cpu/adamAdjust.js";
 import "../ops/webgl/adamAdjust.js";
@@ -43,16 +42,16 @@ import "../ops/cpu/adamMoments.js";
 import "../ops/webgl/adamMoments.js";
 import "../papaparse.min-C0cScC2i.js";
 import "../ops/cpu/matMulGelu.js";
-import "../ops/webgl/matMulGelu.js";
+import "../matMulGelu-CzfgT6Wq.js";
 import "../ops/grads/matMulGelu.js";
 import "../ops/cpu/gelu.js";
 import "../ops/webgl/gelu.js";
-import "../gelu-Bmhopi0J.js";
+import "../gelu-CjNPL4OH.js";
 import "../ops/webgl/log.js";
 import "../checks/normRMS.js";
 import "../checks/normRMSGrad.js";
 import { importWeights as u } from "../utilities/weights.js";
-async function Ot(r) {
+async function Mt(r) {
   const e = /* @__PURE__ */ new Map(), p = await r.file("manifest.json")?.async("string");
   if (!p)
     throw new Error("Manifest file not found in the zip archive");
@@ -75,5 +74,5 @@ async function Ot(r) {
   return await g(m), m.loadWeights(c), { model: m, tokeniser: f };
 }
 export {
-  Ot as default
+  Mt as default
 };

package/dist/log_sum_exp-ngO0-4pK.js ADDED Viewed

@@ -0,0 +1,39 @@
+import { A as r, B as x, E as p, am as E, an as $, ao as d, af as h, c as S, x as K } from "./index-DOvlwCh-.js";
+import { e as _ } from "./axis_util-BaG7mf5A.js";
+import { r as m } from "./reshape-ByE68wS9.js";
+import { s as T } from "./sum-DWAtNGez.js";
+function b(s, o = null, n = !1) {
+  const a = { x: x(s, "x", "max") }, e = { reductionIndices: o, keepDims: n };
+  return p.runKernel(E, a, e);
+}
+const A = /* @__PURE__ */ r({ max_: b });
+function I(s) {
+  const n = { x: x(s, "x", "exp") };
+  return p.runKernel($, n);
+}
+const M = /* @__PURE__ */ r({ exp_: I });
+function N(s) {
+  const n = { x: x(s, "x", "log", "float32") };
+  return p.runKernel(d, n);
+}
+const v = /* @__PURE__ */ r({ log_: N });
+function w(s, o = null, n = !1) {
+  const t = x(s, "x", "logSumExp"), a = h(o, t.shape), e = A(
+    t,
+    a,
+    !0
+    /* keepDims */
+  ), l = S(t, e), i = M(l), f = T(i, a), u = v(f), c = K(m(e, u.shape), u);
+  if (n) {
+    const g = _(c.shape, a);
+    return m(c, g);
+  }
+  return c;
+}
+const P = /* @__PURE__ */ r({ logSumExp_: w });
+export {
+  v as a,
+  M as e,
+  P as l,
+  A as m
+};

package/dist/main.js CHANGED Viewed

@@ -1,15 +1,18 @@
-import "./utilities/packed.js";
-import { default as ro } from "./models/NanoGPTV1.js";
-import { default as eo } from "./TeachableLLM.js";
-import { default as po } from "./tokeniser/CharTokeniser.js";
-import { default as ao } from "./tokeniser/bpe.js";
-import { default as fo } from "./utilities/waitForModel.js";
-import { default as no } from "./data/textLoader.js";
-import { default as uo } from "./Generator.js";
-import { default as To } from "./models/model.js";
-import { estimateMemoryUsage as go, estimateParameterCount as Mo, estimateResources as Po, estimateTrainingMemoryUsage as Co, validateConfig as Eo } from "./utilities/parameters.js";
-import { default as Bo } from "./utilities/topP.js";
-import "./index-D6Q1lPZO.js";
+import "./index-DOvlwCh-.js";
+import "./random_width-or-CEftb.js";
+import "./zeros_like-DvE73F4e.js";
+import { default as oo } from "./Generator.js";
+import "./index-Cp39cXWe.js";
+import "./dataset-BcwmTGYc.js";
+import { default as to } from "./models/NanoGPTV1.js";
+import { default as mo } from "./TeachableLLM.js";
+import { default as io } from "./tokeniser/CharTokeniser.js";
+import { default as so } from "./tokeniser/bpe.js";
+import { default as lo } from "./utilities/waitForModel.js";
+import { default as xo } from "./data/textLoader.js";
+import { default as co } from "./models/model.js";
+import { estimateMemoryUsage as ko, estimateParameterCount as go, estimateResources as Mo, estimateTrainingMemoryUsage as Po, validateConfig as Co } from "./utilities/parameters.js";
+import { default as ho } from "./utilities/topP.js";
 import "./ops/cpu/scatterSub.js";
 import "./ops/webgl/scatterSub.js";
 import "./ops/cpu/gatherSub.js";
@@ -20,21 +23,17 @@ import "./ops/grads/attentionMask.js";
 import "./ops/cpu/qkv.js";
 import "./ops/webgl/qkv.js";
 import "./ops/grads/qkv.js";
-import "./random_width-BVV9HveY.js";
-import "./register_all_kernels-nvj2k7OC.js";
-import "./index-Cp39cXWe.js";
-import "./dataset-D2P7rHAw.js";
 import "./ops/cpu/rope.js";
 import "./ops/webgl/rope.js";
-import "./rope-s4W2XO9B.js";
+import "./rope-Ir4mTyD1.js";
 import "./ops/cpu/appendCache.js";
 import "./ops/webgl/appendCache.js";
 import "./ops/cpu/matMulGelu.js";
-import "./ops/webgl/matMulGelu.js";
+import "./matMulGelu-CzfgT6Wq.js";
 import "./ops/grads/matMulGelu.js";
 import "./ops/cpu/gelu.js";
 import "./ops/webgl/gelu.js";
-import "./gelu-Bmhopi0J.js";
+import "./gelu-CjNPL4OH.js";
 import "./ops/cpu/normRMS.js";
 import "./ops/webgl/normRMS.js";
 import "./ops/grads/normRMS.js";
@@ -43,51 +42,51 @@ import "./ops/cpu/adamMoments.js";
 import "./ops/webgl/adamMoments.js";
 import "./ops/cpu/adamAdjust.js";
 import "./ops/webgl/adamAdjust.js";
-import { u as o, p as r } from "./pack16-CmVZs6af.js";
+import { u as o, p as r } from "./pack16-nQ6JaLo-.js";
 import "./ops/grads/softmax16.js";
-import "./matMul16-fEAJ4smh.js";
+import "./matMul16-BWRSOCWB.js";
 import "./ops/webgl/matMul16.js";
 import "./ops/cpu/matMul16.js";
 import "./ops/transpose16.js";
-import { selectBackend as yo } from "./backend.js";
-import { default as Ao } from "./utilities/performance.js";
+import { selectBackend as bo } from "./backend.js";
+import { default as Lo } from "./utilities/performance.js";
 import t from "./layers/CausalSelfAttention.js";
 import e from "./layers/MLP.js";
 import m from "./layers/TransformerBlock.js";
 import p from "./layers/RoPECache.js";
-import { default as Ro } from "./training/AdamExt.js";
-import { default as vo } from "./checks/index.js";
-import { sentenceEmbeddings as Do, sentenceEmbeddingsTensor as Fo } from "./utilities/sentences.js";
-const Z = {
+import { default as Go } from "./training/AdamExt.js";
+import { default as Uo } from "./checks/index.js";
+import { sentenceEmbeddings as wo, sentenceEmbeddingsTensor as Do } from "./utilities/sentences.js";
+const Y = {
   pack16: r,
   unpack16: o
-}, _ = {
+}, Z = {
   CausalSelfAttention: t,
   MLP: e,
   TransformerBlock: m,
   RoPECache: p
 };
 export {
-  Ro as AdamExt,
-  ao as BPETokeniser,
-  po as CharTokeniser,
-  uo as Generator,
-  To as Model,
-  ro as NanoGPT,
-  eo as TeachableLLM,
-  vo as checks,
-  go as estimateMemoryUsage,
-  Mo as estimateParameterCount,
-  Po as estimateResources,
-  Co as estimateTrainingMemoryUsage,
-  _ as layers,
-  no as loadTextData,
-  Z as ops,
-  Ao as performanceTest,
-  yo as selectBackend,
-  Do as sentenceEmbeddings,
-  Fo as sentenceEmbeddingsTensor,
-  Bo as topP,
-  Eo as validateConfig,
-  fo as waitForModel
+  Go as AdamExt,
+  so as BPETokeniser,
+  io as CharTokeniser,
+  oo as Generator,
+  co as Model,
+  to as NanoGPT,
+  mo as TeachableLLM,
+  Uo as checks,
+  ko as estimateMemoryUsage,
+  go as estimateParameterCount,
+  Mo as estimateResources,
+  Po as estimateTrainingMemoryUsage,
+  Z as layers,
+  xo as loadTextData,
+  Y as ops,
+  Lo as performanceTest,
+  bo as selectBackend,
+  wo as sentenceEmbeddings,
+  Do as sentenceEmbeddingsTensor,
+  ho as topP,
+  Co as validateConfig,
+  lo as waitForModel
 };

package/dist/{matMul16-fEAJ4smh.js → matMul16-BWRSOCWB.js} RENAMED Viewed

@@ -1,13 +1,12 @@
-import { e as y } from "./index-D6Q1lPZO.js";
+import { u as y, e as h } from "./index-DOvlwCh-.js";
 import "./ops/webgl/matMul16.js";
 import "./ops/cpu/matMul16.js";
-import { isPackedTensor as g, packTensor as k } from "./utilities/packed.js";
-import { p as v } from "./pack16-CmVZs6af.js";
-import { d as h } from "./gelu-Bmhopi0J.js";
+import { isPackedTensor as g } from "./utilities/packed.js";
+import { p as v } from "./pack16-nQ6JaLo-.js";
+import { d as k } from "./gelu-CjNPL4OH.js";
 import { transpose16 as S } from "./ops/transpose16.js";
 import { reshape16 as w } from "./ops/reshape16.js";
-import { a as G } from "./tensor_util-DfwaWayG.js";
-const T = {
+const G = {
   kernelName: "MatMul16",
   inputsToSave: ["A", "B"],
   outputsToSave: [],
@@ -30,7 +29,7 @@ const T = {
     }
     if (p === "gelu") {
       const u = e, m = l(s, t, f, i);
-      e = h(u, m), u.dispose(), m.dispose();
+      e = k(u, m), u.dispose(), m.dispose();
     }
     if (!f && !i)
       return {
@@ -50,12 +49,12 @@ const T = {
     throw new Error("Gradient for transposeA=true and transposeB=true is not supported yet.");
   }
 };
-G(T);
+y(G);
 function l(r, o, n = !1, s = !1, t = {}) {
-  const e = g(r), f = g(o), i = e || f, a = !i || e ? r : v(r), p = !i || f ? o : v(o), c = y().runKernel("MatMul16", { A: a, B: p }, { transposeA: n, transposeB: s, ...t });
-  return i && !e && a.dispose(), i && !f && p.dispose(), i ? k(c) : c;
+  const e = g(r), f = g(o), i = e || f, a = !i || e ? r : v(r), p = !i || f ? o : v(o), c = h().runKernel("MatMul16", { A: a, B: p }, { transposeA: n, transposeB: s, ...t });
+  return i && !e && a.dispose(), i && !f && p.dispose(), c;
 }
-function j(r, o, n, s = !1, t = !1) {
+function K(r, o, n, s = !1, t = !1) {
   return l(r, o, s, t, { scale: n });
 }
 function B(r, o, n, s = !1, t = !1) {
@@ -64,14 +63,14 @@ function B(r, o, n, s = !1, t = !1) {
 function M(r, o, n, s = !1, t = !1) {
   return l(r, o, s, t, { scaleB: n });
 }
-function q(r, o, n = !1, s = !1) {
+function N(r, o, n = !1, s = !1) {
   return l(r, o, n, s, { activation: "gelu" });
 }
 export {
-  T as a,
+  G as a,
   l as b,
-  q as c,
+  N as c,
   B as d,
   M as e,
-  j as m
+  K as m
 };

package/dist/matMulGelu-CzfgT6Wq.js ADDED Viewed

@@ -0,0 +1,163 @@
+import { p as C, t as R, e as I, h as G, a3 as L, l as F, ak as U } from "./index-DOvlwCh-.js";
+import { r as M } from "./Reshape-Zt6eb7yh.js";
+import { u as H } from "./gpgpu_math-DAOmgtXR.js";
+import { m as B } from "./mat_mul-SjpJRLyL.js";
+class W {
+  constructor(e, s, a, n = !1, o = !1, r = !1, i = null, u = !1, l = !1) {
+    this.variableNames = ["matrixA", "matrixB"], this.packedInputs = !0, this.packedOutput = !0, this.outputShape = a, this.enableShapeUniforms = H(this.outputShape.length);
+    const p = n ? e[1] : e[2], h = Math.ceil(p / 2), d = n ? "i * 2, rc.y" : "rc.y, i * 2", x = o ? "rc.z, i * 2" : "i * 2, rc.z", b = n ? ["a.xxyy", "a.zzww"] : ["a.xxzz", "a.yyww"], m = o ? ["b.xzxz", "b.ywyw"] : ["b.xyxy", "b.zwzw"];
+    let c = "", g = "";
+    i && (u ? c = `vec4 activation(vec4 a) {
+          vec4 b = getPreluActivationWeightsAtOutCoords();
+          ${i}
+        }` : l ? c = `vec4 activation(vec4 a) {
+          vec4 b = getLeakyreluAlphaAtOutCoords();
+          ${i}
+        }` : c = `vec4 activation(vec4 x) {
+          ${i}
+        }`, g = "result = activation(result);");
+    const $ = r ? "result += getBiasAtOutCoords();" : "";
+    r && this.variableNames.push("bias"), u && this.variableNames.push("preluActivationWeights"), l && this.variableNames.push("leakyreluAlpha");
+    let f = "rc.x", v = "rc.x";
+    e[0] < s[0] ? f = `imod(rc.x, ${e[0]})` : s[0] < e[0] && (v = `imod(rc.x, ${s[0]})`), this.userCode = `
+      ${c}
+      // Don't use uniform for sharedDimensionPacked for performance.
+      const float sharedDimension = ${h}.0;
+      vec4 dot2x2ARowBCol(ivec3 rc) {
+        vec4 result = vec4(0);
+        int batchA = ${f};
+        int batchB = ${v};
+        for (int i = 0; i < ${h}; i++) {
+          vec4 a = getMatrixA(batchA, ${d});
+          vec4 b = getMatrixB(batchB, ${x});
+          // These swizzled products need to be separately added.
+          // See: https://github.com/tensorflow/tfjs/issues/1735
+          result += (${b[0]} * ${m[0]});
+          result += (${b[1]} * ${m[1]});
+        }
+        return result;
+      }
+      void main() {
+        ivec3 rc = getOutputCoords();
+        vec4 result = dot2x2ARowBCol(rc);
+        ${$}
+        ${g}
+        setOutput(result);
+      }
+    `;
+  }
+}
+const S = 0.7978845608028654, w = 0.044715, j = `
+    vec4 x3 = x * x * x;
+    vec4 inner = x + ${w} * x3;
+    inner = ${S} * inner;
+    inner = vec4(
+        abs(inner[0]) > 15.0 ? sign(inner[0]) : tanh(inner[0]),
+        abs(inner[1]) > 15.0 ? sign(inner[1]) : tanh(inner[1]),
+        abs(inner[2]) > 15.0 ? sign(inner[2]) : tanh(inner[2]),
+        abs(inner[3]) > 15.0 ? sign(inner[3]) : tanh(inner[3])
+    );
+    inner = 0.5 * (1.0 + inner);
+    vec4 result = x * inner;
+    return result;
+`, q = `
+    vec4 a2 = a * a;
+    vec4 a3 = a2 * a;
+    vec4 u  = ${S} * (a + ${w} * a3);
+    vec4 t = vec4(
+        abs(u[0]) > 15.0 ? sign(u[0]) : tanh(u[0]),
+        abs(u[1]) > 15.0 ? sign(u[1]) : tanh(u[1]),
+        abs(u[2]) > 15.0 ? sign(u[2]) : tanh(u[2]),
+        abs(u[3]) > 15.0 ? sign(u[3]) : tanh(u[3])
+    );
+    vec4 sech2 = 1.0 - t * t;
+    vec4 du_dx = ${S} * (1.0 + 3.0 * ${w} * a2);
+    vec4 dgelu = 0.5 * (1.0 + t) + 0.5 * a * sech2 * du_dx;
+    return dgelu * b;
+`, se = 1e3;
+function O({
+  a: t,
+  b: e,
+  transposeA: s,
+  transposeB: a,
+  backend: n,
+  activationSnippet: o,
+  multiplier: r
+}) {
+  const i = t.shape.length, u = e.shape.length, l = s ? t.shape[i - 2] : t.shape[i - 1], p = a ? e.shape[u - 1] : e.shape[u - 2], h = s ? t.shape[i - 1] : t.shape[i - 2], d = a ? e.shape[u - 2] : e.shape[u - 1], x = t.shape.slice(0, -2), b = e.shape.slice(0, -2), m = G(x), c = G(b), $ = L(t.shape.slice(0, -2), e.shape.slice(0, -2)).concat([h, d]);
+  F(
+    l === p,
+    () => `Error in matMul: inner shapes (${l}) and (${p}) of Tensors with shapes ${t.shape} and ${e.shape} and transposeA=${s} and transposeB=${a} must match.`
+  );
+  const f = s ? [m, l, h] : [m, h, l], v = a ? [c, d, p] : [c, p, d], A = M({ inputs: { x: t }, backend: n, attrs: { shape: f } }), y = M({ inputs: { x: e }, backend: n, attrs: { shape: v } }), k = [A, y], E = Math.max(m, c), N = o, T = U(t.dtype, e.dtype), _ = new W(
+    f,
+    v,
+    [E, h, d],
+    s,
+    a,
+    !1,
+    N,
+    !!r,
+    !1
+  ), D = [A, y];
+  r && D.push(r);
+  const z = n.runWebGLProgram(_, D, T), K = M({ inputs: { x: z }, backend: n, attrs: { shape: $ } });
+  k.push(z);
+  for (const P of k)
+    n.disposeIntermediateTensorInfo(P);
+  return K;
+}
+function J(t) {
+  const { inputs: e, backend: s } = t, { x: a, kernel: n } = e;
+  if (a === void 0 || n === void 0)
+    throw new Error("BatchMatMul requires two input tensors.");
+  return O({
+    a,
+    b: n,
+    transposeA: !1,
+    transposeB: !1,
+    backend: s,
+    activationSnippet: j
+  });
+}
+const Q = {
+  kernelName: "MatMulGelu",
+  backendName: "webgl",
+  kernelFunc: J
+};
+C(Q);
+function V(t) {
+  const { dy: e, x: s, kernel: a } = t.inputs, n = t.backend;
+  return R(() => {
+    const o = I().makeTensorFromTensorInfo(
+      O({
+        a: s,
+        b: a,
+        transposeA: !1,
+        transposeB: !1,
+        backend: n,
+        activationSnippet: q,
+        multiplier: e
+      })
+    ), r = B(o, a, !1, !0), i = B(s, o, !0, !1);
+    return [r, i];
+  });
+}
+const X = {
+  kernelName: "MatMulGeluGrad",
+  backendName: "webgl",
+  kernelFunc: V
+};
+C(X);
+export {
+  W as M,
+  se as a,
+  O as b,
+  J as c
+};

package/dist/mat_mul-SjpJRLyL.js ADDED Viewed

@@ -0,0 +1,11 @@
+import { A as m, B as s, L as M, E as c, M as p } from "./index-DOvlwCh-.js";
+function f(e, n, o = !1, l = !1) {
+  let a = s(e, "a", "matMul"), t = s(n, "b", "matMul");
+  [a, t] = M(a, t);
+  const r = { a, b: t }, u = { transposeA: o, transposeB: l };
+  return c.runKernel(p, r, u);
+}
+const i = /* @__PURE__ */ m({ matMul_: f });
+export {
+  i as m
+};

package/dist/mod-AnXEvvpo.js ADDED Viewed

@@ -0,0 +1,11 @@
+import { A as r, B as s, L as m, E as c, N as d } from "./index-DOvlwCh-.js";
+function p(t, e) {
+  let o = s(t, "a", "mod"), a = s(e, "b", "mod");
+  [o, a] = m(o, a);
+  const n = { a: o, b: a };
+  return c.runKernel(d, n);
+}
+const b = /* @__PURE__ */ r({ mod_: p });
+export {
+  b as m
+};

package/dist/models/NanoGPTV1.js CHANGED Viewed

@@ -3,11 +3,11 @@ import b from "../layers/TransformerBlock.js";
 import k from "../layers/TiedEmbedding.js";
 import w from "../layers/RoPECache.js";
 import E from "../layers/RMSNorm.js";
-import { t as l, k as u } from "../index-D6Q1lPZO.js";
+import { t as l, k as u } from "../index-DOvlwCh-.js";
 import C from "./model.js";
 import P from "../layers/PositionEmbedding.js";
 import { packingSupported as _ } from "../utilities/packed.js";
-import { p as y, u as M } from "../pack16-CmVZs6af.js";
+import { p as y, u as M } from "../pack16-nQ6JaLo-.js";
 class I extends C {
   wte;
   // Token embeddings

package/dist/models/model.js CHANGED Viewed

@@ -1,23 +1,23 @@
 import m from "../layers/BaseLayer.js";
-import "../utilities/packed.js";
-import "../index-D6Q1lPZO.js";
+import "../index-DOvlwCh-.js";
+import "../random_width-or-CEftb.js";
+import "../zeros_like-DvE73F4e.js";
+import "../Generator.js";
+import "../index-Cp39cXWe.js";
+import "../dataset-BcwmTGYc.js";
 import "../ops/cpu/attentionMask.js";
 import "../ops/webgl/attentionMask.js";
 import "../ops/grads/attentionMask.js";
-import "../random_width-BVV9HveY.js";
-import "../register_all_kernels-nvj2k7OC.js";
-import "../index-Cp39cXWe.js";
-import "../dataset-D2P7rHAw.js";
 import "../ops/cpu/rope.js";
 import "../ops/webgl/rope.js";
-import "../rope-s4W2XO9B.js";
+import "../rope-Ir4mTyD1.js";
 import "../ops/cpu/appendCache.js";
 import "../ops/webgl/appendCache.js";
 import "../ops/grads/softmax16.js";
-import "../matMul16-fEAJ4smh.js";
+import "../matMul16-BWRSOCWB.js";
 import "../ops/webgl/matMul16.js";
 import "../ops/cpu/matMul16.js";
-import "../pack16-CmVZs6af.js";
+import "../pack16-nQ6JaLo-.js";
 import "../ops/transpose16.js";
 import "../ops/reshape16.js";
 import "../ops/cpu/qkv.js";
@@ -29,7 +29,6 @@ import "../ops/grads/normRMS.js";
 import "../ops/grads/add16.js";
 import "../jszip.min-Bz5-11Bk.js";
 import "../index-DvYrXKkX.js";
-import "../Generator.js";
 import "../ops/cpu/adamAdjust.js";
 import "../ops/webgl/adamAdjust.js";
 import "../ops/cpu/adamMoments.js";
@@ -41,16 +40,16 @@ import "../ops/webgl/scatterSub.js";
 import "../ops/cpu/gatherSub.js";
 import "../ops/webgl/gatherSub.js";
 import "../ops/cpu/matMulGelu.js";
-import "../ops/webgl/matMulGelu.js";
+import "../matMulGelu-CzfgT6Wq.js";
 import "../ops/grads/matMulGelu.js";
 import "../ops/cpu/gelu.js";
 import "../ops/webgl/gelu.js";
-import "../gelu-Bmhopi0J.js";
+import "../gelu-CjNPL4OH.js";
 import "../ops/webgl/log.js";
 import "../checks/normRMS.js";
 import "../checks/normRMSGrad.js";
 import { createSoftmaxCrossEntropyWithGrad as s } from "../training/sparseCrossEntropy.js";
-class st extends m {
+class et extends m {
   lossScaling = 128;
   trainingState = null;
   getNumParams() {
@@ -74,5 +73,5 @@ class st extends m {
   }
 }
 export {
-  st as default
+  et as default
 };

package/dist/ones-D2rT0xk2.js ADDED Viewed

@@ -0,0 +1,14 @@
+import { C as n, _ as t, h as m, E as i } from "./index-DOvlwCh-.js";
+import { c as f } from "./complex-DjxcVmoX.js";
+import { z as c } from "./zeros-KnWaWf-X.js";
+function l(o, r = "float32") {
+  if (n(o), r === "complex64") {
+    const s = l(o, "float32"), a = c(o, "float32");
+    return f(s, a);
+  }
+  const e = t(m(o), r);
+  return i.makeTensor(e, o, r);
+}
+export {
+  l as o
+};

package/dist/ops/adamAdjust.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { e as i } from "../index-D6Q1lPZO.js";
+import { e as i } from "../index-DOvlwCh-.js";
 import "./cpu/adamAdjust.js";
 import "./webgl/adamAdjust.js";
 function p(r, t, e, n, m, o) {

package/dist/ops/adamMoments.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { e as t } from "../index-D6Q1lPZO.js";
+import { e as t } from "../index-DOvlwCh-.js";
 import "./cpu/adamMoments.js";
 import "./webgl/adamMoments.js";
 function s(e, n, r, m, o) {

package/dist/ops/add16.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { n as t, e as o } from "../index-D6Q1lPZO.js";
+import { x as t, e as o } from "../index-DOvlwCh-.js";
 import { isPackedTensor as n } from "../utilities/packed.js";
 import "./grads/add16.js";
 function m(r, e) {

package/dist/ops/appendCache.js CHANGED Viewed

@@ -1,9 +1,9 @@
-import { e as a } from "../index-D6Q1lPZO.js";
+import { e as a } from "../index-DOvlwCh-.js";
 import "./cpu/appendCache.js";
 import "./webgl/appendCache.js";
 import { isPackedTensor as c } from "../utilities/packed.js";
-import { c as t } from "../concat-DmBLPVGC.js";
-import { z as f } from "../zeros-DBFVbpv5.js";
+import { c as t } from "../concat-BV8bt5H-.js";
+import { z as f } from "../zeros-KnWaWf-X.js";
 function C(r, o, n, p) {
   if (!p) {
     const e = r.shape[2], s = c(r);

package/dist/ops/attentionMask.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { e as r } from "../index-D6Q1lPZO.js";
+import { e as r } from "../index-DOvlwCh-.js";
 import "./cpu/attentionMask.js";
 import "./webgl/attentionMask.js";
 import "./grads/attentionMask.js";

package/dist/ops/concat16.js CHANGED Viewed

@@ -1,6 +1,6 @@
 import { isPackedTensor as o } from "../utilities/packed.js";
-import { e } from "../index-D6Q1lPZO.js";
-import { c } from "../concat-DmBLPVGC.js";
+import { e } from "../index-DOvlwCh-.js";
+import { c } from "../concat-BV8bt5H-.js";
 function p(r, n) {
   return o(r[0]) ? e().runKernel("Concat16", r, { axis: n ?? -1 }) : c(r, n);
 }