npm - @genai-fi/nanogpt - Versions diffs - 0.6.2 → 0.7.0 - Mend

@genai-fi/nanogpt 0.6.2 → 0.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (142) hide show

package/dist/Generator.js +11 -11
package/dist/NanoGPTModel.d.ts +2 -2
package/dist/NanoGPTModel.js +104 -136
package/dist/{RealDiv-BYViZwhN.js → RealDiv-C4hOvYOZ.js} +26 -25
package/dist/{Reshape-t7Kcikjk.js → Reshape-BLijOA8h.js} +5 -5
package/dist/TeachableLLM.d.ts +3 -0
package/dist/TeachableLLM.js +50 -47
package/dist/{TiedEmbedding-9WeDwvjO.js → TiedEmbedding-BLltddza.js} +4 -4
package/dist/{axis_util-Bu4h7XWV.js → axis_util-DaAl5MER.js} +3 -3
package/dist/backend.d.ts +1 -0
package/dist/backend.js +7 -0
package/dist/backend_util-DWiwsi2N.js +749 -0
package/dist/{broadcast_to-DARN-DBD.js → broadcast_to-C4v-j9yA.js} +2 -2
package/dist/{concat-5aPGqw3Z.js → concat-CsHeR4zV.js} +8 -8
package/dist/{dataset-pgqp-YfL.js → dataset-JDyjG3QR.js} +3 -3
package/dist/{dropout-Bciw46HT.js → dropout-hpDwECTe.js} +7 -7
package/dist/{gather-DjyCjmOD.js → gather-D0_gPiBz.js} +4 -4
package/dist/gelu-uyHP1x1f.js +26 -0
package/dist/gpgpu_math-DJm3ZTAf.js +2371 -0
package/dist/index-BPPzKVdR.js +12099 -0
package/dist/{index-BAzbokzv.js → index-C0dhsYom.js} +405 -389
package/dist/{kernel_funcs_utils-CUxJCg0g.js → kernel_funcs_utils-CwRTFqrc.js} +31 -30
package/dist/layers/BaseLayer.js +2 -2
package/dist/layers/CausalSelfAttention.js +6 -6
package/dist/layers/MLP.js +5 -5
package/dist/layers/RMSNorm.js +3 -3
package/dist/layers/RoPECache.js +4 -4
package/dist/layers/TiedEmbedding.js +5 -5
package/dist/layers/TransformerBlock.js +1 -1
package/dist/loader/loadTransformers.js +1 -1
package/dist/loader/oldZipLoad.js +5 -5
package/dist/{log_sum_exp-YEo2h3gb.js → log_sum_exp-D086OgZJ.js} +15 -15
package/dist/main.d.ts +2 -0
package/dist/main.js +9 -5
package/dist/{mat_mul-7121rsJk.js → mat_mul-1nwdPkQ_.js} +4 -4
package/dist/{max-DtlIuVeW.js → max-BQc2Aj-I.js} +4 -4
package/dist/{mulmat_packed_gpu-D4nKF7Je.js → mulmat_packed_gpu-Gzf3I9UV.js} +1 -1
package/dist/non_max_suppression_impl-CsEgBuMA.js +134 -0
package/dist/{ones-BBlSRqn1.js → ones-D63HpSF_.js} +2 -2
package/dist/ops/appendCache.js +3 -3
package/dist/ops/attentionMask.js +1 -1
package/dist/ops/cpu/appendCache.js +8 -8
package/dist/ops/cpu/attentionMask.js +9 -9
package/dist/ops/cpu/fusedSoftmax.js +17 -11
package/dist/ops/cpu/gatherSub.js +7 -7
package/dist/ops/cpu/gelu.js +13 -13
package/dist/ops/cpu/matMulGelu.js +36 -24
package/dist/ops/cpu/matMulMul.js +14 -8
package/dist/ops/cpu/mulDropout.js +9 -3
package/dist/ops/cpu/normRMS.js +5 -5
package/dist/ops/cpu/qkv.js +3 -3
package/dist/ops/cpu/rope.js +5 -5
package/dist/ops/cpu/scatterSub.js +11 -11
package/dist/ops/fusedSoftmax.js +1 -1
package/dist/ops/gatherSub.js +1 -1
package/dist/ops/gelu.js +2 -2
package/dist/ops/grads/attentionMask.js +1 -1
package/dist/ops/grads/fusedSoftmax.js +2 -2
package/dist/ops/grads/gelu.js +3 -24
package/dist/ops/grads/matMulGelu.js +5 -5
package/dist/ops/grads/normRMS.js +6 -6
package/dist/ops/grads/qkv.js +1 -1
package/dist/ops/grads/rope.js +3 -3
package/dist/ops/matMulGelu.js +1 -1
package/dist/ops/matMulMul.js +1 -1
package/dist/ops/mulDrop.js +1 -1
package/dist/ops/normRMS.js +1 -1
package/dist/ops/qkv.js +1 -1
package/dist/ops/rope.js +4 -4
package/dist/ops/scatterSub.js +1 -1
package/dist/ops/webgl/appendCache.js +1 -1
package/dist/ops/webgl/attentionMask.js +1 -1
package/dist/ops/webgl/fusedSoftmax.js +4 -4
package/dist/ops/webgl/gatherSub.js +1 -1
package/dist/ops/webgl/gelu.js +2 -2
package/dist/ops/webgl/log.js +5 -5
package/dist/ops/webgl/matMulGelu.js +17 -17
package/dist/ops/webgl/matMulMul.js +1 -1
package/dist/ops/webgl/mulDropout.js +4 -4
package/dist/ops/webgl/normRMS.js +2 -2
package/dist/ops/webgl/qkv.js +1 -1
package/dist/ops/webgl/rope.js +1 -1
package/dist/ops/webgl/scatterSub.js +1 -1
package/dist/ops/webgpu/appendCache.js +56 -0
package/dist/ops/webgpu/attentionMask.d.ts +1 -0
package/dist/ops/webgpu/attentionMask.js +64 -0
package/dist/ops/webgpu/gatherSub.d.ts +1 -0
package/dist/ops/webgpu/gatherSub.js +37 -0
package/dist/ops/webgpu/gelu.d.ts +14 -0
package/dist/ops/webgpu/gelu.js +86 -0
package/dist/ops/webgpu/index.d.ts +0 -0
package/dist/ops/webgpu/index.js +8 -0
package/dist/ops/webgpu/normRMS.d.ts +1 -0
package/dist/ops/webgpu/normRMS.js +115 -0
package/dist/ops/webgpu/qkv.d.ts +1 -0
package/dist/ops/webgpu/qkv.js +56 -0
package/dist/ops/webgpu/rope.d.ts +1 -0
package/dist/ops/webgpu/rope.js +68 -0
package/dist/ops/webgpu/scatterSub.d.ts +1 -0
package/dist/ops/webgpu/scatterSub.js +37 -0
package/dist/{ops-C0sQEcPw.js → ops-CIQLNshk.js} +452 -503
package/dist/{random_width-DWzaOgrn.js → random_width-DkYP8W8N.js} +143 -144
package/dist/{range-DYsrnfiy.js → range-CYzpQY53.js} +1 -1
package/dist/{reciprocal-CJQeasVa.js → reciprocal-_A9yv27J.js} +1 -1
package/dist/{register_all_kernels-BfFCQAqs.js → register_all_kernels-guvSxp7M.js} +202 -200
package/dist/{reshape-krWGKraP.js → reshape-BMUzc1UY.js} +3 -3
package/dist/{scatter_nd_util-93ln7Hut.js → scatter_nd_util-IRBqKz_b.js} +3 -3
package/dist/{selu_util-sntGesxr.js → selu_util-Dt_iuXaq.js} +6 -6
package/dist/shared-BNa2q6jD.js +69 -0
package/dist/{shared-Ca6iDobD.js → shared-CDu9S76h.js} +541 -606
package/dist/{sin-D_h-qCSx.js → sin-Cocju-BY.js} +6 -6
package/dist/{softmax-fsdtf6JC.js → softmax-GPNK3o-U.js} +3 -3
package/dist/{split-eiktj-6L.js → split-CHzJjxDv.js} +4 -4
package/dist/{stack-dfEEz2OY.js → stack-Dpgg_1W1.js} +2 -2
package/dist/{sum-BE_Irnim.js → sum-B8wEpKsg.js} +5 -5
package/dist/{tensor-Xyi595sG.js → tensor-RvZVNmg0.js} +1 -1
package/dist/{tensor2d-CPEkynbH.js → tensor2d-B_kyod7_.js} +1 -1
package/dist/training/AdamExt.js +1 -1
package/dist/training/DatasetBuilder.js +2 -2
package/dist/training/Evaluator.js +1 -1
package/dist/training/FullTrainer.js +20 -20
package/dist/training/Trainer.d.ts +5 -6
package/dist/training/Trainer.js +59 -60
package/dist/training/sparseCrossEntropy.js +19 -26
package/dist/utilities/dummy.js +19 -19
package/dist/utilities/generate.js +15 -16
package/dist/utilities/multinomialCPU.d.ts +2 -0
package/dist/utilities/multinomialCPU.js +13 -0
package/dist/utilities/performance.d.ts +2 -0
package/dist/utilities/performance.js +16 -0
package/dist/utilities/profile.d.ts +1 -0
package/dist/utilities/profile.js +9 -6
package/dist/utilities/safetensors.js +2 -2
package/dist/utilities/weights.js +2 -2
package/dist/{variable-wSS22xj5.js → variable-DXEUOwew.js} +1 -1
package/dist/webgpu_util-g13LvDIv.js +625 -0
package/dist/{zeros-YJDE7oRb.js → zeros-DCPCdFGq.js} +8 -8
package/package.json +2 -1
package/dist/gpgpu_math-CNslybmD.js +0 -3115
package/dist/norm-CzltS9Fz.js +0 -86
package/dist/ops/node/sparseCrossEntropy.js +0 -11
/package/dist/ops/{node/sparseCrossEntropy.d.ts → webgpu/appendCache.d.ts} +0 -0

package/dist/{broadcast_to-DARN-DBD.js → broadcast_to-C4v-j9yA.js} RENAMED Viewed

@@ -1,5 +1,5 @@
-import { o as h, q as f, x as p, H as g, E as u, I as b } from "./index-BAzbokzv.js";
-import { r as T } from "./reshape-krWGKraP.js";
+import { x as h, y as f, C as p, K as g, E as u, L as b } from "./index-C0dhsYom.js";
+import { r as T } from "./reshape-BMUzc1UY.js";
 /**
  * @license
  * Copyright 2020 Google LLC. All Rights Reserved.

package/dist/{concat-5aPGqw3Z.js → concat-CsHeR4zV.js} RENAMED Viewed

@@ -1,4 +1,4 @@
-import { o as s, i as a, w as i, H as p, E as l, J as f } from "./index-BAzbokzv.js";
+import { x as s, l as a, B as p, K as i, E as l, M as f } from "./index-C0dhsYom.js";
 /**
  * @license
  * Copyright 2020 Google LLC. All Rights Reserved.
@@ -15,15 +15,15 @@ import { o as s, i as a, w as i, H as p, E as l, J as f } from "./index-BAzbokzv
  * limitations under the License.
  * =============================================================================
  */
-function h(o, e = 0) {
-  a(o.length >= 1, () => "Pass at least one tensor to concat");
-  const t = i(o, "tensors", "concat", "string_or_numeric");
-  if (t[0].dtype === "complex64" && t.forEach((n) => {
-    if (n.dtype !== "complex64")
+function h(n, e = 0) {
+  a(n.length >= 1, () => "Pass at least one tensor to concat");
+  const t = p(n, "tensors", "concat", "string_or_numeric");
+  if (t[0].dtype === "complex64" && t.forEach((o) => {
+    if (o.dtype !== "complex64")
       throw new Error(`Cannot concatenate complex64 tensors with a tensor
-          with dtype ${n.dtype}. `);
+          with dtype ${o.dtype}. `);
   }), t.length === 1)
-    return p(t[0]);
+    return i(t[0]);
   const r = t, c = { axis: e };
   return l.runKernel(f, r, c);
 }

package/dist/{dataset-pgqp-YfL.js → dataset-JDyjG3QR.js} RENAMED Viewed

@@ -1,7 +1,7 @@
-import { ab as S, T as h, ac as N, d as v, ad as o, ae as p, af as g, i as k, t as y } from "./index-BAzbokzv.js";
+import { ad as S, T as h, ac as N, d as v, ae as o, af as p, ag as g, l as k, t as y } from "./index-C0dhsYom.js";
 import { s as R } from "./index-C4L8Cm77.js";
-import { s as $ } from "./stack-dfEEz2OY.js";
-import { t as B } from "./tensor-Xyi595sG.js";
+import { s as $ } from "./stack-Dpgg_1W1.js";
+import { t as B } from "./tensor-RvZVNmg0.js";
 /**
  * @license
  * Copyright 2018 Google LLC. All Rights Reserved.

package/dist/{dropout-Bciw46HT.js → dropout-hpDwECTe.js} RENAMED Viewed

@@ -1,4 +1,4 @@
-import { o as l, q as h, E as m, ag as p, x as c, ah as d, ai as g, i as u, T as V, aj as v, a7 as N, a as w } from "./index-BAzbokzv.js";
+import { x as l, y as h, E as m, ah as p, C as c, ai as d, ab as g, l as u, T as V, aj as v, a6 as N, a as w } from "./index-C0dhsYom.js";
 import { s as f } from "./index-C4L8Cm77.js";
 /**
  * @license
@@ -69,7 +69,7 @@ class T {
     return t <= this.upper && t >= this.lower;
   }
 }
-class $ {
+class y {
   constructor(t = 0, e = 1, s, n) {
     if (this.canReturnFloat = () => this.dtype == null || this.dtype === "float32", this.min = t, this.range = e - t, this.dtype = s, n == null && (n = Math.random()), typeof n == "number" && (n = n.toString()), !this.canReturnFloat() && this.range <= 1)
       throw new Error(`The difference between ${t} - ${e} <= 1 and dtype is not float`);
@@ -98,7 +98,7 @@ class $ {
  * limitations under the License.
  * =============================================================================
  */
-function y(r, t = 0, e = 1, s, n) {
+function $(r, t = 0, e = 1, s, n) {
   if (c(r), s != null && s === "bool")
     throw new Error(`Unsupported data type ${s}`);
   const o = new T(t, e, s, !1, n), a = d(r, s);
@@ -106,7 +106,7 @@ function y(r, t = 0, e = 1, s, n) {
     a.values[i] = o.nextValue();
   return a.toTensor();
 }
-const _ = /* @__PURE__ */ l({ randomNormal_: y });
+const _ = /* @__PURE__ */ l({ randomNormal_: $ });
 /**
  * @license
  * Copyright 2020 Google LLC. All Rights Reserved.
@@ -125,7 +125,7 @@ const _ = /* @__PURE__ */ l({ randomNormal_: y });
  */
 function M(r, t = 0, e = 1, s = "float32", n) {
   c(r);
-  const o = d(r, s), a = new $(t, e, null, n);
+  const o = d(r, s), a = new y(t, e, null, n);
   for (let i = 0; i < o.values.length; i++)
     o.values[i] = a.nextValue();
   return o.toTensor();
@@ -183,11 +183,11 @@ function R(r, t, e, s) {
   const o = E(n, e), a = 1 - t, i = v(b(N(D(o, 0, 1, "float32", s), a)), a);
   return w(n, i);
 }
-const q = /* @__PURE__ */ l({ dropout_: R });
+const G = /* @__PURE__ */ l({ dropout_: R });
 export {
   T as M,
   D as a,
-  q as d,
+  G as d,
   b as f,
   _ as r
 };

package/dist/{gather-DjyCjmOD.js → gather-D0_gPiBz.js} RENAMED Viewed

@@ -1,4 +1,4 @@
-import { o as g, q as t, E as h, G as p } from "./index-BAzbokzv.js";
+import { x as g, y as t, E as h, G as x } from "./index-C0dhsYom.js";
 /**
  * @license
  * Copyright 2018 Google LLC. All Rights Reserved.
@@ -15,11 +15,11 @@ import { o as g, q as t, E as h, G as p } from "./index-BAzbokzv.js";
  * limitations under the License.
  * =============================================================================
  */
-function u(n, s, r = 0, e = 0) {
+function p(n, s, r = 0, e = 0) {
   const o = t(n, "x", "gather"), a = t(s, "indices", "gather", "int32"), c = { x: o, indices: a }, i = { axis: r, batchDims: e };
-  return h.runKernel(p, c, i);
+  return h.runKernel(x, c, i);
 }
-const d = /* @__PURE__ */ g({ gather_: u });
+const d = /* @__PURE__ */ g({ gather_: p });
 export {
   d as g
 };

package/dist/gelu-uyHP1x1f.js ADDED Viewed

@@ -0,0 +1,26 @@
+import { i as t, e as n } from "./index-C0dhsYom.js";
+import "./ops/cpu/gelu.js";
+import "./ops/webgl/gelu.js";
+const a = {
+  kernelName: "Gelu",
+  inputsToSave: ["x"],
+  outputsToSave: [],
+  gradFunc: (e, r) => {
+    const [u] = r;
+    return {
+      x: () => o(e, u)
+    };
+  }
+};
+t(a);
+function g(e) {
+  return n().runKernel("Gelu", { x: e });
+}
+function o(e, r) {
+  return n().runKernel("GeluGrad", { dy: e, x: r });
+}
+export {
+  a,
+  o as d,
+  g
+};