PyPI - tiny-recursive-model - Versions diffs - 0.0.3__py3-none-any.whl → 0.0.5__py3-none-any.whl - Mend

tiny-recursive-model 0.0.3py3-none-any.whl → 0.0.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

tiny_recursive_model/trm.py CHANGED Viewed

@@ -25,6 +25,9 @@ def default(v, d):
 def is_empty(t):
     return t.numel() == 0
+def range_from_one(n):
+    return range(1, n + 1)
 # classes
 class TinyRecursiveModel(Module):
@@ -98,11 +101,11 @@ class TinyRecursiveModel(Module):
         latents,   # (b n d)
     ):
-        for i in range(self.num_refinement_blocks):
+        for step in range_from_one(self.num_refinement_blocks):
             # only last round of refinement receives gradients
-            is_last = i == (self.num_refinement_blocks - 1)
+            is_last = step == self.num_refinement_blocks
             context = torch.no_grad if not is_last else nullcontext
             with context():
@@ -115,7 +118,7 @@ class TinyRecursiveModel(Module):
         self,
         seq,
         halt_prob_thres = 0.5,
-        num_deep_refinement_steps = 12
+        max_deep_refinement_steps = 12
     ):
         batch = seq.shape[0]
@@ -131,9 +134,8 @@ class TinyRecursiveModel(Module):
         exited_step_indices = []
         exited_batch_indices = []
-        for i in range(num_deep_refinement_steps):
-            step = i + 1
-            is_last = step == num_deep_refinement_steps
+        for step in range_from_one(max_deep_refinement_steps):
+            is_last = step == max_deep_refinement_steps
             outputs, latents = self.deep_refinement(inputs, outputs, latents)

{tiny_recursive_model-0.0.3.dist-info → tiny_recursive_model-0.0.5.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: tiny-recursive-model
-Version: 0.0.3
+Version: 0.0.5
 Summary: Tiny Recursive Model
 Project-URL: Homepage, https://pypi.org/project/tiny-recursive-model/
 Project-URL: Repository, https://github.com/lucidrains/tiny-recursive-model
@@ -38,7 +38,7 @@ Requires-Dist: accelerate
 Requires-Dist: einops>=0.8.1
 Requires-Dist: ema-pytorch
 Requires-Dist: torch>=2.4
-Requires-Dist: x-transformers
+Requires-Dist: x-transformers>=2.8.4
 Provides-Extra: examples
 Provides-Extra: test
 Requires-Dist: pytest; extra == 'test'
@@ -77,6 +77,8 @@ trm = TinyRecursiveModel(
     ),
 )
+# mock dataset
 from torch.utils.data import Dataset
 class MockDataset(Dataset):
     def __len__(self):
@@ -87,9 +89,13 @@ class MockDataset(Dataset):
         out = torch.randint(0, 256, (256,))
         return inp, out
+mock_dataset = MockDataset()
+# trainer
 trainer = Trainer(
     trm,
-    MockDataset(),
+    mock_dataset,
     epochs = 1,
     batch_size = 16,
     cpu = True
@@ -97,9 +103,18 @@ trainer = Trainer(
 trainer()
-pred_answer, exit_indices = trm.predict(torch.randint(0, 256, (1, 256)), halt_prob_thres = 0.1)
+# inference
+pred_answer, exit_indices = trm.predict(
+    torch.randint(0, 256, (1, 256)),
+    max_deep_refinement_steps = 12,
+    halt_prob_thres = 0.1
+)
+# save to collection of specialized networks for tool call
 torch.save(trm.state_dict(), 'saved-trm.pt')
 ```
 ## Citations

tiny_recursive_model-0.0.5.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,8 @@
+tiny_recursive_model/__init__.py,sha256=zuMcrofGu7DnvJM2Mb-O3tqBJF5q8L-8X8OTmq7_o5w,189
+tiny_recursive_model/mlp_mixer_1d.py,sha256=6ivDK9dgHdVl1axg2ayifJ7H5QI3hXptHnb6lfNrno0,1398
+tiny_recursive_model/trainer.py,sha256=6dQPmRaQZWI6527OvlOdgHKCFsufkZnjSHClRdHjs20,4218
+tiny_recursive_model/trm.py,sha256=pvhXZjDFoLQR-bc8ZDc_ikklF-s21cY5o6xYAwSDoL8,6048
+tiny_recursive_model-0.0.5.dist-info/METADATA,sha256=GHJavWHHc4O001dFHLsDimAVIiiogCIv4al4QFWix60,4126
+tiny_recursive_model-0.0.5.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+tiny_recursive_model-0.0.5.dist-info/licenses/LICENSE,sha256=1yCiA9b5nhslTavxPjsQAO-wpOnwJR9-l8LTVi7GJuk,1066
+tiny_recursive_model-0.0.5.dist-info/RECORD,,

tiny_recursive_model-0.0.3.dist-info/RECORD DELETED Viewed

@@ -1,8 +0,0 @@
-tiny_recursive_model/__init__.py,sha256=zuMcrofGu7DnvJM2Mb-O3tqBJF5q8L-8X8OTmq7_o5w,189
-tiny_recursive_model/mlp_mixer_1d.py,sha256=6ivDK9dgHdVl1axg2ayifJ7H5QI3hXptHnb6lfNrno0,1398
-tiny_recursive_model/trainer.py,sha256=6dQPmRaQZWI6527OvlOdgHKCFsufkZnjSHClRdHjs20,4218
-tiny_recursive_model/trm.py,sha256=Ep18uwvhWjHxGeyv42ruXLVc2F6TlZg2_CmeVVfYz7c,6001
-tiny_recursive_model-0.0.3.dist-info/METADATA,sha256=0enBPVOxRoReOf0hms_ZoAI4HHdMWUrrW4Ps0MTuQ9g,3943
-tiny_recursive_model-0.0.3.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-tiny_recursive_model-0.0.3.dist-info/licenses/LICENSE,sha256=1yCiA9b5nhslTavxPjsQAO-wpOnwJR9-l8LTVi7GJuk,1066
-tiny_recursive_model-0.0.3.dist-info/RECORD,,

{tiny_recursive_model-0.0.3.dist-info → tiny_recursive_model-0.0.5.dist-info}/WHEEL RENAMED Viewed

File without changes

{tiny_recursive_model-0.0.3.dist-info → tiny_recursive_model-0.0.5.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

tiny-recursive-model 0.0.3__py3-none-any.whl → 0.0.5__py3-none-any.whl

tiny-recursive-model 0.0.3py3-none-any.whl → 0.0.5py3-none-any.whl