PyPI - metacontroller-pytorch - Versions diffs - 0.0.10__tar.gz → 0.0.14__tar.gz - Mend

metacontroller-pytorch 0.0.10tar.gz → 0.0.14tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

{metacontroller_pytorch-0.0.10 → metacontroller_pytorch-0.0.14}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: metacontroller-pytorch
-Version: 0.0.10
+Version: 0.0.14
 Summary: Transformer Metacontroller
 Project-URL: Homepage, https://pypi.org/project/metacontroller/
 Project-URL: Repository, https://github.com/lucidrains/metacontroller
@@ -35,9 +35,10 @@ Classifier: Programming Language :: Python :: 3.9
 Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
 Requires-Python: >=3.9
 Requires-Dist: assoc-scan>=0.0.3
-Requires-Dist: discrete-continuous-embed-readout>=0.1.11
+Requires-Dist: discrete-continuous-embed-readout>=0.1.12
 Requires-Dist: einops>=0.8.1
 Requires-Dist: einx>=0.3.0
+Requires-Dist: loguru
 Requires-Dist: torch>=2.5
 Requires-Dist: x-evolution>=0.1.23
 Requires-Dist: x-mlps-pytorch

{metacontroller_pytorch-0.0.10 → metacontroller_pytorch-0.0.14}/metacontroller/metacontroller.py RENAMED Viewed

@@ -3,6 +3,7 @@ from contextlib import nullcontext
 from functools import partial
 from collections import namedtuple
+from loguru import logger
 import torch
 from torch import nn, cat, stack, tensor
@@ -130,7 +131,8 @@ class MetaController(Module):
         residual_stream,
         cache: MetaControllerOutput | None = None,
         discovery_phase = False,
-        hard_switch = False
+        hard_switch = False,
+        temperature = 1.
     ):
         # destruct prev cache
@@ -142,6 +144,8 @@ class MetaController(Module):
         next_action_proposer_hidden = None
         if discovery_phase:
+            logger.warning('meta controller cache being passed back in for discovery phase, which does not make sense given bidirectional encoder')
             temporal_compressed, _ = self.bidirectional_temporal_compressor(residual_stream)
             temporal_compressed = reduce(temporal_compressed, '... (two d) -> ... d', 'mean', two = 2)
@@ -157,7 +161,7 @@ class MetaController(Module):
         action_dist = readout(proposed_action_hidden)
-        sampled_action = readout.sample(action_dist)
+        sampled_action = readout.sample(action_dist, temperature = temperature)
         # switching unit timer
@@ -285,10 +289,9 @@ class Transformer(Module):
         meta_controller: Module | None = None,
         cache: TransformerOutput | None = None,
         discovery_phase = False,
-        no_grad_transformer = None,
-        no_grad_meta_controller = None,
+        meta_controller_temperature = 1.,
         return_latents = False,
-        return_cache = False
+        return_cache = False,
     ):
         meta_controller = default(meta_controller, self.meta_controller)
@@ -296,11 +299,9 @@ class Transformer(Module):
         # by default, if meta controller is passed in, transformer is no grad
-        no_grad_transformer = default(no_grad_transformer, meta_controlling)
-        no_grad_meta_controller = default(no_grad_meta_controller, no_grad_transformer) # by default, if transformer is eval no grad then meta controller is being learnt
-        transformer_context = torch.no_grad if no_grad_transformer else nullcontext
-        meta_controller_context = torch.no_grad if no_grad_meta_controller else nullcontext
+        lower_transformer_context = nullcontext if not meta_controlling else torch.no_grad
+        meta_controller_context = nullcontext if meta_controlling else torch.no_grad
+        upper_transformer_context = nullcontext if meta_controlling and discovery_phase else torch.no_grad
         # handle cache
@@ -308,7 +309,7 @@ class Transformer(Module):
         # transformer lower body
-        with transformer_context():
+        with lower_transformer_context():
             embed = self.embed(ids)
@@ -319,13 +320,13 @@ class Transformer(Module):
         with meta_controller_context():
             if exists(meta_controller):
-                modified_residual_stream, next_meta_hiddens = meta_controller(residual_stream, cache = meta_hiddens, discovery_phase = discovery_phase)
+                modified_residual_stream, next_meta_hiddens = meta_controller(residual_stream, cache = meta_hiddens, discovery_phase = discovery_phase, temperature = meta_controller_temperature)
             else:
                 modified_residual_stream, next_meta_hiddens = residual_stream, None
         # modified residual stream sent back to transformer upper body
-        with transformer_context():
+        with upper_transformer_context():
             attended, next_upper_hiddens = self.upper_body(modified_residual_stream, cache = upper_transformer_hiddens, return_hiddens = True)

{metacontroller_pytorch-0.0.10 → metacontroller_pytorch-0.0.14}/pyproject.toml RENAMED Viewed

@@ -1,6 +1,6 @@
 [project]
 name = "metacontroller-pytorch"
-version = "0.0.10"
+version = "0.0.14"
 description = "Transformer Metacontroller"
 authors = [
     { name = "Phil Wang", email = "lucidrains@gmail.com" }
@@ -25,9 +25,10 @@ classifiers=[
 dependencies = [
     "assoc-scan>=0.0.3",
+    "discrete-continuous-embed-readout>=0.1.12",
     "einx>=0.3.0",
     "einops>=0.8.1",
-    "discrete-continuous-embed-readout>=0.1.11",
+    "loguru",
     "torch>=2.5",
     "x-evolution>=0.1.23",
     "x-mlps-pytorch",