PyPI - metacontroller-pytorch - Versions diffs - 0.0.24__py3-none-any.whl → 0.0.26__py3-none-any.whl - Mend

metacontroller-pytorch 0.0.24py3-none-any.whl → 0.0.26py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

metacontroller/metacontroller.py CHANGED Viewed

@@ -6,7 +6,7 @@ from collections import namedtuple
 from loguru import logger
 import torch
-from torch import nn, cat, stack, tensor
+from torch import nn, cat, stack, tensor, Tensor
 from torch.nn import Module, GRU, Linear, Identity
 import torch.nn.functional as F
@@ -26,7 +26,7 @@ from discrete_continuous_embed_readout import Embed, Readout, EmbedAndReadout
 from assoc_scan import AssocScan
-from torch_einops_utils import pad_at_dim
+from torch_einops_utils import maybe, pad_at_dim, lens_to_mask
 from torch_einops_utils.save_load import save_load
 # constants
@@ -151,7 +151,8 @@ class MetaController(Module):
         cache: MetaControllerOutput | None = None,
         discovery_phase = False,
         hard_switch = False,
-        temperature = 1.
+        temperature = 1.,
+        episode_lens: Tensor | None = None
     ):
         device = residual_stream.device
@@ -168,7 +169,9 @@ class MetaController(Module):
         if discovery_phase:
             logger.warning('meta controller cache being passed back in for discovery phase, which does not make sense given bidirectional encoder')
-            encoded_temporal = self.bidirectional_temporal_encoder(meta_embed)
+            mask = maybe(lens_to_mask)(episode_lens, meta_embed.shape[1])
+            encoded_temporal = self.bidirectional_temporal_encoder(meta_embed, mask = mask)
             proposed_action_hidden, _ = self.emitter(cat((encoded_temporal, meta_embed), dim = -1))
             readout = self.emitter_to_action_mean_log_var
@@ -335,6 +338,7 @@ class Transformer(Module):
         return_raw_action_dist = False,
         return_latents = False,
         return_cache = False,
+        episode_lens: Tensor | None = None
     ):
         device = state.device
@@ -362,6 +366,9 @@ class Transformer(Module):
             state, target_state = state[:, :-1], state[:, 1:]
             actions, target_actions = actions[:, :-1], actions[:, 1:]
+            if exists(episode_lens):
+                episode_lens = (episode_lens - 1).clamp(min = 0)
         # transformer lower body
         with lower_transformer_context():
@@ -387,7 +394,7 @@ class Transformer(Module):
         with meta_controller_context():
             if exists(meta_controller):
-                control_signal, next_meta_hiddens = meta_controller(residual_stream, cache = meta_hiddens, discovery_phase = discovery_phase, temperature = meta_controller_temperature)
+                control_signal, next_meta_hiddens = meta_controller(residual_stream, cache = meta_hiddens, discovery_phase = discovery_phase, temperature = meta_controller_temperature, episode_lens = episode_lens)
             else:
                 control_signal, next_meta_hiddens = self.zero, None
@@ -406,10 +413,14 @@ class Transformer(Module):
         # maybe return behavior cloning loss
         if behavioral_cloning:
+            loss_mask = None
+            if exists(episode_lens):
+                loss_mask = lens_to_mask(episode_lens, state.shape[1])
             state_dist_params = self.state_readout(attended)
-            state_clone_loss = self.state_readout.calculate_loss(state_dist_params, target_state)
+            state_clone_loss = self.state_readout.calculate_loss(state_dist_params, target_state, mask = loss_mask)
-            action_clone_loss = self.action_readout.calculate_loss(dist_params, target_actions)
+            action_clone_loss = self.action_readout.calculate_loss(dist_params, target_actions, mask = loss_mask)
             return state_clone_loss, action_clone_loss

{metacontroller_pytorch-0.0.24.dist-info → metacontroller_pytorch-0.0.26.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: metacontroller-pytorch
-Version: 0.0.24
+Version: 0.0.26
 Summary: Transformer Metacontroller
 Project-URL: Homepage, https://pypi.org/project/metacontroller/
 Project-URL: Repository, https://github.com/lucidrains/metacontroller

metacontroller_pytorch-0.0.26.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,6 @@
+metacontroller/__init__.py,sha256=lj7IOGpN--qMxJWbB-4SGqoPXG7Hd4mgtToTRSyTZ58,57
+metacontroller/metacontroller.py,sha256=LWEq069EnBP3Sr6FTiDtz0cM5SFFT1zl35WkU6_kWGA,14451
+metacontroller_pytorch-0.0.26.dist-info/METADATA,sha256=E00jJkfHS_wsEuh-a4iIo42fQQ1NhX7r-HuSWtyimUQ,4363
+metacontroller_pytorch-0.0.26.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+metacontroller_pytorch-0.0.26.dist-info/licenses/LICENSE,sha256=1yCiA9b5nhslTavxPjsQAO-wpOnwJR9-l8LTVi7GJuk,1066
+metacontroller_pytorch-0.0.26.dist-info/RECORD,,

metacontroller_pytorch-0.0.24.dist-info/RECORD DELETED Viewed

@@ -1,6 +0,0 @@
-metacontroller/__init__.py,sha256=lj7IOGpN--qMxJWbB-4SGqoPXG7Hd4mgtToTRSyTZ58,57
-metacontroller/metacontroller.py,sha256=Ocm_2hCBvV2coYg4tQ4kYd0LQHgHWiz1l-c9lR7Z_fM,13941
-metacontroller_pytorch-0.0.24.dist-info/METADATA,sha256=5xKHBecV3iRSK-JbNwOQ0iv6KSz_sIN--ar_M05-EWQ,4363
-metacontroller_pytorch-0.0.24.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-metacontroller_pytorch-0.0.24.dist-info/licenses/LICENSE,sha256=1yCiA9b5nhslTavxPjsQAO-wpOnwJR9-l8LTVi7GJuk,1066
-metacontroller_pytorch-0.0.24.dist-info/RECORD,,

{metacontroller_pytorch-0.0.24.dist-info → metacontroller_pytorch-0.0.26.dist-info}/WHEEL RENAMED Viewed

File without changes

{metacontroller_pytorch-0.0.24.dist-info → metacontroller_pytorch-0.0.26.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

metacontroller-pytorch 0.0.24__py3-none-any.whl → 0.0.26__py3-none-any.whl

metacontroller-pytorch 0.0.24py3-none-any.whl → 0.0.26py3-none-any.whl