PyPI - x-transformers - Versions diffs - 2.5.4__tar.gz → 2.5.6__tar.gz - Mend

{x_transformers-2.5.4 → x_transformers-2.5.6}/PKG-INFO +1 -1

{x_transformers-2.5.4 → x_transformers-2.5.6}/pyproject.toml +1 -1

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/autoregressive_wrapper.py +0 -1

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/x_transformers.py +1 -1

{x_transformers-2.5.4 → x_transformers-2.5.6}/.github/FUNDING.yml +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/.github/workflows/python-publish.yml +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/.github/workflows/python-test.yaml +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/.gitignore +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/LICENSE +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/README.md +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/data/README.md +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/data/enwik8.gz +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/all-attention.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/attention-on-attention.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/cosine-sim-attention.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/deepnorm.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/dynamic-pos-bias-linear.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/dynamic-pos-bias-log.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/dynamic-pos-bias-sinusoidal.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/dynamic-pos-bias.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/enhanced-recurrence.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/fcm.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/ffglu.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/flash-attention.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/gate_values.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/gating.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/length-extrapolation-scale.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/macaron-1.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/macaron-2.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/memory-transformer.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/normformer.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/pia.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/qknorm-analysis.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/resi_dual.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/residual_attn.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/rezero.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/rotary.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/sandwich-2.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/sandwich.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/sandwich_norm.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/scalenorm.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/talking-heads.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/topk-attention.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/images/xval.png +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/tests/test_x_transformers.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_belief_state.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_copy.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_entropy_tokenizer.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_enwik8.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_length_extrapolate.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/train_parity.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/__init__.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/attend.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/belief_state_wrapper.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/continuous.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/dpo.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/entropy_based_tokenizer.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/multi_input.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/neo_mlp.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/nonautoregressive_wrapper.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/up_wrapper.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/xl_autoregressive_wrapper.py +0 -0

{x_transformers-2.5.4 → x_transformers-2.5.6}/x_transformers/xval.py +0 -0

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: x-transformers
-Version: 2.5.4
+Version: 2.5.6
 Summary: X-Transformers
 Project-URL: Homepage, https://pypi.org/project/x-transformers/
 Project-URL: Repository, https://github.com/lucidrains/x-transformers

@@ -1,6 +1,6 @@
 [project]
 name = "x-transformers"
-version = "2.5.4"
+version = "2.5.6"
 description = "X-Transformers"
 authors = [
     { name = "Phil Wang", email = "lucidrains@gmail.com" }

@@ -393,7 +393,6 @@ class AutoregressiveWrapper(Module):
         seq_start_pos = None
         if exists(prompt_lens):
-            print('prompt lens')
             prompts = align_right(prompts, prompt_lens, pad_id = self.pad_value)
             seq_start_pos = t - prompt_lens

@@ -2267,7 +2267,7 @@ class AttentionLayers(Module):
         # whether it has post norm
-        self.final_norm = norm_fn() if pre_norm else nn.Identity()
+        self.final_norm = norm_fn() if pre_norm and pre_norm_has_final_norm else nn.Identity()
         # whether unet or not

x-transformers 2.5.4__tar.gz → 2.5.6__tar.gz

x-transformers 2.5.4tar.gz → 2.5.6tar.gz