PyPI - sae-lens - Versions diffs - 6.11.0__py3-none-any.whl → 6.12.0__py3-none-any.whl - Mend

sae-lens 6.11.0py3-none-any.whl → 6.12.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

sae_lens/__init__.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # ruff: noqa: E402
-__version__ = "6.11.0"
+__version__ = "6.12.0"
 import logging

sae_lens/pretrained_saes.yaml CHANGED Viewed

@@ -14828,4 +14828,58 @@ mntss-gemma-2-2b-2.5m-clt-as-per-layer:
     neuronpedia: gemma-2-2b/24-clt-hp
   - id: layer_25
     path: 25
-    neuronpedia: gemma-2-2b/25-clt-hp
+    neuronpedia: gemma-2-2b/25-clt-hp
+llama-3.1-8b-instruct-andyrdt:
+  conversion_func: dictionary_learning_1
+  model: meta-llama/Llama-3.1-8B-Instruct
+  repo_id: andyrdt/saes-llama-3.1-8b-instruct
+  saes:
+  - id: resid_post_layer_3_trainer_1
+    path: resid_post_layer_3/trainer_1
+    neuronpedia: llama3.1-8b-it/3-resid-post-ar
+  - id: resid_post_layer_7_trainer_1
+    path: resid_post_layer_7/trainer_1
+    neuronpedia: llama3.1-8b-it/7-resid-post-ar
+  - id: resid_post_layer_11_trainer_1
+    path: resid_post_layer_11/trainer_1
+    neuronpedia: llama3.1-8b-it/11-resid-post-ar
+  - id: resid_post_layer_15_trainer_1
+    path: resid_post_layer_15/trainer_1
+    neuronpedia: llama3.1-8b-it/15-resid-post-ar
+  - id: resid_post_layer_19_trainer_1
+    path: resid_post_layer_19/trainer_1
+    neuronpedia: llama3.1-8b-it/19-resid-post-ar
+  - id: resid_post_layer_23_trainer_1
+    path: resid_post_layer_23/trainer_1
+    neuronpedia: llama3.1-8b-it/23-resid-post-ar
+  - id: resid_post_layer_27_trainer_1
+    path: resid_post_layer_27/trainer_1
+    neuronpedia: llama3.1-8b-it/27-resid-post-ar
+qwen2.5-7b-instruct-andyrdt:
+  conversion_func: dictionary_learning_1
+  model: Qwen/Qwen2.5-7B-Instruct
+  repo_id: andyrdt/saes-qwen2.5-7b-instruct
+  saes:
+  - id: resid_post_layer_3_trainer_1
+    path: resid_post_layer_3/trainer_1
+    neuronpedia: qwen2.5-7b-it/3-resid-post-ar
+  - id: resid_post_layer_7_trainer_1
+    path: resid_post_layer_7/trainer_1
+    neuronpedia: qwen2.5-7b-it/7-resid-post-ar
+  - id: resid_post_layer_11_trainer_1
+    path: resid_post_layer_11/trainer_1
+    neuronpedia: qwen2.5-7b-it/11-resid-post-ar
+  - id: resid_post_layer_15_trainer_1
+    path: resid_post_layer_15/trainer_1
+    neuronpedia: qwen2.5-7b-it/15-resid-post-ar
+  - id: resid_post_layer_19_trainer_1
+    path: resid_post_layer_19/trainer_1
+    neuronpedia: qwen2.5-7b-it/19-resid-post-ar
+  - id: resid_post_layer_23_trainer_1
+    path: resid_post_layer_23/trainer_1
+    neuronpedia: qwen2.5-7b-it/23-resid-post-ar
+  - id: resid_post_layer_27_trainer_1
+    path: resid_post_layer_27/trainer_1
+    neuronpedia: qwen2.5-7b-it/27-resid-post-ar

sae_lens/saes/batchtopk_sae.py CHANGED Viewed

@@ -15,7 +15,7 @@ class BatchTopK(nn.Module):
     def __init__(
         self,
-        k: int,
+        k: float,
     ):
         super().__init__()
         self.k = k
@@ -23,7 +23,7 @@ class BatchTopK(nn.Module):
     def forward(self, x: torch.Tensor) -> torch.Tensor:
         acts = x.relu()
         flat_acts = acts.flatten()
-        acts_topk_flat = torch.topk(flat_acts, self.k * acts.shape[0], dim=-1)
+        acts_topk_flat = torch.topk(flat_acts, int(self.k * acts.shape[0]), dim=-1)
         return (
             torch.zeros_like(flat_acts)
             .scatter(-1, acts_topk_flat.indices, acts_topk_flat.values)
@@ -37,6 +37,7 @@ class BatchTopKTrainingSAEConfig(TopKTrainingSAEConfig):
     Configuration class for training a BatchTopKTrainingSAE.
     """
+    k: float = 100  # type: ignore[assignment]
     topk_threshold_lr: float = 0.01
     @override

{sae_lens-6.11.0.dist-info → sae_lens-6.12.0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.3
 Name: sae-lens
-Version: 6.11.0
+Version: 6.12.0
 Summary: Training and Analyzing Sparse Autoencoders (SAEs)
 License: MIT
 Keywords: deep-learning,sparse-autoencoders,mechanistic-interpretability,PyTorch

{sae_lens-6.11.0.dist-info → sae_lens-6.12.0.dist-info}/RECORD RENAMED Viewed

@@ -1,4 +1,4 @@
-sae_lens/__init__.py,sha256=87qzm9CROR5ywD55DSxpt_ut24G4O8MR2zGYDtHEA0Y,3589
+sae_lens/__init__.py,sha256=kTzPE14dVRpEIV0_yFC9whYCiJt6hoMQ33YhgwO83EI,3589
 sae_lens/analysis/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 sae_lens/analysis/hooked_sae_transformer.py,sha256=vRu6JseH1lZaEeILD5bEkQEQ1wYHHDcxD-f2olKmE9Y,14275
 sae_lens/analysis/neuronpedia_integration.py,sha256=Gx1W7hUBEuMoasNcnOnZ1wmqbXDd1pSZ1nqKEya1HQc,4962
@@ -12,10 +12,10 @@ sae_lens/loading/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,
 sae_lens/loading/pretrained_sae_loaders.py,sha256=CVzHntSUKR1X3_gAqn8K_Ajq8D85qBrmrgEgU93IV4A,49609
 sae_lens/loading/pretrained_saes_directory.py,sha256=4Vn-Jex6SveD7EbxcSOBv8cx1gkPfUMLU1QOP-ww1ZE,3752
 sae_lens/pretokenize_runner.py,sha256=w0f6SfZLAxbp5eAAKnet8RqUB_DKofZ9RGsoJwFnYbA,7058
-sae_lens/pretrained_saes.yaml,sha256=d6FYfWTdVAPlOCM55C1ICS6lF9nWPPVNwjlXCa9p7NU,600468
+sae_lens/pretrained_saes.yaml,sha256=n2BJVj8relA8OCbn9epJ5dFNg1_e9F9a4TouqjkXnts,602553
 sae_lens/registry.py,sha256=nhy7BPSudSATqW4lo9H_k3Na7sfGHmAf9v-3wpnLL_o,1490
 sae_lens/saes/__init__.py,sha256=jVwazK8Q6dW5J6_zFXPoNAuBvSxgziQ8eMOjGM3t-X8,1475
-sae_lens/saes/batchtopk_sae.py,sha256=CyaFG2hMyyDaEaXXrAMJC8wQDW1JoddTKF5mvxxBQKY,3395
+sae_lens/saes/batchtopk_sae.py,sha256=GX_J0vH4vzeLqYxl0mkfsZQpFEoCEHMR4dIG8fz8N8w,3449
 sae_lens/saes/gated_sae.py,sha256=qcmM9JwBA8aZR8z_IRHV1_gQX-q_63tKewWXRnhdXuo,8986
 sae_lens/saes/jumprelu_sae.py,sha256=HHBF1sJ95lZvxwP5vwLSQFKdnJN2KKYK0WAEaLTrta0,13399
 sae_lens/saes/sae.py,sha256=gdUZuLaOHQrPjbDj-nZI813B6-_mNAnV9i9z4qTnpHk,38255
@@ -33,7 +33,7 @@ sae_lens/training/types.py,sha256=qSjmGzXf3MLalygG0psnVjmhX_mpLmL47MQtZfe7qxg,81
 sae_lens/training/upload_saes_to_huggingface.py,sha256=r_WzI1zLtGZ5TzAxuG3xa_8T09j3zXJrWd_vzPsPGkQ,4469
 sae_lens/tutorial/tsea.py,sha256=fd1am_XXsf2KMbByDapJo-2qlxduKaa62Z2qcQZ3QKU,18145
 sae_lens/util.py,sha256=lW7fBn_b8quvRYlen9PUmB7km60YhKyjmuelB1f6KzQ,2253
-sae_lens-6.11.0.dist-info/LICENSE,sha256=DW6e-hDosiu4CfW0-imI57sV1I5f9UEslpviNQcOAKs,1069
-sae_lens-6.11.0.dist-info/METADATA,sha256=yEZL6kzNBUKjzd0d73Hiup6SpLNtNEGUOgFu0MwgVpo,5245
-sae_lens-6.11.0.dist-info/WHEEL,sha256=b4K_helf-jlQoXBBETfwnf4B04YC67LOev0jo4fX5m8,88
-sae_lens-6.11.0.dist-info/RECORD,,
+sae_lens-6.12.0.dist-info/LICENSE,sha256=DW6e-hDosiu4CfW0-imI57sV1I5f9UEslpviNQcOAKs,1069
+sae_lens-6.12.0.dist-info/METADATA,sha256=6L9rhKmaK8oQdRZ9-p0TxqpbBXCaY4bcwKqHP_NYnEw,5245
+sae_lens-6.12.0.dist-info/WHEEL,sha256=b4K_helf-jlQoXBBETfwnf4B04YC67LOev0jo4fX5m8,88
+sae_lens-6.12.0.dist-info/RECORD,,

{sae_lens-6.11.0.dist-info → sae_lens-6.12.0.dist-info}/LICENSE RENAMED Viewed

File without changes

{sae_lens-6.11.0.dist-info → sae_lens-6.12.0.dist-info}/WHEEL RENAMED Viewed

File without changes

sae-lens 6.11.0__py3-none-any.whl → 6.12.0__py3-none-any.whl

sae-lens 6.11.0py3-none-any.whl → 6.12.0py3-none-any.whl