PyPI - lalamo - Versions diffs - 0.5.11__tar.gz → 0.5.12__tar.gz - Mend

{lalamo-0.5.11 → lalamo-0.5.12}/PKG-INFO +1 -1

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/__init__.py +1 -1

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/gemma3.py +1 -1

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/loaders/huggingface.py +2 -2

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/PKG-INFO +1 -1

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_huggingface_model_conversion.py +2 -0

{lalamo-0.5.11 → lalamo-0.5.12}/LICENSE +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/README.md +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/data/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/data/huggingface_message.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/data/lalamo_completions.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/data/utils.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/main.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/message_processor.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/executorch.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/gemma2.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/gpt_oss.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/lfm2.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/llama.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/llamba.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/mistral.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/modern_bert.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/qwen2.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/decoder_configs/huggingface/qwen3.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/huggingface_generation_config.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/huggingface_tokenizer_config.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/loaders/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/loaders/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/loaders/executorch.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/loaders/utils.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/deepseek.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/essential_ai.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/gemma.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/gpt_oss.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/huggingface.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/lfm2.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/llama.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/llamba.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/mirai.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/mistral.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/pleias.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/polaris.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/qwen.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/model_import/model_specs/reka.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/models/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/models/classifier.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/models/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/models/language_model.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/activations.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/classifier.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/decoder.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/embedding.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/linear.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/mlp.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/mlx_interop.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/normalization.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/rope.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/attention.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/mamba.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/short_conv.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/state/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/state/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/state/kv_cache.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/state/mamba_state.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/token_mixers/state/short_conv_state.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/torch_interop.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/transformer.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/transformer_layer.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/modules/utils.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/quantization.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/registry_abc.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/sampling.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/__init__.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/common.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/estimator.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/inference.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/ngram.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/speculator/utils.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo/utils.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/SOURCES.txt +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/dependency_links.txt +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/entry_points.txt +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/requires.txt +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/lalamo.egg-info/top_level.txt +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/pyproject.toml +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/setup.cfg +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_cartesia_mlx_models.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_chat_template.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_generation.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_huggingface_models.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_lfm2_models.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_mlx_models.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_model_spec.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_models.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_moe.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_parameter_tree.py +0 -0

{lalamo-0.5.11 → lalamo-0.5.12}/tests/test_registry_abc.py +0 -0

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: lalamo
-Version: 0.5.11
+Version: 0.5.12
 Summary: JAX library for optimization and export of models for use with the UZU inference engine.
 Requires-Python: <4,>=3.12
 Description-Content-Type: text/markdown

@@ -15,7 +15,7 @@ from lalamo.speculator import (
     SpeculatorTrainingEvent,
 )
-__version__ = "0.5.11"
+__version__ = "0.5.12"
 __all__ = [
     "AssistantMessage",

@@ -46,7 +46,6 @@ class HFGemma3TextConfigRaw:
     model_type: Literal["gemma3_text"]
     num_hidden_layers: int
     sliding_window: int
-    sliding_window_pattern: int
     rms_norm_eps: float = 1e-06
     query_pre_attn_scalar: float = 256.0
     attention_bias: bool = False
@@ -55,6 +54,7 @@ class HFGemma3TextConfigRaw:
     attn_logit_softcapping: float | None = None
     head_dim: int = 256
     max_position_embeddings: int = 131072
+    sliding_window_pattern: int = 6
     rope_theta: float = 1000000.0
     rope_local_base_freq: float = 10000.0
     rope_scaling: GemmaRoPEScalingConfig | YarnRopeScalingConfig | None = None

@@ -350,9 +350,9 @@ def load_attention(
     weights_dict: Mapping[str, Array],
     path: ParameterPath,
 ) -> Attention:
-    if (path / "o_proj.weight") in weights_dict:
+    if (path / "o_proj.weight") in weights_dict or (path / "o_proj.qweight") in weights_dict:
         o_proj_name = "o_proj"
-    elif (path / "out_proj.weight") in weights_dict:
+    elif (path / "out_proj.weight") in weights_dict or (path / "out_proj.qweight") in weights_dict:
         o_proj_name = "out_proj"
     else:
         raise NotImplementedError("Can't determine attention output projection name")

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: lalamo
-Version: 0.5.11
+Version: 0.5.12
 Summary: JAX library for optimization and export of models for use with the UZU inference engine.
 Requires-Python: <4,>=3.12
 Description-Content-Type: text/markdown

@@ -22,8 +22,10 @@ from tests.test_models import DType, ModelTestSpec
 MODEL_LIST: list[ModelTestSpec] = [
     ModelTestSpec("trymirai/chat-moderation-router", DType.FLOAT32),
     ModelTestSpec("Qwen/Qwen3-0.6B", DType.FLOAT32),
+    ModelTestSpec("Qwen/Qwen3-4B-AWQ", DType.FLOAT32),
     ModelTestSpec("Qwen/Qwen2.5-0.5B-Instruct", DType.FLOAT32),
     ModelTestSpec("google/gemma-3-1b-it", DType.FLOAT32),
+    ModelTestSpec("google/gemma-3-4b-it", DType.FLOAT32),
     ModelTestSpec("deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", DType.FLOAT32),
     ModelTestSpec("meta-llama/Llama-3.2-1B-Instruct", DType.FLOAT32),
     ModelTestSpec("cartesia-ai/Llamba-1B", DType.FLOAT32),

lalamo 0.5.11__tar.gz → 0.5.12__tar.gz

lalamo 0.5.11tar.gz → 0.5.12tar.gz