PyPI - megatron-core - Versions diffs - 0.13.0rc3__tar.gz → 0.13.1__tar.gz - Mend

megatron-core 0.13.0rc3tar.gz → 0.13.1tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of megatron-core might be problematic. Click here for more details.

Files changed (306) hide show

{megatron_core-0.13.0rc3/megatron_core.egg-info → megatron_core-0.13.1}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: megatron-core
-Version: 0.13.0rc3
+Version: 0.13.1
 Summary: Megatron Core - a library for efficient and scalable training of transformer based models
 Author-email: NVIDIA <nemo-toolkit@nvidia.com>
 Maintainer-email: NVIDIA <nemo-toolkit@nvidia.com>

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/T5/t5_spec.py RENAMED Viewed

@@ -16,6 +16,8 @@ from megatron.core.transformer.transformer_block import TransformerBlockSubmodul
 from megatron.core.transformer.transformer_layer import TransformerLayer, TransformerLayerSubmodules
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         TEColumnParallelLinear,
         TEDotProductAttention,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/bert/bert_layer_specs.py RENAMED Viewed

@@ -12,6 +12,8 @@ from megatron.core.transformer.spec_utils import ModuleSpec
 from megatron.core.transformer.transformer_layer import TransformerLayer, TransformerLayerSubmodules
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         TEDotProductAttention,
         TELayerNormColumnParallelLinear,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/common/embeddings/rotary_pos_embedding.py RENAMED Viewed

@@ -315,5 +315,5 @@ class MultimodalRotaryEmbedding(nn.Module):
         if parallel_state.get_context_parallel_world_size() > 1:
             # slice rotary_pos_emb along sequence dimension and select the parition of the current
             # CP rank
-            emb = get_pos_emb_on_this_cp_rank(emb, 1)
+            emb = get_pos_emb_on_this_cp_rank(emb, 0, parallel_state.get_context_parallel_group())
         return emb

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/gpt/gpt_layer_specs.py RENAMED Viewed

@@ -34,6 +34,8 @@ from megatron.core.transformer.transformer_layer import (
 )
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import TEFusedMLP, TENorm
     from megatron.core.extensions.transformer_engine_spec_provider import TESpecProvider
@@ -42,6 +44,8 @@ except ImportError:
     HAVE_TE = False
 try:
+    import nvidia_kitchen  # pylint: disable=unused-import
     from megatron.core.extensions.kitchen import KitchenSpecProvider
     HAVE_KITCHEN = True

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/gpt/heterogeneous/heterogeneous_layer_specs.py RENAMED Viewed

@@ -29,6 +29,8 @@ from megatron.core.transformer.transformer_layer import (
 from megatron.core.utils import is_te_min_version
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         TEDotProductAttention,
         TELayerNormColumnParallelLinear,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/gpt/moe_module_specs.py RENAMED Viewed

@@ -9,6 +9,8 @@ from megatron.core.transformer.moe.shared_experts import SharedExpertMLP
 from megatron.core.transformer.spec_utils import ModuleSpec
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine_spec_provider import TESpecProvider
     HAVE_TE = True

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/retro/decoder_spec.py RENAMED Viewed

@@ -40,6 +40,8 @@ except ImportError:
     HAVE_APEX = False
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         TEColumnParallelLinear,
         TEDotProductAttention,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/models/retro/encoder_spec.py RENAMED Viewed

@@ -21,6 +21,8 @@ from megatron.core.transformer.mlp import MLP, MLPSubmodules
 from megatron.core.transformer.transformer_block import TransformerBlockSubmodules
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         TEColumnParallelLinear,
         TEDotProductAttention,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/package_info.py RENAMED Viewed

@@ -3,8 +3,8 @@
 MAJOR = 0
 MINOR = 13
-PATCH = 0
-PRE_RELEASE = 'rc3'
+PATCH = 1
+PRE_RELEASE = ''
 # Use the following formatting: (major, minor, patch, pre-release)
 VERSION = (MAJOR, MINOR, PATCH, PRE_RELEASE)

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/cuda_graphs.py RENAMED Viewed

@@ -23,6 +23,7 @@ from megatron.core.transformer.transformer_config import TransformerConfig
 from megatron.core.utils import is_te_min_version
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from transformer_engine.pytorch.fp8 import FP8GlobalStateManager, fp8_autocast
     from transformer_engine.pytorch.graph import restore_fp8_tensors, save_fp8_tensors
     from transformer_engine.pytorch.graph import set_capture_end as te_set_capture_end

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/heterogeneous/linear_replacements.py RENAMED Viewed

@@ -16,6 +16,8 @@ from megatron.core.transformer.transformer_config import TransformerConfig
 from megatron.core.utils import divide
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import TELayerNormColumnParallelLinear
     HAVE_TE = True
@@ -67,6 +69,7 @@ if HAVE_TE:
             )
         def forward(self, x, **kwargs):
+            """Forward of TELayerNormColumnParallelLinearGathered"""
             out, bias = super().forward(x)
             assert bias is None, "bias should be None since we set skip_bias_add=False"
@@ -100,6 +103,7 @@ class ColumnParallelLinearGathered(ColumnParallelLinear):
         runtime_gather_output: bool | None = None,
         **kwargs,
     ):
+        """Forward of ColumnParallelLinearGathered"""
         out, bias = super().forward(input_, weight, runtime_gather_output)
         assert bias is None, "bias should be None since we set skip_bias_add=False"

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/moe/experts.py RENAMED Viewed

@@ -40,6 +40,7 @@ from megatron.core.transformer.utils import (
 )
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import Fp8Padding, Fp8Unpadding

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/moe/moe_layer.py RENAMED Viewed

@@ -21,6 +21,8 @@ from megatron.core.transformer.spec_utils import ModuleSpec, build_module
 from megatron.core.transformer.transformer_config import TransformerConfig
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import te_checkpoint
     HAVE_TE = True

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/moe/moe_utils.py RENAMED Viewed

@@ -10,6 +10,8 @@ from megatron.core.process_groups_config import ModelCommProcessGroups
 from megatron.core.tensor_parallel.mappings import gather_from_sequence_parallel_region
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine import (
         fused_permute,
         fused_permute_with_probs,

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/multi_token_prediction.py RENAMED Viewed

@@ -32,6 +32,8 @@ SUPPORTED_ATTN_MASK = [
 ]
 try:
+    import transformer_engine as te  # pylint: disable=unused-import
     from megatron.core.extensions.transformer_engine_spec_provider import TESpecProvider
     HAVE_TE = True

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/transformer/transformer_block.py RENAMED Viewed

@@ -28,27 +28,38 @@ from megatron.core.transformer.utils import sharded_state_dict_default
 from megatron.core.utils import WrappedTensor, deprecate_inference_params, make_viewless_tensor
 try:
+    import transformer_engine.pytorch as te  # pylint: disable=unused-import
+    HAVE_TE = True
+except ImportError:
+    HAVE_TE = False
+try:
+    import apex  # pylint: disable=unused-import
+    HAVE_APEX = True
+except ImportError:
+    HAVE_APEX = False
+get_cpu_offload_context = None
+te_checkpoint = None
+if HAVE_TE:
     from megatron.core.extensions.transformer_engine import (
         TENorm,
         get_cpu_offload_context,
         te_checkpoint,
     )
-    HAVE_TE = True
     LayerNormImpl = TENorm
-except ImportError:
-    HAVE_TE = False
-    get_cpu_offload_context = None
-    try:
-        import apex  # pylint: disable=unused-import
-        LayerNormImpl = FusedLayerNorm
+elif HAVE_APEX:
+    LayerNormImpl = FusedLayerNorm
-    except ImportError:
-        from megatron.core.transformer.torch_norm import WrappedTorchNorm
+else:
+    from megatron.core.transformer.torch_norm import WrappedTorchNorm
-        LayerNormImpl = WrappedTorchNorm
+    LayerNormImpl = WrappedTorchNorm
 def get_num_layers_to_build(config: TransformerConfig, vp_stage: Optional[int] = None) -> int:

{megatron_core-0.13.0rc3 → megatron_core-0.13.1/megatron_core.egg-info}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: megatron-core
-Version: 0.13.0rc3
+Version: 0.13.1
 Summary: Megatron Core - a library for efficient and scalable training of transformer based models
 Author-email: NVIDIA <nemo-toolkit@nvidia.com>
 Maintainer-email: NVIDIA <nemo-toolkit@nvidia.com>

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/pyproject.toml RENAMED Viewed

@@ -171,7 +171,8 @@ source = ["/opt/megatron-lm/"]
 [tool.ruff.lint]
 # Enable all `pydocstyle` rules, limiting to those that adhere to the
 # Google convention via `convention = "google"`, below.
-select = ["D", "F"]
+# select = ["D", "F"]
+select = ["S506"]
 # - On top of the Google convention, disable `D417`, which requires
 #   documentation for every function parameter.

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/LICENSE RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/MANIFEST.in RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/README.md RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/README.md RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/config_logger.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/bert_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/blended_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/blended_megatron_dataset_builder.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/blended_megatron_dataset_config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/gpt_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/helpers.cpp RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/helpers.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/indexed_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/masked_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/megatron_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/megatron_tokenizer.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/multimodal_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/object_storage_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/config/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/config/bert_embedders.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/config/config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/config/gpt_chunk_datasets.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/config/tokenizers.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/db/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/db/build.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/db/dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/db/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/external_libs.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/build.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/factory.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/index.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/indexes/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/indexes/faiss_base.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/indexes/faiss_par_add.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/index/validate.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/gpt_chunk_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/multi_split_gpt_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/query.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/retro_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/query/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/retro/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/t5_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/utils_object_storage.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/datasets/utils_s3.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/core.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/dict_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/exchange_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/mapping.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/optimizer.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/serialization.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/state_dict_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/async_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/base.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/cached_metadata_filesystem_reader.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/common.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/filesystem_async.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/fully_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/resharding.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/state_dict_saver.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/tensorstore.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/torch.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/two_stage.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/strategies/zarr.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/tensor_aware_state_dict.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/dist_checkpointing/validation.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/custom_fsdp/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/custom_fsdp/fully_sharded_data_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/custom_fsdp/param_and_grad_buffer.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/data_parallel_base.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/distributed_data_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/distributed_data_parallel_config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/finalize_model_grads.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/param_and_grad_buffer.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/torch_fully_sharded_data_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/distributed/torch_fully_sharded_data_parallel_config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/energy_monitor.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/enums.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/data_type.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/export_config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/model_type.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/engine_builder/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/engine_builder/trtllm_engine_builder.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/model_to_trllm_mapping/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/model_to_trllm_mapping/default_conversion_dict.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trt_model_config.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trt_model_type.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_helper.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_layers.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_weights_converter/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_weights_converter/distributed_trtllm_model_weights_converter.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_weights_converter/single_device_trtllm_model_weights_converter.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/export/trtllm/trtllm_weights_converter/utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/extensions/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/extensions/kitchen.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/extensions/transformer_engine.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/extensions/transformer_engine_spec_provider.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fp8_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_bias_dropout.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_bias_geglu.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_bias_gelu.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_bias_swiglu.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_cross_entropy.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_indices_converter.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_layer_norm.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_mla_yarn_rope_apply.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_pad_routing_map.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/fusions/fused_softmax.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/async_stream.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/common_inference_params.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/communication_utils.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/contexts/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/contexts/base_context.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/contexts/dynamic_chunk_allocator.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/contexts/dynamic_context.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/contexts/static_context.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/engines/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.13.0rc3 → megatron_core-0.13.1}/megatron/core/inference/engines/abstract_engine.py RENAMED Viewed

File without changes

megatron-core 0.13.0rc3__tar.gz → 0.13.1__tar.gz

Potentially problematic release.

megatron-core 0.13.0rc3tar.gz → 0.13.1tar.gz