PyPI - megatron-core - Versions diffs - 0.16.0rc0.dev108138__tar.gz → 0.16.0rc0.dev109400__tar.gz - Mend

megatron-core 0.16.0rc0.dev108138tar.gz → 0.16.0rc0.dev109400tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of megatron-core might be problematic. Click here for more details.

Files changed (360) hide show

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: megatron-core
-Version: 0.16.0rc0.dev108138
+Version: 0.16.0rc0.dev109400
 Summary: Megatron Core - a library for efficient and scalable training of transformer based models
 Author-email: NVIDIA <nemo-toolkit@nvidia.com>
 Maintainer-email: NVIDIA <nemo-toolkit@nvidia.com>
@@ -41,7 +41,7 @@ Requires-Dist: transformers; extra == "mlm"
 Provides-Extra: dev
 Requires-Dist: nvidia-modelopt[torch]; sys_platform != "darwin" and extra == "dev"
 Requires-Dist: transformer-engine[pytorch]<2.10.0,>=2.9.0a0; extra == "dev"
-Requires-Dist: nvidia-resiliency-ext; extra == "dev"
+Requires-Dist: nvidia-resiliency-ext<0.5.0,>=0.4.0a0; extra == "dev"
 Requires-Dist: tqdm; extra == "dev"
 Requires-Dist: einops~=0.8; extra == "dev"
 Requires-Dist: tensorstore!=0.1.46,!=0.1.72,~=0.1; extra == "dev"
@@ -59,20 +59,13 @@ Requires-Dist: wget; extra == "dev"
 Requires-Dist: onnxscript; extra == "dev"
 Provides-Extra: lts
 Requires-Dist: tqdm; extra == "lts"
-Requires-Dist: einops~=0.8; extra == "lts"
-Requires-Dist: tensorstore!=0.1.46,!=0.1.72,~=0.1; extra == "lts"
-Requires-Dist: nvtx~=0.2; extra == "lts"
-Requires-Dist: multi-storage-client~=0.27; extra == "lts"
-Requires-Dist: opentelemetry-api~=1.33.1; extra == "lts"
+Requires-Dist: einops; extra == "lts"
+Requires-Dist: tensorstore!=0.1.46,!=0.1.72; extra == "lts"
+Requires-Dist: nvtx; extra == "lts"
+Requires-Dist: transformers; extra == "lts"
+Requires-Dist: zarr; extra == "lts"
 Requires-Dist: setuptools<80.0.0; extra == "lts"
-Requires-Dist: mamba-ssm~=2.2; extra == "lts"
-Requires-Dist: causal-conv1d~=1.5; extra == "lts"
-Requires-Dist: nv-grouped-gemm~=1.1; extra == "lts"
-Requires-Dist: megatron-energon[av_decode]~=6.0; extra == "lts"
-Requires-Dist: av<16.0.0; extra == "lts"
-Requires-Dist: flashinfer-python; extra == "lts"
 Requires-Dist: wget; extra == "lts"
-Requires-Dist: onnxscript; extra == "lts"
 <div align="center">

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/megatron_tokenizer.py RENAMED Viewed

@@ -1,14 +1,11 @@
 # Copyright (c) 2024, NVIDIA CORPORATION. All rights reserved.
 import json
-import logging
 from abc import ABC, abstractmethod
 from collections import OrderedDict
 from typing import Any
 import numpy
-logger = logging.getLogger(__name__)
 class MegatronLegacyTokenizer(ABC):
     """Abstract class for tokenizer
@@ -23,12 +20,6 @@ class MegatronLegacyTokenizer(ABC):
     """
     def __init__(self, *tokenizer_paths: str, **tokenizer_options: Any):
-        # Deprecation warning
-        logger.warning(
-            "You’re using the legacy tokenizer system, which is deprecated "
-            "and will be removed in a future release. Please migrate to the new tokenizer system "
-            "(`megatron.core.tokenizers.MegatronTokenizer`)."
-        )
         self.unique_identifiers = OrderedDict()
         self.unique_identifiers["class"] = type(self).__name__
         self.unique_identifiers["tokenizer_path"] = list(tokenizer_paths)

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fp8_utils.py RENAMED Viewed

@@ -10,12 +10,6 @@ from typing import List, Optional
 import torch
 from megatron.core.enums import Fp8Recipe
-from megatron.core.tensor_parallel import (
-    ColumnParallelLinear,
-    RowParallelLinear,
-    gather_from_sequence_parallel_region,
-    reduce_scatter_to_sequence_parallel_region,
-)
 from megatron.core.transformer.transformer_config import TransformerConfig
 from megatron.core.utils import get_te_version, is_te_min_version
@@ -118,27 +112,6 @@ def get_fp8_align_size(fp8_recipe: Fp8Recipe) -> int:
         return 16
-def is_column_parallel_linear(module):
-    """Returns whether the given module is a ColumnParallelLinear layer."""
-    if HAVE_TE and (
-        isinstance(module, TEColumnParallelLinear)
-        or isinstance(module, TELayerNormColumnParallelLinear)
-    ):
-        return True
-    elif isinstance(module, ColumnParallelLinear):
-        return True
-    return False
-def is_row_parallel_linear(module):
-    """Returns whether the given module is a RowParallelLinear layer."""
-    if HAVE_TE and isinstance(module, TERowParallelLinear):
-        return True
-    elif isinstance(module, RowParallelLinear):
-        return True
-    return False
 """
 The code below abstracts the functionalities needed for implementing "--fp8-param-gather" into
 several functions. It provides different implementations for each function based on different
@@ -614,18 +587,6 @@ if HAVE_TE:
             if not FP8GlobalStateManager.is_fp8_enabled():
                 return original_forward(input_tensor, *args, **kwargs)
-            # With sequence parallelism we need to all-gather before padding
-            # and reduce-scatter after unpadding
-            if is_sequence_parallel := getattr(module, "sequence_parallel", False):
-                if is_column_parallel_linear(module):
-                    input_tensor = gather_from_sequence_parallel_region(
-                        input_tensor, group=module.tp_group
-                    )
-                # Disable sequence parallelism on the module because we are handling the
-                # all-gather and reduce-scatter externally
-                module.sequence_parallel = False
             seq_len, batch_size, hidden_size = input_tensor.shape
             # Reshape to (S, B*H) to pad sequence dimension
             input_2d = input_tensor.reshape(seq_len, -1)
@@ -651,16 +612,6 @@ if HAVE_TE:
             unpadded_output_2d = _unpad_func(output_2d, [seq_len])
             unpadded_output = unpadded_output_2d.reshape(seq_len, batch_size, output_hidden_size)
-            if is_sequence_parallel:
-                # Reduce-scatter after unpadding
-                if is_row_parallel_linear(module):
-                    unpadded_output = reduce_scatter_to_sequence_parallel_region(
-                        unpadded_output, group=module.tp_group
-                    )
-                # Reset sequence parallelism flag on the module
-                module.sequence_parallel = True
             if other_outputs:
                 return (unpadded_output,) + other_outputs
             else:

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/package_info.py RENAMED Viewed

@@ -4,7 +4,7 @@
 MAJOR = 0
 MINOR = 16
 PATCH = 0
-PRE_RELEASE = 'rc0.dev108138'
+PRE_RELEASE = 'rc0.dev109400'
 # Use the following formatting: (major, minor, patch, pre-release)
 VERSION = (MAJOR, MINOR, PATCH, PRE_RELEASE)

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron_core.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: megatron-core
-Version: 0.16.0rc0.dev108138
+Version: 0.16.0rc0.dev109400
 Summary: Megatron Core - a library for efficient and scalable training of transformer based models
 Author-email: NVIDIA <nemo-toolkit@nvidia.com>
 Maintainer-email: NVIDIA <nemo-toolkit@nvidia.com>
@@ -41,7 +41,7 @@ Requires-Dist: transformers; extra == "mlm"
 Provides-Extra: dev
 Requires-Dist: nvidia-modelopt[torch]; sys_platform != "darwin" and extra == "dev"
 Requires-Dist: transformer-engine[pytorch]<2.10.0,>=2.9.0a0; extra == "dev"
-Requires-Dist: nvidia-resiliency-ext; extra == "dev"
+Requires-Dist: nvidia-resiliency-ext<0.5.0,>=0.4.0a0; extra == "dev"
 Requires-Dist: tqdm; extra == "dev"
 Requires-Dist: einops~=0.8; extra == "dev"
 Requires-Dist: tensorstore!=0.1.46,!=0.1.72,~=0.1; extra == "dev"
@@ -59,20 +59,13 @@ Requires-Dist: wget; extra == "dev"
 Requires-Dist: onnxscript; extra == "dev"
 Provides-Extra: lts
 Requires-Dist: tqdm; extra == "lts"
-Requires-Dist: einops~=0.8; extra == "lts"
-Requires-Dist: tensorstore!=0.1.46,!=0.1.72,~=0.1; extra == "lts"
-Requires-Dist: nvtx~=0.2; extra == "lts"
-Requires-Dist: multi-storage-client~=0.27; extra == "lts"
-Requires-Dist: opentelemetry-api~=1.33.1; extra == "lts"
+Requires-Dist: einops; extra == "lts"
+Requires-Dist: tensorstore!=0.1.46,!=0.1.72; extra == "lts"
+Requires-Dist: nvtx; extra == "lts"
+Requires-Dist: transformers; extra == "lts"
+Requires-Dist: zarr; extra == "lts"
 Requires-Dist: setuptools<80.0.0; extra == "lts"
-Requires-Dist: mamba-ssm~=2.2; extra == "lts"
-Requires-Dist: causal-conv1d~=1.5; extra == "lts"
-Requires-Dist: nv-grouped-gemm~=1.1; extra == "lts"
-Requires-Dist: megatron-energon[av_decode]~=6.0; extra == "lts"
-Requires-Dist: av<16.0.0; extra == "lts"
-Requires-Dist: flashinfer-python; extra == "lts"
 Requires-Dist: wget; extra == "lts"
-Requires-Dist: onnxscript; extra == "lts"
 <div align="center">

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron_core.egg-info/requires.txt RENAMED Viewed

@@ -4,7 +4,7 @@ packaging>=24.2
 [dev]
 transformer-engine[pytorch]<2.10.0,>=2.9.0a0
-nvidia-resiliency-ext
+nvidia-resiliency-ext<0.5.0,>=0.4.0a0
 tqdm
 einops~=0.8
 tensorstore!=0.1.46,!=0.1.72,~=0.1
@@ -26,20 +26,13 @@ nvidia-modelopt[torch]
 [lts]
 tqdm
-einops~=0.8
-tensorstore!=0.1.46,!=0.1.72,~=0.1
-nvtx~=0.2
-multi-storage-client~=0.27
-opentelemetry-api~=1.33.1
+einops
+tensorstore!=0.1.46,!=0.1.72
+nvtx
+transformers
+zarr
 setuptools<80.0.0
-mamba-ssm~=2.2
-causal-conv1d~=1.5
-nv-grouped-gemm~=1.1
-megatron-energon[av_decode]~=6.0
-av<16.0.0
-flashinfer-python
 wget
-onnxscript
 [mlm]
 flask-restful

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/pyproject.toml RENAMED Viewed

@@ -69,7 +69,7 @@ mlm = ["flask-restful", "sentencepiece", "tiktoken", "wandb", "transformers"]
 dev = [
     "nvidia-modelopt[torch]; sys_platform != 'darwin'",
     "transformer-engine[pytorch]>=2.9.0a0,<2.10.0",
-    "nvidia-resiliency-ext",
+    "nvidia-resiliency-ext>=0.4.0a0,<0.5.0",
     "tqdm",
     "einops~=0.8",
     "tensorstore~=0.1,!=0.1.46,!=0.1.72",
@@ -89,20 +89,13 @@ dev = [
 lts = [
     "tqdm",
-    "einops~=0.8",
-    "tensorstore~=0.1,!=0.1.46,!=0.1.72",
-    "nvtx~=0.2",
-    "multi-storage-client~=0.27",
-    "opentelemetry-api~=1.33.1",
+    "einops",
+    "tensorstore!=0.1.46,!=0.1.72",
+    "nvtx",
+    "transformers",
+    "zarr",
     "setuptools<80.0.0",
-    "mamba-ssm~=2.2",
-    "causal-conv1d~=1.5",
-    "nv-grouped-gemm~=1.1",
-    "megatron-energon[av_decode]~=6.0",
-    "av<16.0.0",                          # At the time, av 16.0.0 is not compatible with Python 3.12
-    "flashinfer-python",
     "wget",
-    "onnxscript",
 ]
 [dependency-groups]

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/MANIFEST.in RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/README.md RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/README.md RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/activations.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/config_logger.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/bert_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/blended_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/blended_megatron_dataset_builder.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/blended_megatron_dataset_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/gpt_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/helpers.cpp RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/helpers.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/indexed_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/masked_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/megatron_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/multimodal_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/object_storage_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/config/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/config/bert_embedders.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/config/config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/config/gpt_chunk_datasets.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/config/tokenizers.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/db/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/db/build.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/db/dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/db/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/external_libs.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/build.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/factory.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/index.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/indexes/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/indexes/faiss_base.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/indexes/faiss_par_add.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/index/validate.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/gpt_chunk_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/multi_split_gpt_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/query.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/retro_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/query/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/retro/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/t5_dataset.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/datasets/utils_s3.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/core.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/dict_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/exchange_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/mapping.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/optimizer.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/serialization.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/state_dict_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/async_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/base.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/cached_metadata_filesystem_reader.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/checkpointable.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/common.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/filesystem_async.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/fully_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/resharding.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/state_dict_saver.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/tensorstore.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/torch.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/two_stage.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/strategies/zarr.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/tensor_aware_state_dict.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/dist_checkpointing/validation.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/data_parallel_base.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/distributed_data_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/distributed_data_parallel_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/finalize_model_grads.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/mcore_fsdp_adapter.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/distributed_data_parallel_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/fully_shard.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/megatron_fsdp.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/package_info.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/param_and_grad_buffer.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/uneven_dtensor.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/fsdp/src/megatron_fsdp/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/param_and_grad_buffer.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/reduce_scatter_with_fp32_accumulation.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/torch_fully_sharded_data_parallel.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/distributed/torch_fully_sharded_data_parallel_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/energy_monitor.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/enums.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/data_type.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/export_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/model_type.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/engine_builder/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/engine_builder/trtllm_engine_builder.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/model_to_trllm_mapping/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/model_to_trllm_mapping/default_conversion_dict.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trt_model_config.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trt_model_type.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_helper.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_layers.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_weights_converter/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_weights_converter/distributed_trtllm_model_weights_converter.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_weights_converter/single_device_trtllm_model_weights_converter.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/export/trtllm/trtllm_weights_converter/utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/extensions/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/extensions/kitchen.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/extensions/transformer_engine.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/extensions/transformer_engine_spec_provider.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fp4_utils.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/full_cuda_graph.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/__init__.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_bias_dropout.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_bias_geglu.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_bias_gelu.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_bias_swiglu.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_cross_entropy.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_indices_converter.py RENAMED Viewed

File without changes

{megatron_core-0.16.0rc0.dev108138 → megatron_core-0.16.0rc0.dev109400}/megatron/core/fusions/fused_layer_norm.py RENAMED Viewed

File without changes

megatron-core 0.16.0rc0.dev108138__tar.gz → 0.16.0rc0.dev109400__tar.gz

Potentially problematic release.

megatron-core 0.16.0rc0.dev108138tar.gz → 0.16.0rc0.dev109400tar.gz