PyPI - mindspore - Versions diffs - 2.3.0__cp310-cp310-win_amd64.whl → 2.4.0__cp310-cp310-win_amd64.whl - Mend

mindspore 2.3.0__cp310-cp310-win_amd64.whl → 2.4.0__cp310-cp310-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (308) hide show

mindspore/.commit_id +1 -1
mindspore/Microsoft.VisualStudio.Telemetry.dll +0 -0
mindspore/Newtonsoft.Json.dll +0 -0
mindspore/__init__.py +3 -1
mindspore/_c_dataengine.cp310-win_amd64.pyd +0 -0
mindspore/_c_expression.cp310-win_amd64.pyd +0 -0
mindspore/_c_mindrecord.cp310-win_amd64.pyd +0 -0
mindspore/_checkparam.py +50 -9
mindspore/_extends/parse/compile_config.py +41 -0
mindspore/_extends/parse/parser.py +9 -7
mindspore/_extends/parse/standard_method.py +52 -14
mindspore/_extends/pijit/pijit_func_white_list.py +350 -24
mindspore/amp.py +24 -10
mindspore/atlprov.dll +0 -0
mindspore/avcodec-59.dll +0 -0
mindspore/avdevice-59.dll +0 -0
mindspore/avfilter-8.dll +0 -0
mindspore/avformat-59.dll +0 -0
mindspore/avutil-57.dll +0 -0
mindspore/c1.dll +0 -0
mindspore/c1xx.dll +0 -0
mindspore/c2.dll +0 -0
mindspore/common/__init__.py +6 -4
mindspore/common/_pijit_context.py +190 -0
mindspore/common/_register_for_tensor.py +2 -1
mindspore/common/_tensor_overload.py +139 -0
mindspore/common/api.py +102 -87
mindspore/common/dump.py +5 -6
mindspore/common/generator.py +1 -7
mindspore/common/hook_handle.py +14 -26
mindspore/common/mindir_util.py +2 -2
mindspore/common/parameter.py +46 -13
mindspore/common/recompute.py +39 -9
mindspore/common/sparse_tensor.py +7 -3
mindspore/common/tensor.py +209 -29
mindspore/communication/__init__.py +1 -1
mindspore/communication/_comm_helper.py +38 -3
mindspore/communication/comm_func.py +310 -55
mindspore/communication/management.py +14 -14
mindspore/context.py +123 -22
mindspore/dataset/__init__.py +1 -1
mindspore/dataset/audio/__init__.py +1 -1
mindspore/dataset/core/config.py +7 -0
mindspore/dataset/core/validator_helpers.py +7 -0
mindspore/dataset/engine/cache_client.py +1 -1
mindspore/dataset/engine/datasets.py +72 -44
mindspore/dataset/engine/datasets_audio.py +7 -7
mindspore/dataset/engine/datasets_standard_format.py +53 -3
mindspore/dataset/engine/datasets_text.py +20 -20
mindspore/dataset/engine/datasets_user_defined.py +174 -104
mindspore/dataset/engine/datasets_vision.py +33 -33
mindspore/dataset/engine/iterators.py +29 -0
mindspore/dataset/engine/obs/util.py +7 -0
mindspore/dataset/engine/queue.py +114 -60
mindspore/dataset/engine/serializer_deserializer.py +2 -2
mindspore/dataset/engine/validators.py +34 -14
mindspore/dataset/text/__init__.py +1 -4
mindspore/dataset/transforms/__init__.py +0 -3
mindspore/dataset/utils/line_reader.py +2 -0
mindspore/dataset/vision/__init__.py +1 -4
mindspore/dataset/vision/utils.py +1 -1
mindspore/dataset/vision/validators.py +2 -1
mindspore/dnnl.dll +0 -0
mindspore/dpcmi.dll +0 -0
mindspore/{nn/extend → experimental/es}/__init__.py +4 -11
mindspore/experimental/es/embedding_service.py +883 -0
mindspore/{nn/layer → experimental/es}/embedding_service_layer.py +218 -30
mindspore/experimental/llm_boost/__init__.py +21 -0
mindspore/{nn/extend/layer → experimental/llm_boost/atb}/__init__.py +4 -8
mindspore/experimental/llm_boost/atb/boost_base.py +211 -0
mindspore/experimental/llm_boost/atb/llama_boost.py +115 -0
mindspore/experimental/llm_boost/atb/qwen_boost.py +101 -0
mindspore/experimental/llm_boost/register.py +129 -0
mindspore/experimental/llm_boost/utils.py +31 -0
mindspore/experimental/optim/adamw.py +85 -0
mindspore/experimental/optim/optimizer.py +3 -0
mindspore/hal/__init__.py +3 -3
mindspore/hal/contiguous_tensors_handle.py +175 -0
mindspore/hal/stream.py +18 -0
mindspore/include/api/model_group.h +13 -1
mindspore/include/api/types.h +10 -10
mindspore/include/dataset/config.h +2 -2
mindspore/include/dataset/constants.h +2 -2
mindspore/include/dataset/execute.h +2 -2
mindspore/include/dataset/vision.h +4 -0
mindspore/jpeg62.dll +0 -0
mindspore/log.py +1 -1
mindspore/mindrecord/filewriter.py +68 -51
mindspore/mindspore_backend.dll +0 -0
mindspore/mindspore_common.dll +0 -0
mindspore/mindspore_core.dll +0 -0
mindspore/mindspore_glog.dll +0 -0
mindspore/mindspore_np_dtype.dll +0 -0
mindspore/mindspore_ops.dll +0 -0
mindspore/mint/__init__.py +495 -46
mindspore/mint/distributed/__init__.py +31 -0
mindspore/mint/distributed/distributed.py +254 -0
mindspore/mint/nn/__init__.py +266 -21
mindspore/mint/nn/functional.py +125 -19
mindspore/mint/nn/layer/__init__.py +39 -0
mindspore/mint/nn/layer/activation.py +133 -0
mindspore/mint/nn/layer/normalization.py +477 -0
mindspore/mint/nn/layer/pooling.py +110 -0
mindspore/mint/optim/adamw.py +28 -7
mindspore/mint/special/__init__.py +63 -0
mindspore/msobj140.dll +0 -0
mindspore/mspdb140.dll +0 -0
mindspore/mspdbcore.dll +0 -0
mindspore/mspdbst.dll +0 -0
mindspore/mspft140.dll +0 -0
mindspore/msvcdis140.dll +0 -0
mindspore/msvcp140_1.dll +0 -0
mindspore/msvcp140_2.dll +0 -0
mindspore/msvcp140_atomic_wait.dll +0 -0
mindspore/msvcp140_codecvt_ids.dll +0 -0
mindspore/multiprocessing/__init__.py +2 -1
mindspore/nn/__init__.py +0 -1
mindspore/nn/cell.py +275 -93
mindspore/nn/layer/activation.py +211 -44
mindspore/nn/layer/basic.py +113 -3
mindspore/nn/layer/embedding.py +120 -2
mindspore/nn/layer/normalization.py +101 -5
mindspore/nn/layer/padding.py +34 -48
mindspore/nn/layer/pooling.py +161 -7
mindspore/nn/layer/transformer.py +3 -3
mindspore/nn/loss/__init__.py +2 -2
mindspore/nn/loss/loss.py +84 -6
mindspore/nn/optim/__init__.py +2 -1
mindspore/nn/optim/adadelta.py +1 -1
mindspore/nn/optim/adam.py +1 -1
mindspore/nn/optim/lamb.py +1 -1
mindspore/nn/optim/tft_wrapper.py +127 -0
mindspore/nn/wrap/cell_wrapper.py +12 -23
mindspore/nn/wrap/grad_reducer.py +5 -5
mindspore/nn/wrap/loss_scale.py +17 -3
mindspore/numpy/__init__.py +1 -1
mindspore/numpy/array_creations.py +65 -68
mindspore/numpy/array_ops.py +64 -60
mindspore/numpy/fft.py +610 -75
mindspore/numpy/logic_ops.py +11 -10
mindspore/numpy/math_ops.py +85 -84
mindspore/numpy/utils_const.py +4 -4
mindspore/opencv_core452.dll +0 -0
mindspore/opencv_imgcodecs452.dll +0 -0
mindspore/opencv_imgproc452.dll +0 -0
mindspore/ops/__init__.py +6 -4
mindspore/ops/_grad_experimental/grad_comm_ops.py +47 -3
mindspore/ops/_grad_experimental/grad_math_ops.py +0 -22
mindspore/ops/_vmap/vmap_array_ops.py +2 -4
mindspore/ops/_vmap/vmap_math_ops.py +17 -1
mindspore/ops/_vmap/vmap_nn_ops.py +43 -2
mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py +85 -7
mindspore/ops/auto_generate/gen_arg_dtype_cast.py +2 -0
mindspore/ops/auto_generate/gen_extend_func.py +734 -13
mindspore/ops/auto_generate/gen_ops_def.py +2420 -381
mindspore/ops/auto_generate/gen_ops_prim.py +5196 -1659
mindspore/ops/auto_generate/pyboost_inner_prim.py +176 -56
mindspore/ops/composite/base.py +85 -48
mindspore/ops/composite/multitype_ops/_compile_utils.py +1 -0
mindspore/ops/composite/multitype_ops/not_in_impl.py +2 -2
mindspore/ops/function/__init__.py +22 -0
mindspore/ops/function/array_func.py +490 -153
mindspore/ops/function/debug_func.py +113 -1
mindspore/ops/function/fft_func.py +15 -2
mindspore/ops/function/grad/grad_func.py +3 -2
mindspore/ops/function/math_func.py +558 -207
mindspore/ops/function/nn_func.py +817 -383
mindspore/ops/function/other_func.py +3 -2
mindspore/ops/function/random_func.py +184 -8
mindspore/ops/function/reshard_func.py +13 -11
mindspore/ops/function/sparse_unary_func.py +1 -1
mindspore/ops/function/vmap_func.py +3 -2
mindspore/ops/functional.py +24 -14
mindspore/ops/op_info_register.py +3 -3
mindspore/ops/operations/__init__.py +6 -1
mindspore/ops/operations/_grad_ops.py +2 -76
mindspore/ops/operations/_infer_ops.py +1 -1
mindspore/ops/operations/_inner_ops.py +71 -94
mindspore/ops/operations/array_ops.py +12 -146
mindspore/ops/operations/comm_ops.py +42 -53
mindspore/ops/operations/custom_ops.py +83 -19
mindspore/ops/operations/debug_ops.py +42 -10
mindspore/ops/operations/manually_defined/_inner.py +12 -0
mindspore/ops/operations/manually_defined/ops_def.py +265 -10
mindspore/ops/operations/math_ops.py +12 -223
mindspore/ops/operations/nn_ops.py +20 -114
mindspore/ops/operations/other_ops.py +7 -4
mindspore/ops/operations/random_ops.py +46 -1
mindspore/ops/primitive.py +18 -6
mindspore/ops_generate/arg_dtype_cast.py +2 -0
mindspore/ops_generate/gen_aclnn_implement.py +11 -11
mindspore/ops_generate/gen_constants.py +36 -0
mindspore/ops_generate/gen_ops.py +67 -52
mindspore/ops_generate/gen_ops_inner_prim.py +1 -1
mindspore/ops_generate/gen_pyboost_func.py +131 -47
mindspore/ops_generate/op_proto.py +10 -3
mindspore/ops_generate/pyboost_utils.py +14 -1
mindspore/ops_generate/template.py +43 -21
mindspore/parallel/__init__.py +3 -1
mindspore/parallel/_auto_parallel_context.py +28 -8
mindspore/parallel/_cell_wrapper.py +83 -0
mindspore/parallel/_parallel_serialization.py +47 -19
mindspore/parallel/_tensor.py +81 -11
mindspore/parallel/_utils.py +13 -1
mindspore/parallel/algo_parameter_config.py +5 -5
mindspore/parallel/checkpoint_transform.py +46 -39
mindspore/parallel/cluster/process_entity/__init__.py +1 -1
mindspore/parallel/cluster/process_entity/_api.py +31 -23
mindspore/parallel/cluster/process_entity/_utils.py +2 -27
mindspore/parallel/parameter_broadcast.py +3 -4
mindspore/parallel/shard.py +162 -31
mindspore/parallel/transform_safetensors.py +993 -0
mindspore/pgodb140.dll +0 -0
mindspore/pgort140.dll +0 -0
mindspore/profiler/__init__.py +2 -1
mindspore/profiler/common/constant.py +29 -0
mindspore/profiler/common/registry.py +47 -0
mindspore/profiler/common/util.py +28 -0
mindspore/profiler/dynamic_profiler.py +694 -0
mindspore/profiler/envprofiling.py +17 -19
mindspore/profiler/parser/ascend_analysis/constant.py +18 -0
mindspore/profiler/parser/ascend_analysis/file_manager.py +25 -4
mindspore/profiler/parser/ascend_analysis/function_event.py +43 -19
mindspore/profiler/parser/ascend_analysis/fwk_cann_parser.py +31 -26
mindspore/profiler/parser/ascend_analysis/fwk_file_parser.py +56 -10
mindspore/profiler/parser/ascend_analysis/msprof_timeline_parser.py +55 -8
mindspore/profiler/parser/ascend_analysis/path_manager.py +313 -0
mindspore/profiler/parser/ascend_analysis/profiler_info_parser.py +27 -20
mindspore/profiler/parser/ascend_analysis/trace_event_manager.py +9 -2
mindspore/profiler/parser/ascend_msprof_exporter.py +5 -4
mindspore/profiler/parser/ascend_timeline_generator.py +27 -25
mindspore/profiler/parser/base_timeline_generator.py +19 -25
mindspore/profiler/parser/cpu_gpu_timeline_generator.py +25 -12
mindspore/profiler/parser/framework_parser.py +1 -391
mindspore/profiler/parser/gpu_analysis/__init__.py +14 -0
mindspore/profiler/parser/gpu_analysis/function_event.py +44 -0
mindspore/profiler/parser/gpu_analysis/fwk_file_parser.py +89 -0
mindspore/profiler/parser/gpu_analysis/profiler_info_parser.py +72 -0
mindspore/profiler/parser/memory_usage_parser.py +0 -154
mindspore/profiler/parser/profiler_info.py +78 -6
mindspore/profiler/profiler.py +153 -0
mindspore/profiler/profiling.py +280 -412
mindspore/rewrite/__init__.py +1 -2
mindspore/rewrite/common/namespace.py +4 -4
mindspore/rewrite/symbol_tree/symbol_tree.py +3 -3
mindspore/run_check/_check_version.py +36 -103
mindspore/safeguard/rewrite_obfuscation.py +591 -247
mindspore/swresample-4.dll +0 -0
mindspore/swscale-6.dll +0 -0
mindspore/tbbmalloc.dll +0 -0
mindspore/tinyxml2.dll +0 -0
mindspore/train/__init__.py +4 -3
mindspore/train/_utils.py +28 -2
mindspore/train/amp.py +171 -53
mindspore/train/callback/__init__.py +2 -2
mindspore/train/callback/_callback.py +4 -4
mindspore/train/callback/_checkpoint.py +85 -22
mindspore/train/callback/_cluster_monitor.py +1 -1
mindspore/train/callback/_flops_collector.py +1 -0
mindspore/train/callback/_loss_monitor.py +3 -3
mindspore/train/callback/_on_request_exit.py +134 -31
mindspore/train/callback/_summary_collector.py +5 -5
mindspore/train/callback/_tft_register.py +352 -0
mindspore/train/dataset_helper.py +7 -3
mindspore/train/metrics/metric.py +3 -3
mindspore/train/metrics/roc.py +4 -4
mindspore/train/mind_ir_pb2.py +44 -39
mindspore/train/model.py +134 -58
mindspore/train/serialization.py +336 -112
mindspore/turbojpeg.dll +0 -0
mindspore/utils/__init__.py +21 -0
mindspore/utils/utils.py +60 -0
mindspore/vcmeta.dll +0 -0
mindspore/vcruntime140.dll +0 -0
mindspore/vcruntime140_1.dll +0 -0
mindspore/version.py +1 -1
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/METADATA +6 -2
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/RECORD +281 -275
mindspore/include/c_api/ms/abstract.h +0 -67
mindspore/include/c_api/ms/attribute.h +0 -197
mindspore/include/c_api/ms/base/handle_types.h +0 -43
mindspore/include/c_api/ms/base/macros.h +0 -32
mindspore/include/c_api/ms/base/status.h +0 -33
mindspore/include/c_api/ms/base/types.h +0 -283
mindspore/include/c_api/ms/context.h +0 -102
mindspore/include/c_api/ms/graph.h +0 -160
mindspore/include/c_api/ms/node.h +0 -606
mindspore/include/c_api/ms/tensor.h +0 -161
mindspore/include/c_api/ms/value.h +0 -84
mindspore/mindspore_shared_lib.dll +0 -0
mindspore/nn/extend/basic.py +0 -140
mindspore/nn/extend/embedding.py +0 -143
mindspore/nn/extend/layer/normalization.py +0 -109
mindspore/nn/extend/pooling.py +0 -117
mindspore/nn/layer/embedding_service.py +0 -531
mindspore/ops/_op_impl/aicpu/strided_slice_v2.py +0 -93
mindspore/ops/_op_impl/aicpu/strided_slice_v2_grad.py +0 -66
mindspore/ops/extend/__init__.py +0 -53
mindspore/ops/extend/array_func.py +0 -218
mindspore/ops/extend/math_func.py +0 -76
mindspore/ops/extend/nn_func.py +0 -308
mindspore/ops/silent_check.py +0 -162
mindspore/profiler/parser/msadvisor_analyzer.py +0 -82
mindspore/profiler/parser/msadvisor_parser.py +0 -240
mindspore/train/callback/_mindio_ttp.py +0 -443
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/WHEEL +0 -0
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/entry_points.txt +0 -0
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/top_level.txt +0 -0

mindspore/experimental/llm_boost/atb/llama_boost.py ADDED Viewed

@@ -0,0 +1,115 @@
+# Copyright 2024 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+"""llm boost"""
+import json
+import mindspore.common.dtype as mstype
+from mindspore.experimental.llm_boost.atb.boost_base import AtbBoostBase
+from mindspore._c_expression import LlmBoostBinder
+from mindspore.experimental.llm_boost.register import LlmBoostRegister, LlmBoostType
+@LlmBoostRegister.register(LlmBoostType.BUILDIN, "Llama")
+class LlamaBoost(AtbBoostBase):
+    """LlamaBoost class"""
+    def __init__(self, config):
+        super().__init__(config)
+        self.in_tensor_length = 13
+        self.acl_encoder_operation_inputs = [None] * self.in_tensor_length
+        self.acl_decoder_operation_inputs = [None] * self.in_tensor_length
+        self.atb_encoder_operation = LlmBoostBinder(
+            "ATB", "llama_parallel_DecoderModel")
+        self.atb_decoder_operation = LlmBoostBinder(
+            "ATB", "llama_parallel_DecoderModel")
+    def init(self):
+        """set param"""
+        coder_param = {
+            "rmsNormEps": self.config.rms_norm_eps,
+            "numAttentionHeadsPerRank": self.config.num_heads // self.device_num,
+            "hiddenSizePerAttentionHead": self.head_dim,
+            "numHiddenLayers": self.num_layers,
+            "numKeyValueHeadsPerRank": self.n_kv_heads // self.device_num,
+            "skipWordEmbedding": False,
+            "isFA": False,
+            "isBF16": self.dtype == mstype.bfloat16,
+            "packQuantType": [[1, 1] for _ in range(self.num_layers)],
+            "linearQuantType": [[0, -1, -1, 0, 0, -1, 0] for _ in range(self.num_layers)],
+            "linearTransposeType": [[1, -1, -1, 1, 1, -1, 1] for i in range(self.num_layers)],
+            "isEmbeddingParallel": False,
+            "isLmHeadParallel": not self.config.parallel_config.vocab_emb_dp,
+            "lmHeadTransposeType": 1,
+            "supportSwiGLU": True,
+            "kvQuant": self.kv_quant is not None,
+            "rank": self.rank_id,
+            "worldSize": self.device_num,
+            "backend": "lccl",
+            "rankTableFile": "",
+            "positionEmbeddingType": self.position_embedding_type,
+            "hiddenSize": self.config.hidden_size,
+            "gemma": False,
+            "enableAddNorm": True,
+            "supportCompressHead": False,
+        }
+        encoder_param = {
+            **coder_param, "isPrefill": True,
+            "supportLcoc": True,
+            "supportSpeculate": False,
+            "skipWordEmbedding": False
+        }
+        decoder_param = {
+            **coder_param, "isPrefill": False, "supportLcoc": False,
+            "supportSpeculate": False
+        }
+        self.atb_encoder_operation.init(json.dumps({**encoder_param}))
+        self.atb_decoder_operation.init(json.dumps({**decoder_param}))
+    def _prepare_inputs(
+            self,
+            prefill=None,
+            input_ids=None,
+            position_ids=None,
+            cos_embed=None,
+            sin_embed=None,
+            attention_mask=None,
+            block_tables=None,
+            slots=None,
+            input_lengths=None,
+            lm_head_indices=None,
+            seqLen=None,
+            **kwargs
+    ):
+        """prepare inputs"""
+        self.acl_param = json.dumps({
+            "seqLen": seqLen,
+        })
+        self.acl_decoder_operation_inputs[0] = self.cast(
+            input_ids, mstype.int64)
+        self.acl_decoder_operation_inputs[1] = self.placeholder
+        self.acl_decoder_operation_inputs[2] = self.cast(
+            position_ids, mstype.int32)
+        self.acl_decoder_operation_inputs[3] = cos_embed
+        self.acl_decoder_operation_inputs[4] = sin_embed
+        self.acl_decoder_operation_inputs[5] = attention_mask
+        self.acl_decoder_operation_inputs[6] = block_tables
+        self.acl_decoder_operation_inputs[7] = slots
+        self.acl_decoder_operation_inputs[8] = self.placeholder
+        self.acl_decoder_operation_inputs[9] = self.placeholder
+        self.acl_decoder_operation_inputs[10] = self.placeholder
+        self.acl_decoder_operation_inputs[11] = self.cast(
+            input_lengths, mstype.int32)
+        self.acl_decoder_operation_inputs[12] = self.cast(
+            lm_head_indices, mstype.int64)
+        return self.acl_decoder_operation_inputs, self.acl_param

mindspore/experimental/llm_boost/atb/qwen_boost.py ADDED Viewed

@@ -0,0 +1,101 @@
+# Copyright 2024 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+"""llm boost"""
+import json
+import mindspore.common.dtype as mstype
+from mindspore.experimental.llm_boost.atb.boost_base import AtbBoostBase
+from mindspore._c_expression import LlmBoostBinder
+from mindspore.experimental.llm_boost.register import LlmBoostRegister, LlmBoostType
+@LlmBoostRegister.register(LlmBoostType.BUILDIN, "Qwen")
+class QwenBoost(AtbBoostBase):
+    """QwenBoost class"""
+    def __init__(self, config):
+        super().__init__(config)
+        self.in_tensor_length = 12
+        self.acl_encoder_operation_inputs = [None] * self.in_tensor_length
+        self.acl_decoder_operation_inputs = [None] * self.in_tensor_length
+        self.atb_encoder_operation = LlmBoostBinder(
+            "ATB", "qwen_DecoderModel")
+        self.atb_decoder_operation = LlmBoostBinder(
+            "ATB", "qwen_DecoderModel")
+    def init(self):
+        """set param"""
+        param_dict = {
+            "isFA": False,
+            "isBF16": self.dtype == mstype.bfloat16,
+            "withEmbedding": True,
+            "isEmbeddingParallel": True,
+            "isLmHeadParallel": True,
+            "linearTransposeType": [[1, -1, -1, 1, 1, -1, 1] for i in range(self.num_layers)],
+            "lmHeadTransposeType": 1,
+            "supportSwiGLU": not self.need_nz,
+            "rmsNormEps": self.config.rms_norm_eps,
+            "numAttentionHeadsPerRank": self.config.num_heads // self.device_num,
+            "hiddenSizePerAttentionHead": self.head_dim,
+            "numHiddenLayers": self.num_layers,
+            "numKeyValueHeadsPerRank": self.n_kv_heads // self.device_num,
+            "rank": self.rank_id,
+            "worldSize": self.device_num,
+            "backend": "lccl",
+            "packQuantType": [[1, 1] for _ in range(self.num_layers)],
+            "linearQuantType": [[0, -1, -1, 0, 0, -1, 0] for _ in range(self.num_layers)],
+            "kvQuant": self.kv_quant is not None,
+        }
+        encoder_param = {**param_dict, "isPrefill": True, "supportLcoc": False}
+        decoder_param = {**param_dict, "isPrefill": False,
+                         "supportLcoc": False, "supportSpeculate": False}
+        self.atb_encoder_operation.init(json.dumps({**encoder_param}))
+        self.atb_decoder_operation.init(json.dumps({**decoder_param}))
+    def _prepare_inputs(
+            self,
+            prefill=None,
+            input_ids=None,
+            position_ids=None,
+            cos_embed=None,
+            sin_embed=None,
+            attention_mask=None,
+            block_tables=None,
+            slots=None,
+            input_lengths=None,
+            lm_head_indices=None,
+            seqLen=None,
+            **kwargs
+    ):
+        """prepare inputs"""
+        self.acl_param = json.dumps({
+            "seqLen": seqLen,
+        })
+        self.acl_decoder_operation_inputs[0] = self.cast(
+            input_ids, mstype.int64)
+        self.acl_decoder_operation_inputs[1] = self.cast(
+            position_ids, mstype.int32)
+        self.acl_decoder_operation_inputs[2] = cos_embed
+        self.acl_decoder_operation_inputs[3] = sin_embed
+        self.acl_decoder_operation_inputs[4] = attention_mask
+        self.acl_decoder_operation_inputs[5] = block_tables
+        self.acl_decoder_operation_inputs[6] = slots
+        self.acl_decoder_operation_inputs[7] = self.placeholder
+        self.acl_decoder_operation_inputs[8] = self.placeholder
+        self.acl_decoder_operation_inputs[9] = self.cast(
+            input_lengths, mstype.int32)
+        self.acl_decoder_operation_inputs[10] = self.cast(
+            lm_head_indices, mstype.int64)
+        self.acl_decoder_operation_inputs[11] = self.placeholder
+        return self.acl_decoder_operation_inputs, self.acl_param

mindspore/experimental/llm_boost/register.py ADDED Viewed

@@ -0,0 +1,129 @@
+# Copyright 2024 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+"""LlmBoostRegister"""
+import inspect
+class LlmBoostType:
+    """Class module type for vision pretrain"""
+    def __init__(self):
+        pass
+    BUILDIN = 'BuildIn'
+class LlmBoostRegister:
+    """
+    Module class factory.
+    """
+    def __init__(self):
+        pass
+    registry = {}
+    @classmethod
+    def register(cls, boost_type=LlmBoostType.BUILDIN, alias=None):
+        """Register class into registry
+        Args:
+            boost_type:
+                boost type name, default LlmBoostType.BUILDIN
+            alias (str) : model_name
+        Returns:
+            wrapper
+        """
+        def wrapper(register_class):
+            """Register-Class with wrapper function.
+            Args:
+                register_class : class need to register
+            Returns:
+                wrapper of register_class
+            """
+            model_name = alias if alias is not None else register_class.__name__
+            if boost_type not in cls.registry:
+                cls.registry[boost_type] = {model_name: register_class}
+            else:
+                cls.registry[boost_type][model_name] = register_class
+            return register_class
+        return wrapper
+    @classmethod
+    def is_exist(cls, boost_type, model_name=None):
+        """Determine whether class name is in the current type group.
+        Args:
+            boost_type : Module type
+            model_name : model name
+        Returns:
+            True/False
+        """
+        if not model_name:
+            return boost_type in cls.registry
+        registered = boost_type in cls.registry and model_name in cls.registry.get(
+            boost_type)
+        return registered
+    @classmethod
+    def get_cls(cls, boost_type, model_name=None):
+        """Get class
+        Args:
+            boost_type : Module type
+            model_name : model name
+        Returns:
+            register_class
+        """
+        if not cls.is_exist(boost_type, model_name):
+            raise ValueError("Can't find class type {} class name {} \
+            in class registry".format(boost_type, model_name))
+        if not model_name:
+            raise ValueError(
+                "Can't find model. model name = {}".format(model_name))
+        register_class = cls.registry.get(boost_type).get(model_name)
+        return register_class
+    @classmethod
+    def get_instance(cls, boost_type=LlmBoostType.BUILDIN, model_name=None, **kwargs):
+        """Get instance.
+        Args:
+            boost_type : module type
+            model_name : model type
+        Returns:
+            object : The constructed object
+        """
+        if model_name is None:
+            raise ValueError("Class name cannot be None.")
+        if isinstance(model_name, str):
+            obj_cls = cls.get_cls(boost_type, model_name)
+        elif inspect.isclass(model_name):
+            obj_cls = model_name
+        else:
+            raise ValueError("Can't find boost type {} model name {} \
+            in class registry.".format(boost_type, model_name))
+        try:
+            return obj_cls(**kwargs)
+        except Exception as e:
+            raise type(e)('{}: {}'.format(obj_cls.__name__, e))

mindspore/experimental/llm_boost/utils.py ADDED Viewed

@@ -0,0 +1,31 @@
+# Copyright 2024 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+"""LlmBoostRegister"""
+import os
+from mindspore.communication import get_group_size, get_rank
+def get_real_rank():
+    try:
+        return get_rank()
+    except RuntimeError:
+        return int(os.getenv("RANK_ID", "0"))
+def get_real_group_size():
+    try:
+        return get_group_size()
+    except RuntimeError:
+        return int(os.getenv("RANK_SIZE", "1"))

mindspore/experimental/optim/adamw.py CHANGED Viewed

@@ -20,10 +20,13 @@ from mindspore.common.parameter import Parameter
 from mindspore.common.tensor import Tensor
 import mindspore.common.dtype as mstype
 from mindspore.experimental.optim.optimizer import Optimizer
+from mindspore import _checkparam as validator
+from mindspore.ops import auto_generate as gen
 from mindspore import ops
 from mindspore import jit
 _adamw_opt = C.MultitypeFuncGraph("adamw_opt")
+_speed_adamw_opt = C.MultitypeFuncGraph("speed_adamw_opt")
 op_mul = P.Mul()
 op_pow = P.Pow()
@@ -32,6 +35,30 @@ op_maximum = P.Maximum()
 hyper_map = C.HyperMap()
+@_speed_adamw_opt.register("Function", "Float", "Float", "Tensor", "Float", "Float", "Bool", "Bool", "Tensor", "Tensor",
+                           "Tensor", "Tensor", "Tensor", "Tensor")
+def _run_speed_adamw_opt(opt, beta1, beta2, lr, eps, weight_decay, amsgrad, maximize, bias_correction1,
+                         bias_correction2, parameters, grads, exp_avg, exp_avg_sq):
+    """Apply adamw optimizer to the weight parameter."""
+    success = True
+    opt(parameters, exp_avg, exp_avg_sq, bias_correction1, bias_correction2, lr, weight_decay, beta1, beta2, eps,
+        grads, None, amsgrad, maximize)
+    return success
+def _check_param_value(betas, eps, weight_decay, lr, amsgrad, maximize, prim_name):
+    """Check the type of inputs."""
+    validator.check_value_type('betas', betas, [tuple], prim_name)
+    validator.check("betas size", len(betas), "", [2], validator.IN, prim_name)
+    validator.check_value_type("betas[0]", betas[0], [float], prim_name)
+    validator.check_value_type("betas[1]", betas[1], [float], prim_name)
+    validator.check_value_type("eps", eps, [float], prim_name)
+    validator.check_value_type("weight_decay", weight_decay, [float], prim_name)
+    validator.check_value_type("lr", lr, [float], prim_name)
+    validator.check_value_type("amsgrad", amsgrad, [bool], prim_name)
+    validator.check_value_type("maximize", maximize, [bool], prim_name)
 @jit
 def prepare_func(lr, weight_decay, state_step, beta1, beta2):
     weight_decay_new = 1 - lr * weight_decay
@@ -203,3 +230,61 @@ class AdamW(Optimizer):
                                 grads, start_id, end_id)
         return True
+class SpeedAdamW(Optimizer):
+    r"""
+    Implements Adam Weight Decay algorithm.
+    """
+    def __init__(self, params, lr=1e-3, betas=(0.9, 0.999), eps=1e-8,
+                 weight_decay=1e-2, amsgrad=False, *, maximize=False):
+        _check_param_value(betas, eps, weight_decay, lr, amsgrad, maximize, self.cls_name)
+        if lr < 0.0:
+            raise ValueError("Invalid learning rate: {}".format(lr))
+        if eps < 0.0:
+            raise ValueError("Invalid epsilon value: {}".format(eps))
+        if not 0.0 <= betas[0] < 1.0:
+            raise ValueError("Invalid beta parameter at index 0: {}".format(betas[0]))
+        if not 0.0 <= betas[1] < 1.0:
+            raise ValueError("Invalid beta parameter at index 1: {}".format(betas[1]))
+        if weight_decay < 0.0:
+            raise ValueError("Invalid weight_decay value: {}".format(weight_decay))
+        defaults = dict(lr=lr, betas=betas, eps=eps,
+                        weight_decay=weight_decay, amsgrad=amsgrad,
+                        maximize=maximize)
+        self.max_v_group = True
+        super(SpeedAdamW, self).__init__(params, defaults)
+        self.exp_avg = self.parameters.clone(prefix="exp_avg", init='zeros')
+        self.exp_avg_sq = self.parameters.clone(prefix="exp_avg_sq", init='zeros')
+        self.state_step = Parameter(Tensor([0], mstype.float32), "state_step")
+        self.increase_tensor = Tensor(1, mstype.float32)
+        self.assignadd = P.AssignAdd()
+        self.adamw_opt = gen.ApplyAdamW()
+    def construct(self, gradients):
+        self.assignadd(self.state_step, self.increase_tensor)
+        for group_id, group in enumerate(self.param_groups):
+            beta1, beta2 = group['betas']
+            maximize = group.get("maximize")
+            start_id = self.group_start_id[group_id]
+            end_id = self.group_start_id[group_id + 1]
+            lr = group.get("lr")
+            grads = tuple(gradients[start_id: end_id])
+            bias_correction1 = float(beta1) ** (float(self.state_step) - 1.0)
+            bias_correction2 = float(beta2) ** (float(self.state_step) - 1.0)
+            # 当前 ApplyAdamW 仅支持 amsgrad 为 False
+            if group.get("amsgrad"):
+                raise ValueError("For SpeedAdamW, the value of amsgrad can only be False.")
+            self.hyper_map(F.partial(_speed_adamw_opt, self.adamw_opt, beta1, beta2, lr,
+                                     group.get("eps"), group.get("weight_decay"),
+                                     group.get("amsgrad"), maximize, bias_correction1, bias_correction2),
+                           self.parameters[start_id: end_id], grads, self.exp_avg[start_id: end_id],
+                           self.exp_avg_sq[start_id: end_id])
+        return True

mindspore/experimental/optim/optimizer.py CHANGED Viewed

@@ -143,6 +143,9 @@ class Optimizer(Cell):
         self.lrs.append(lr)
         param_group["lr"] = lr
         param_group["weight_decay"] = weight_decay
+        if "amsgrad" in param_group and param_group.get("amsgrad") and hasattr(self, 'max_v_group'):
+            param_items = ParameterTuple(tuple(param_group.get("params")))
+            param_group["max_exp_avg_sq"] = param_items.clone(prefix="max_exp_avg_sq", init='zeros')
         self.param_groups.append(param_group)
         self.group_start_id.append(self.group_start_id[-1] + len(param_group.get("params")))

mindspore/hal/__init__.py CHANGED Viewed

@@ -22,7 +22,7 @@ resources at the Python layer. Currently, these interfaces take effect only in P
 from mindspore.hal.device import is_initialized, is_available, device_count, get_device_capability,\
                                  get_device_properties, get_device_name, get_arch_list
 from mindspore.hal.stream import Stream, synchronize, set_cur_stream, current_stream, default_stream,\
-                                 StreamCtx
+                                 communication_stream, StreamCtx
 from mindspore.hal.event import Event
 from mindspore.hal.memory import memory_stats, memory_reserved, max_memory_reserved, empty_cache,\
                                  reset_peak_memory_stats, memory_summary, memory_allocated,\
@@ -31,8 +31,8 @@ from mindspore.hal.memory import memory_stats, memory_reserved, max_memory_reser
 __all__ = [
     "is_initialized", "is_available", "device_count", "get_device_capability",
     "get_device_properties", "get_device_name", "get_arch_list",
-    "Event", "Stream", "synchronize", "set_cur_stream", "current_stream", "default_stream", "StreamCtx",
-    "memory_stats", "memory_reserved", "max_memory_reserved", "empty_cache", "reset_peak_memory_stats",
+    "Event", "communication_stream", "Stream", "synchronize", "set_cur_stream", "current_stream", "default_stream",
+    "StreamCtx", "memory_stats", "memory_reserved", "max_memory_reserved", "empty_cache", "reset_peak_memory_stats",
     "memory_summary", "memory_allocated", "max_memory_allocated", "reset_max_memory_reserved",
     "reset_max_memory_allocated"
 ]