PyPI - mindspore - Versions diffs - 2.7.0rc1__cp311-cp311-win_amd64.whl → 2.7.1__cp311-cp311-win_amd64.whl - Mend

mindspore 2.7.0rc1__cp311-cp311-win_amd64.whl → 2.7.1__cp311-cp311-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (370) hide show

mindspore/.commit_id +1 -1
mindspore/__init__.py +5 -2
mindspore/_c_dataengine.cp311-win_amd64.pyd +0 -0
mindspore/_c_expression.cp311-win_amd64.pyd +0 -0
mindspore/_c_mindrecord.cp311-win_amd64.pyd +0 -0
mindspore/_checkparam.py +2 -2
mindspore/_extends/builtin_operations.py +3 -3
mindspore/_extends/parallel_compile/akg_compiler/custom.py +1109 -0
mindspore/_extends/parallel_compile/akg_compiler/gen_custom_op_files.py +1 -1
mindspore/_extends/parse/__init__.py +3 -3
mindspore/_extends/parse/compile_config.py +24 -1
mindspore/_extends/parse/deprecated/deprecated_tensor_method.py +6 -3
mindspore/_extends/parse/parser.py +28 -22
mindspore/_extends/parse/resources.py +1 -1
mindspore/_extends/parse/standard_method.py +23 -2
mindspore/_extends/parse/trope.py +2 -1
mindspore/_extends/pijit/pijit_func_white_list.py +9 -27
mindspore/amp.py +0 -18
mindspore/avcodec-59.dll +0 -0
mindspore/avdevice-59.dll +0 -0
mindspore/avfilter-8.dll +0 -0
mindspore/avformat-59.dll +0 -0
mindspore/avutil-57.dll +0 -0
mindspore/boost/base.py +29 -2
mindspore/common/__init__.py +18 -12
mindspore/common/_decorator.py +3 -2
mindspore/common/_grad_function.py +3 -1
mindspore/common/_tensor_cpp_method.py +1 -1
mindspore/common/_tensor_docs.py +371 -96
mindspore/common/_utils.py +7 -43
mindspore/common/api.py +434 -135
mindspore/common/dtype.py +98 -57
mindspore/common/dump.py +7 -108
mindspore/common/dynamic_shape/__init__.py +0 -0
mindspore/common/{auto_dynamic_shape.py → dynamic_shape/auto_dynamic_shape.py} +15 -23
mindspore/common/dynamic_shape/enable_dynamic.py +197 -0
mindspore/common/file_system.py +59 -9
mindspore/common/hook_handle.py +82 -3
mindspore/common/jit_config.py +5 -1
mindspore/common/jit_trace.py +27 -12
mindspore/common/lazy_inline.py +5 -3
mindspore/common/np_dtype.py +3 -3
mindspore/common/parameter.py +17 -127
mindspore/common/recompute.py +4 -13
mindspore/common/tensor.py +50 -217
mindspore/communication/_comm_helper.py +11 -1
mindspore/communication/comm_func.py +138 -4
mindspore/communication/management.py +85 -1
mindspore/config/op_info.config +0 -15
mindspore/context.py +20 -106
mindspore/dataset/__init__.py +1 -1
mindspore/dataset/audio/transforms.py +1 -1
mindspore/dataset/core/config.py +35 -1
mindspore/dataset/engine/datasets.py +338 -319
mindspore/dataset/engine/datasets_user_defined.py +38 -22
mindspore/dataset/engine/datasets_vision.py +1 -1
mindspore/dataset/engine/validators.py +1 -15
mindspore/dataset/transforms/c_transforms.py +2 -2
mindspore/dataset/transforms/transforms.py +3 -3
mindspore/dataset/vision/__init__.py +1 -1
mindspore/dataset/vision/py_transforms.py +8 -8
mindspore/dataset/vision/transforms.py +17 -5
mindspore/dataset/vision/utils.py +632 -21
mindspore/device_context/ascend/op_tuning.py +35 -1
mindspore/dnnl.dll +0 -0
mindspore/{profiler/common/validator → graph}/__init__.py +9 -1
mindspore/graph/custom_pass.py +55 -0
mindspore/include/api/cell.h +28 -4
mindspore/include/api/cfg.h +24 -7
mindspore/include/api/context.h +1 -0
mindspore/include/api/delegate.h +0 -2
mindspore/include/api/dual_abi_helper.h +100 -19
mindspore/include/api/graph.h +14 -1
mindspore/include/api/kernel.h +16 -3
mindspore/include/api/kernel_api.h +9 -1
mindspore/include/api/metrics/accuracy.h +9 -0
mindspore/include/api/model.h +5 -1
mindspore/include/api/model_group.h +4 -0
mindspore/include/api/model_parallel_runner.h +2 -0
mindspore/include/api/status.h +48 -10
mindspore/include/api/types.h +6 -1
mindspore/include/dataset/constants.h +9 -0
mindspore/include/dataset/execute.h +2 -2
mindspore/jpeg62.dll +0 -0
mindspore/mindrecord/__init__.py +3 -3
mindspore/mindrecord/common/exceptions.py +1 -0
mindspore/mindrecord/config.py +1 -1
mindspore/{parallel/mpi → mindrecord/core}/__init__.py +4 -1
mindspore/mindrecord/{shardheader.py → core/shardheader.py} +2 -1
mindspore/mindrecord/{shardindexgenerator.py → core/shardindexgenerator.py} +1 -1
mindspore/mindrecord/{shardreader.py → core/shardreader.py} +2 -1
mindspore/mindrecord/{shardsegment.py → core/shardsegment.py} +2 -2
mindspore/mindrecord/{shardutils.py → core/shardutils.py} +1 -1
mindspore/mindrecord/{shardwriter.py → core/shardwriter.py} +1 -1
mindspore/mindrecord/filereader.py +4 -4
mindspore/mindrecord/filewriter.py +5 -5
mindspore/mindrecord/mindpage.py +2 -2
mindspore/mindrecord/tools/cifar10.py +4 -3
mindspore/mindrecord/tools/cifar100.py +1 -1
mindspore/mindrecord/tools/cifar100_to_mr.py +1 -1
mindspore/mindrecord/tools/cifar10_to_mr.py +6 -6
mindspore/mindrecord/tools/csv_to_mr.py +1 -1
mindspore/mindrecord/tools/imagenet_to_mr.py +1 -1
mindspore/mindrecord/tools/mnist_to_mr.py +1 -1
mindspore/mindrecord/tools/tfrecord_to_mr.py +1 -1
mindspore/mindspore_backend_common.dll +0 -0
mindspore/mindspore_backend_manager.dll +0 -0
mindspore/mindspore_cluster.dll +0 -0
mindspore/mindspore_common.dll +0 -0
mindspore/mindspore_core.dll +0 -0
mindspore/mindspore_cpu.dll +0 -0
mindspore/mindspore_dump.dll +0 -0
mindspore/mindspore_frontend.dll +0 -0
mindspore/mindspore_glog.dll +0 -0
mindspore/mindspore_hardware_abstract.dll +0 -0
mindspore/mindspore_memory_pool.dll +0 -0
mindspore/mindspore_ms_backend.dll +0 -0
mindspore/mindspore_ops.dll +0 -0
mindspore/{mindspore_ops_host.dll → mindspore_ops_cpu.dll} +0 -0
mindspore/mindspore_profiler.dll +0 -0
mindspore/mindspore_pyboost.dll +0 -0
mindspore/mindspore_pynative.dll +0 -0
mindspore/mindspore_runtime_pipeline.dll +0 -0
mindspore/mindspore_runtime_utils.dll +0 -0
mindspore/mindspore_tools.dll +0 -0
mindspore/mint/__init__.py +15 -10
mindspore/mint/distributed/__init__.py +4 -0
mindspore/mint/distributed/distributed.py +392 -69
mindspore/mint/nn/__init__.py +2 -16
mindspore/mint/nn/functional.py +4 -110
mindspore/mint/nn/layer/__init__.py +0 -2
mindspore/mint/nn/layer/_functions.py +1 -2
mindspore/mint/nn/layer/activation.py +0 -6
mindspore/mint/nn/layer/basic.py +0 -47
mindspore/mint/nn/layer/conv.py +10 -10
mindspore/mint/nn/layer/normalization.py +11 -16
mindspore/mint/nn/layer/pooling.py +0 -4
mindspore/nn/__init__.py +1 -3
mindspore/nn/cell.py +231 -239
mindspore/nn/layer/activation.py +4 -2
mindspore/nn/layer/basic.py +56 -14
mindspore/nn/layer/container.py +16 -0
mindspore/nn/layer/embedding.py +4 -169
mindspore/nn/layer/image.py +1 -1
mindspore/nn/layer/normalization.py +2 -1
mindspore/nn/layer/thor_layer.py +4 -85
mindspore/nn/optim/ada_grad.py +0 -1
mindspore/nn/optim/adafactor.py +0 -1
mindspore/nn/optim/adam.py +32 -127
mindspore/nn/optim/adamax.py +0 -1
mindspore/nn/optim/asgd.py +0 -1
mindspore/nn/optim/ftrl.py +8 -102
mindspore/nn/optim/lamb.py +1 -4
mindspore/nn/optim/lars.py +0 -3
mindspore/nn/optim/lazyadam.py +25 -218
mindspore/nn/optim/momentum.py +5 -43
mindspore/nn/optim/optimizer.py +6 -55
mindspore/nn/optim/proximal_ada_grad.py +0 -1
mindspore/nn/optim/rmsprop.py +0 -1
mindspore/nn/optim/rprop.py +0 -1
mindspore/nn/optim/sgd.py +0 -1
mindspore/nn/optim/tft_wrapper.py +2 -4
mindspore/nn/optim/thor.py +0 -2
mindspore/nn/probability/bijector/bijector.py +7 -8
mindspore/nn/probability/bijector/gumbel_cdf.py +2 -2
mindspore/nn/probability/bijector/power_transform.py +20 -21
mindspore/nn/probability/bijector/scalar_affine.py +5 -5
mindspore/nn/probability/bijector/softplus.py +13 -14
mindspore/nn/probability/distribution/_utils/utils.py +2 -2
mindspore/nn/wrap/cell_wrapper.py +39 -5
mindspore/nn/wrap/grad_reducer.py +4 -89
mindspore/numpy/array_creations.py +4 -4
mindspore/numpy/fft.py +9 -9
mindspore/numpy/utils_const.py +1 -1
mindspore/{nn/reinforcement → onnx}/__init__.py +5 -8
mindspore/onnx/onnx_export.py +137 -0
mindspore/opencv_core4110.dll +0 -0
mindspore/opencv_imgcodecs4110.dll +0 -0
mindspore/{opencv_imgproc452.dll → opencv_imgproc4110.dll} +0 -0
mindspore/ops/__init__.py +2 -0
mindspore/ops/_grad_experimental/grad_comm_ops.py +38 -2
mindspore/ops/_grad_experimental/grad_inner_ops.py +0 -9
mindspore/ops/_op_impl/aicpu/__init__.py +0 -10
mindspore/ops/_op_impl/cpu/__init__.py +1 -5
mindspore/ops/_op_impl/cpu/{buffer_append.py → joinedstr_op.py} +8 -8
mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py +28 -24
mindspore/ops/auto_generate/gen_extend_func.py +6 -11
mindspore/ops/auto_generate/gen_ops_def.py +385 -154
mindspore/ops/auto_generate/gen_ops_prim.py +5676 -5167
mindspore/ops/communication.py +97 -0
mindspore/ops/composite/__init__.py +5 -2
mindspore/ops/composite/base.py +16 -2
mindspore/ops/composite/multitype_ops/__init__.py +3 -1
mindspore/ops/composite/multitype_ops/_compile_utils.py +150 -8
mindspore/ops/composite/multitype_ops/_constexpr_utils.py +1 -1
mindspore/ops/composite/multitype_ops/add_impl.py +7 -0
mindspore/ops/composite/multitype_ops/mod_impl.py +27 -0
mindspore/ops/function/__init__.py +2 -0
mindspore/ops/function/array_func.py +24 -18
mindspore/ops/function/comm_func.py +3883 -0
mindspore/ops/function/debug_func.py +7 -6
mindspore/ops/function/grad/grad_func.py +4 -12
mindspore/ops/function/math_func.py +89 -86
mindspore/ops/function/nn_func.py +92 -313
mindspore/ops/function/random_func.py +9 -18
mindspore/ops/functional.py +4 -1
mindspore/ops/functional_overload.py +377 -30
mindspore/ops/operations/__init__.py +2 -5
mindspore/ops/operations/_custom_ops_utils.py +7 -9
mindspore/ops/operations/_inner_ops.py +12 -50
mindspore/ops/operations/_rl_inner_ops.py +0 -933
mindspore/ops/operations/array_ops.py +5 -50
mindspore/ops/operations/comm_ops.py +95 -17
mindspore/ops/operations/custom_ops.py +237 -22
mindspore/ops/operations/debug_ops.py +33 -35
mindspore/ops/operations/manually_defined/ops_def.py +39 -318
mindspore/ops/operations/math_ops.py +5 -5
mindspore/ops/operations/nn_ops.py +3 -3
mindspore/ops/operations/sparse_ops.py +0 -83
mindspore/ops/primitive.py +4 -27
mindspore/ops/tensor_method.py +88 -10
mindspore/ops_generate/aclnn/aclnn_kernel_register_auto_cc_generator.py +5 -5
mindspore/ops_generate/aclnn/gen_aclnn_implement.py +8 -8
mindspore/ops_generate/api/functions_cc_generator.py +53 -4
mindspore/ops_generate/api/tensor_func_reg_cpp_generator.py +25 -11
mindspore/ops_generate/common/gen_constants.py +11 -10
mindspore/ops_generate/common/op_proto.py +18 -1
mindspore/ops_generate/common/template.py +102 -245
mindspore/ops_generate/common/template_utils.py +212 -0
mindspore/ops_generate/gen_custom_ops.py +69 -0
mindspore/ops_generate/op_def/ops_def_cc_generator.py +78 -7
mindspore/ops_generate/op_def_py/base_op_prim_py_generator.py +360 -0
mindspore/ops_generate/op_def_py/custom_op_prim_py_generator.py +140 -0
mindspore/ops_generate/op_def_py/op_def_py_generator.py +54 -7
mindspore/ops_generate/op_def_py/op_prim_py_generator.py +5 -312
mindspore/ops_generate/pyboost/auto_grad_impl_cc_generator.py +74 -17
mindspore/ops_generate/pyboost/auto_grad_reg_cc_generator.py +22 -5
mindspore/ops_generate/pyboost/gen_pyboost_func.py +0 -16
mindspore/ops_generate/pyboost/op_template_parser.py +3 -2
mindspore/ops_generate/pyboost/pyboost_functions_cpp_generator.py +21 -5
mindspore/ops_generate/pyboost/pyboost_functions_h_generator.py +2 -2
mindspore/ops_generate/pyboost/pyboost_functions_impl_cpp_generator.py +30 -10
mindspore/ops_generate/pyboost/pyboost_grad_function_cpp_generator.py +10 -3
mindspore/ops_generate/pyboost/pyboost_internal_kernel_info_adapter_generator.py +1 -1
mindspore/ops_generate/pyboost/pyboost_native_grad_functions_generator.py +19 -9
mindspore/ops_generate/pyboost/pyboost_op_cpp_code_generator.py +71 -28
mindspore/ops_generate/pyboost/pyboost_overload_functions_cpp_generator.py +10 -9
mindspore/ops_generate/pyboost/pyboost_utils.py +27 -16
mindspore/ops_generate/resources/yaml_loader.py +13 -0
mindspore/ops_generate/tensor_py_cc_generator.py +2 -2
mindspore/parallel/_auto_parallel_context.py +5 -15
mindspore/parallel/_cell_wrapper.py +1 -1
mindspore/parallel/_parallel_serialization.py +4 -6
mindspore/parallel/_ps_context.py +2 -2
mindspore/parallel/_utils.py +34 -17
mindspore/parallel/auto_parallel.py +23 -9
mindspore/parallel/checkpoint_transform.py +20 -2
mindspore/parallel/cluster/process_entity/_api.py +28 -33
mindspore/parallel/cluster/process_entity/_utils.py +9 -5
mindspore/parallel/cluster/run.py +5 -3
mindspore/{experimental/llm_boost/ascend_native → parallel/distributed}/__init__.py +21 -22
mindspore/parallel/distributed/distributed_data_parallel.py +393 -0
mindspore/parallel/distributed/flatten_grad_buffer.py +295 -0
mindspore/parallel/function/reshard_func.py +6 -5
mindspore/parallel/nn/parallel_cell_wrapper.py +40 -3
mindspore/parallel/nn/parallel_grad_reducer.py +0 -8
mindspore/parallel/shard.py +7 -21
mindspore/parallel/strategy.py +336 -0
mindspore/parallel/transform_safetensors.py +127 -20
mindspore/profiler/analysis/viewer/ascend_kernel_details_viewer.py +13 -9
mindspore/profiler/analysis/viewer/ascend_op_memory_viewer.py +1 -1
mindspore/profiler/analysis/viewer/ms_minddata_viewer.py +1 -1
mindspore/profiler/common/constant.py +5 -0
mindspore/profiler/common/file_manager.py +9 -0
mindspore/profiler/common/msprof_cmd_tool.py +40 -4
mindspore/profiler/common/path_manager.py +65 -24
mindspore/profiler/common/profiler_context.py +27 -14
mindspore/profiler/common/profiler_info.py +3 -3
mindspore/profiler/common/profiler_meta_data.py +1 -0
mindspore/profiler/common/profiler_op_analyse.py +10 -6
mindspore/profiler/common/profiler_path_manager.py +13 -0
mindspore/profiler/common/util.py +30 -3
mindspore/profiler/dynamic_profiler.py +91 -46
mindspore/profiler/envprofiler.py +30 -5
mindspore/profiler/experimental_config.py +18 -2
mindspore/profiler/platform/cpu_profiler.py +10 -4
mindspore/profiler/platform/npu_profiler.py +34 -7
mindspore/profiler/profiler.py +193 -145
mindspore/profiler/profiler_action_controller.py +1 -1
mindspore/profiler/profiler_interface.py +2 -2
mindspore/rewrite/symbol_tree/symbol_tree.py +1 -1
mindspore/run_check/_check_version.py +108 -24
mindspore/runtime/__init__.py +9 -6
mindspore/runtime/executor.py +35 -0
mindspore/runtime/memory.py +113 -0
mindspore/runtime/thread_bind_core.py +1 -1
mindspore/swresample-4.dll +0 -0
mindspore/swscale-6.dll +0 -0
mindspore/tinyxml2.dll +0 -0
mindspore/{experimental/llm_boost → tools}/__init__.py +5 -5
mindspore/tools/data_dump.py +130 -0
mindspore/tools/sdc_detect.py +91 -0
mindspore/tools/stress_detect.py +63 -0
mindspore/train/__init__.py +6 -6
mindspore/train/_utils.py +8 -21
mindspore/train/amp.py +6 -7
mindspore/train/callback/_callback.py +2 -1
mindspore/train/callback/_checkpoint.py +1 -17
mindspore/train/callback/_flops_collector.py +10 -6
mindspore/train/callback/_train_fault_tolerance.py +72 -25
mindspore/train/data_sink.py +5 -9
mindspore/train/dataset_helper.py +5 -5
mindspore/train/model.py +41 -230
mindspore/train/serialization.py +160 -401
mindspore/train/train_thor/model_thor.py +2 -2
mindspore/turbojpeg.dll +0 -0
mindspore/utils/__init__.py +6 -3
mindspore/utils/dlpack.py +92 -0
mindspore/utils/dryrun.py +1 -1
mindspore/utils/runtime_execution_order_check.py +10 -0
mindspore/utils/sdc_detect.py +14 -12
mindspore/utils/stress_detect.py +43 -0
mindspore/utils/utils.py +152 -16
mindspore/version.py +1 -1
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/METADATA +3 -2
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/RECORD +330 -344
mindspore/_extends/remote/kernel_build_server_ascend.py +0 -75
mindspore/communication/_hccl_management.py +0 -297
mindspore/experimental/llm_boost/ascend_native/llama_boost_ascend_native.py +0 -207
mindspore/experimental/llm_boost/ascend_native/llm_boost.py +0 -52
mindspore/experimental/llm_boost/atb/__init__.py +0 -23
mindspore/experimental/llm_boost/atb/boost_base.py +0 -385
mindspore/experimental/llm_boost/atb/llama_boost.py +0 -137
mindspore/experimental/llm_boost/atb/qwen_boost.py +0 -124
mindspore/experimental/llm_boost/register.py +0 -130
mindspore/experimental/llm_boost/utils.py +0 -31
mindspore/include/OWNERS +0 -7
mindspore/mindspore_cpu_res_manager.dll +0 -0
mindspore/mindspore_ops_kernel_common.dll +0 -0
mindspore/mindspore_res_manager.dll +0 -0
mindspore/nn/optim/_dist_optimizer_registry.py +0 -111
mindspore/nn/reinforcement/_batch_read_write.py +0 -142
mindspore/nn/reinforcement/_tensors_queue.py +0 -152
mindspore/nn/reinforcement/tensor_array.py +0 -145
mindspore/opencv_core452.dll +0 -0
mindspore/opencv_imgcodecs452.dll +0 -0
mindspore/ops/_op_impl/aicpu/priority_replay_buffer.py +0 -113
mindspore/ops/_op_impl/aicpu/reservoir_replay_buffer.py +0 -96
mindspore/ops/_op_impl/aicpu/sparse_cross.py +0 -42
mindspore/ops/_op_impl/cpu/buffer_get.py +0 -28
mindspore/ops/_op_impl/cpu/buffer_sample.py +0 -28
mindspore/ops/_op_impl/cpu/priority_replay_buffer.py +0 -42
mindspore/ops/operations/_tensor_array.py +0 -359
mindspore/ops/operations/rl_ops.py +0 -288
mindspore/parallel/_offload_context.py +0 -275
mindspore/parallel/_recovery_context.py +0 -115
mindspore/parallel/_transformer/__init__.py +0 -35
mindspore/parallel/_transformer/layers.py +0 -765
mindspore/parallel/_transformer/loss.py +0 -251
mindspore/parallel/_transformer/moe.py +0 -693
mindspore/parallel/_transformer/op_parallel_config.py +0 -222
mindspore/parallel/_transformer/transformer.py +0 -3124
mindspore/parallel/mpi/_mpi_config.py +0 -116
mindspore/profiler/common/validator/validate_path.py +0 -84
mindspore/train/memory_profiling_pb2.py +0 -298
mindspore/utils/hooks.py +0 -81
/mindspore/common/{_auto_dynamic.py → dynamic_shape/_auto_dynamic.py} +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/WHEEL +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/entry_points.txt +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/top_level.txt +0 -0

mindspore/experimental/llm_boost/atb/boost_base.py DELETED Viewed

@@ -1,385 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""boost base class"""
-from enum import Enum
-import numpy as np
-import mindspore as ms
-from mindspore import ops, Tensor
-from mindspore import log as logger
-import mindspore.common.dtype as mstype
-from mindspore._c_expression import _set_format
-from mindspore.common.parameter import Parameter
-from mindspore.experimental.llm_boost.utils import get_real_rank, get_real_group_size
-from mindspore.common.initializer import Zero
-FORMAT_NZ = "FRACTAL_NZ"
-BUILDIN_BACKEND_NAME = "ATB"
-class PositionEmbeddingType(int, Enum):
-    ROPE = 0
-    ALIBI = 1
-    ABSOLUTE = 2
-class NormType(int, Enum):
-    RMS_NORM = 0
-    LAYER_NORM = 1
-class AttentionMask:
-    """attention mask"""
-    @classmethod
-    def static(cls, max_seq_len, dtype=mstype.float16, need_nz=False):
-        """cache mask"""
-        bias_cache = Tensor(
-            np.tril(np.ones((max_seq_len, max_seq_len), dtype=np.bool_))
-        ).reshape(max_seq_len, max_seq_len)
-        bias_cache = ~bias_cache
-        if dtype == mstype.float16:
-            mask_value = Tensor(np.finfo(np.float32).min, mstype.float16)
-        else:
-            mask_value = Tensor(1)
-        attn_mask = ops.masked_fill(
-            Tensor(np.zeros((max_seq_len, max_seq_len)), dtype=mstype.float16),
-            bias_cache,
-            mask_value,
-        )
-        if need_nz:
-            # ND -> NZ
-            attn_mask = ops.reshape(attn_mask, (1, max_seq_len, max_seq_len))
-            attn_mask = ops.reshape(attn_mask, (1, max_seq_len, max_seq_len // 16, 16))
-            attn_mask = ops.transpose(attn_mask, (0, 2, 1, 3)).contiguous()
-            attn_mask = _set_format(attn_mask, FORMAT_NZ)
-        return attn_mask
-class AtbBoostBase:
-    """atb boost base class"""
-    def __init__(self, config):
-        super().__init__()
-        self.backend_name = BUILDIN_BACKEND_NAME
-        self.is_first_iteration = False
-        self.config = config
-        self.dtype = config.compute_dtype
-        self.num_heads = config.num_heads
-        self.num_kv_heads = config.n_kv_heads if config.n_kv_heads else self.num_heads
-        self.num_layers = config.num_layers
-        self.n_kv_heads = config.n_kv_heads if config.n_kv_heads else config.num_heads
-        self.head_dim = config.hidden_size // self.num_heads
-        self.need_nz = False
-        if hasattr(config, "need_nz"):
-            self.need_nz = config.need_nz
-        self.placeholder = Tensor(np.zeros(1), dtype=self.dtype)
-        self.lm_head_indices_fake = Tensor([0], dtype=mstype.int64)
-        self.position_embedding_type = PositionEmbeddingType.ROPE
-        self.add_norm_enable = True
-        self.max_decode_length = self.config.max_decode_length
-        self.max_base_len = 128
-        self.attn_mask = AttentionMask.static(
-            self.max_base_len, dtype=self.dtype, need_nz=self.need_nz
-        )
-        self.cast = ops.Cast()
-        self.reshape = ops.Reshape()
-        self.kv_quant = None
-        self.rank_id = get_real_rank()
-        self.device_num = get_real_group_size()
-        self.ascend_weight = []
-        self.k_caches = []
-        self.v_caches = []
-    def _convert_tensor_format_and_dtype(self, tensor, dtype=mstype.float16):
-        tensor = self.cast(tensor, dtype=dtype)
-        if self.need_nz:
-            tensor = _set_format(tensor, FORMAT_NZ)
-        return tensor
-    def _convert_qkv_concat_weight(self, param_dict):
-        """convert qkv concat weight"""
-        for i in range(self.num_layers):
-            # qkv weight concat
-            wq_weight_name = f"model.layers.{i}.attention.wq.weight"
-            wk_weight_name = f"model.layers.{i}.attention.wk.weight"
-            wv_weight_name = f"model.layers.{i}.attention.wv.weight"
-            qkv_concat_weight_name = f"model.layers.{i}.attention.w_qkv.weight"
-            if wq_weight_name not in param_dict:
-                break
-            wq_weight = param_dict[wq_weight_name].asnumpy()
-            wk_weight = param_dict[wk_weight_name].asnumpy()
-            wv_weight = param_dict[wv_weight_name].asnumpy()
-            qkv_weight = np.concatenate((wq_weight, wk_weight, wv_weight), 0)
-            param_dict[qkv_concat_weight_name] = Parameter(
-                qkv_weight, name=qkv_concat_weight_name
-            )
-            # gate hidden weight concat
-            ffn_gate_weight_name = f"model.layers.{i}.feed_forward.w1.weight"
-            ffn_hidden_weight_name = f"model.layers.{i}.feed_forward.w3.weight"
-            gate_hidden_concat_weight_name = (
-                f"model.layers.{i}.feed_forward.w_gate_hidden.weight"
-            )
-            ffn_gate_weight = param_dict[ffn_gate_weight_name].asnumpy()
-            ffn_hidden_weight = param_dict[ffn_hidden_weight_name].asnumpy()
-            gate_hidden_weight = np.concatenate((ffn_gate_weight, ffn_hidden_weight), 0)
-            param_dict[gate_hidden_concat_weight_name] = Parameter(
-                gate_hidden_weight, name=gate_hidden_concat_weight_name
-            )
-            param_dict.pop(wq_weight_name)
-            param_dict.pop(wk_weight_name)
-            param_dict.pop(wv_weight_name)
-            param_dict.pop(ffn_gate_weight_name)
-            param_dict.pop(ffn_hidden_weight_name)
-            logger.info(f"transform: {qkv_concat_weight_name}")
-            logger.info(f"transform: {gate_hidden_concat_weight_name}")
-        for i in range(self.num_layers):
-            # qkv bias concat
-            wq_bias_name = f"model.layers.{i}.attention.wq.bias"
-            wk_bias_name = f"model.layers.{i}.attention.wk.bias"
-            wv_bias_name = f"model.layers.{i}.attention.wv.bias"
-            qkv_concat_bias_name = f"model.layers.{i}.attention.w_qkv.bias"
-            if wq_bias_name not in param_dict:
-                break
-            wq_bias_weight = param_dict[wq_bias_name].asnumpy()
-            wk_bias_weight = param_dict[wk_bias_name].asnumpy()
-            wv_bias_weight = param_dict[wv_bias_name].asnumpy()
-            qkv_bias_weight = np.concatenate(
-                (wq_bias_weight, wk_bias_weight, wv_bias_weight), 0
-            )
-            param_dict[qkv_concat_bias_name] = Parameter(
-                qkv_bias_weight, name=qkv_concat_bias_name
-            )
-            param_dict.pop(wq_bias_name)
-            param_dict.pop(wk_bias_name)
-            param_dict.pop(wv_bias_name)
-            logger.info(f"transform: {qkv_concat_bias_name}")
-        return param_dict
-    def set_weights(self, parm_dict, dtype=mstype.float16):
-        """set weights for llm boost"""
-        self._convert_qkv_concat_weight(parm_dict)
-        embedding_weight_name = "model.tok_embeddings.embedding_weight"
-        attention_norm_name = "attention_norm"
-        qkv_name = "attention.w_qkv"
-        o_name = "attention.wo"
-        mlp_norm_name = "ffn_norm"
-        mlp_gate_name = "feed_forward.w_gate_hidden"
-        mlp_down_name = "feed_forward.w2"
-        norm_out_name = "model.norm_out"
-        lm_head_name = "lm_head"
-        placeholder = Parameter(Tensor(np.zeros(1), dtype=dtype))
-        ascend_weight = []
-        ascend_weight.append(self.cast(parm_dict[embedding_weight_name], dtype))
-        for i in range(self.num_layers):
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{attention_norm_name}.weight"], dtype
-                )
-            )
-            ascend_weight.extend([placeholder] * 3)
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{qkv_name}.weight"], dtype
-                )
-            )
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict.get(f"model.layers.{i}.{qkv_name}.bias", placeholder),
-                    dtype,
-                )
-            )
-            ascend_weight.extend([placeholder] * 16)
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{o_name}.weight"], dtype
-                )
-            )
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict.get(f"model.layers.{i}.{o_name}.bias", placeholder), dtype
-                )
-            )
-            ascend_weight.extend([placeholder] * 4)
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{mlp_norm_name}.weight"], dtype
-                )
-            )
-            ascend_weight.extend([placeholder] * 3)
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{mlp_gate_name}.weight"], dtype
-                )
-            )
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict.get(
-                        f"model.layers.{i}.{mlp_gate_name}.bias", placeholder
-                    ),
-                    dtype,
-                )
-            )
-            ascend_weight.extend([placeholder] * 10)
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict[f"model.layers.{i}.{mlp_down_name}.weight"], dtype
-                )
-            )
-            ascend_weight.append(
-                self._convert_tensor_format_and_dtype(
-                    parm_dict.get(
-                        f"model.layers.{i}.{mlp_down_name}.bias", placeholder
-                    ),
-                    dtype,
-                )
-            )
-            ascend_weight.extend([placeholder] * 4)
-        ascend_weight.append(
-            self._convert_tensor_format_and_dtype(
-                parm_dict[f"{norm_out_name}.weight"], dtype
-            )
-        )
-        ascend_weight.append(
-            self._convert_tensor_format_and_dtype(
-                parm_dict[f"{lm_head_name}.weight"], dtype
-            )
-        )
-        self.ascend_weight = ascend_weight
-        self.atb_encoder_operation.set_weights(ascend_weight)
-        self.atb_decoder_operation.set_weights(ascend_weight)
-    def set_kvcache(self, k_caches=None, v_caches=None):
-        """set kv_cache for llm boost"""
-        if not k_caches or v_caches:
-            if self.need_nz:
-                kv_shape = (
-                    self.config.num_blocks,
-                    self.num_kv_heads * self.head_dim // self.device_num // 16,
-                    self.config.block_size,
-                    16,
-                )
-                k_caches = [
-                    _set_format(
-                        Parameter(
-                            Tensor(shape=kv_shape, dtype=self.dtype, init=Zero())
-                        ),
-                        FORMAT_NZ,
-                    )
-                    for _ in range(self.num_layers)
-                ]
-                v_caches = [
-                    _set_format(
-                        Parameter(
-                            Tensor(shape=kv_shape, dtype=self.dtype, init=Zero())
-                        ),
-                        FORMAT_NZ,
-                    )
-                    for _ in range(self.num_layers)
-                ]
-            else:
-                kv_shape = (
-                    self.config.num_blocks,
-                    self.config.block_size,
-                    self.num_kv_heads // self.device_num,
-                    self.head_dim,
-                )
-                k_caches = [
-                    Parameter(Tensor(shape=kv_shape, dtype=self.dtype, init=Zero()))
-                    for _ in range(self.num_layers)
-                ]
-                v_caches = [
-                    Parameter(Tensor(shape=kv_shape, dtype=self.dtype, init=Zero()))
-                    for _ in range(self.num_layers)
-                ]
-        self.k_caches = k_caches
-        self.v_caches = v_caches
-        self.atb_encoder_operation.set_kvcache(k_caches, v_caches)
-        self.atb_decoder_operation.set_kvcache(k_caches, v_caches)
-    def add_flags(self, is_first_iteration):
-        """add_flags."""
-        self.is_first_iteration = is_first_iteration
-    def _execute_operator(self, acl_inputs, acl_param):
-        """execute operator."""
-        if self.is_first_iteration:
-            acl_model_out = self.atb_encoder_operation.forward(acl_inputs, acl_param)
-        else:
-            acl_model_out = self.atb_decoder_operation.forward(acl_inputs, acl_param)
-        acl_hidden_state = acl_model_out[0]
-        return acl_hidden_state
-    def forward(self, boost_inputs):
-        r"""
-        LlmBoost forward.
-        """
-        input_ids = boost_inputs.get("input_ids", None)
-        position_ids = boost_inputs.get("position_ids", None)
-        cos_embed = boost_inputs.get("cos_embed", None)
-        sin_embed = boost_inputs.get("sin_embed", None)
-        block_tables = boost_inputs.get("block_tables", None)
-        slot_mapping = boost_inputs.get("slot_mapping", None)
-        batch_valid_length = boost_inputs.get("batch_valid_length", None)
-        lm_head_indices = boost_inputs.get("lm_head_indices", None)
-        seqLen = boost_inputs.get("seq_lens", None)
-        input_ids = self.reshape(input_ids, (-1,))
-        if self.is_first_iteration:
-            attention_mask = self.attn_mask
-        else:
-            if position_ids is None:
-                position_ids = batch_valid_length - 1
-            attention_mask = self.placeholder
-            lm_head_indices = self.lm_head_indices_fake
-        if input_ids is not None and input_ids.dtype != mstype.int64:
-            input_ids = self.cast(input_ids, mstype.int64)
-        if position_ids is not None and position_ids.dtype != mstype.int64:
-            position_ids = self.cast(position_ids, mstype.int64)
-        if batch_valid_length is not None and batch_valid_length.dtype != mstype.int32:
-            batch_valid_length = self.cast(batch_valid_length, mstype.int32)
-        if lm_head_indices is not None and lm_head_indices.dtype != mstype.int64:
-            lm_head_indices = self.cast(lm_head_indices, mstype.int64)
-        acl_inputs, acl_param = self._prepare_inputs(
-            prefill=self.is_first_iteration,
-            input_ids=input_ids,
-            position_ids=position_ids,
-            cos_embed=cos_embed,
-            sin_embed=sin_embed,
-            attention_mask=attention_mask,
-            block_tables=block_tables,
-            slots=slot_mapping,
-            input_lengths=batch_valid_length,
-            lm_head_indices=lm_head_indices,
-            seqLen=seqLen,
-        )
-        ms.hal.synchronize()
-        logits = self._execute_operator(acl_inputs, acl_param)
-        logits = self.cast(logits, mstype.float32)
-        return logits

mindspore/experimental/llm_boost/atb/llama_boost.py DELETED Viewed

@@ -1,137 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""llm boost"""
-import json
-import mindspore.common.dtype as mstype
-from mindspore.experimental.llm_boost.atb.boost_base import (
-    AtbBoostBase,
-    PositionEmbeddingType,
-    NormType,
-)
-from mindspore._c_expression import LlmBoostBinder
-from mindspore.experimental.llm_boost.register import LlmBoostRegister, LlmBoostType
-CPP_LLAMA_MODEL_CLASS_NAME = "llama_LlamaDecoderModel"
-@LlmBoostRegister.register(LlmBoostType.BUILDIN, "Llama")
-class LlamaBoost(AtbBoostBase):
-    """LlamaBoost class"""
-    def __init__(self, config):
-        super().__init__(config)
-        self.in_tensor_length = 13
-        self.acl_encoder_operation_inputs = [None] * self.in_tensor_length
-        self.acl_decoder_operation_inputs = [None] * self.in_tensor_length
-        self.atb_encoder_operation = LlmBoostBinder(
-            self.backend_name, CPP_LLAMA_MODEL_CLASS_NAME
-        )
-        self.atb_decoder_operation = LlmBoostBinder(
-            self.backend_name, CPP_LLAMA_MODEL_CLASS_NAME
-        )
-    def init(self):
-        """
-        Initialize the object
-        returns True if object needs input manipulation by mindformers
-        """
-        coder_param = {
-            "normEps": self.config.rms_norm_eps,
-            "normType": NormType.RMS_NORM,
-            "numAttentionHeadsPerRank": self.config.num_heads // self.device_num,
-            "hiddenSizePerAttentionHead": self.head_dim,
-            "numHiddenLayers": self.num_layers,
-            "numKeyValueHeadsPerRank": self.n_kv_heads // self.device_num,
-            "skipWordEmbedding": False,
-            "isFA": False,
-            "isBF16": self.dtype == mstype.bfloat16,
-            "packQuantType": [[1, 1] for _ in range(self.num_layers)],
-            "linearQuantType": [
-                [0, -1, -1, 0, 0, -1, 0] for _ in range(self.num_layers)
-            ],
-            "linearTransposeType": [
-                [1, -1, -1, 1, 1, -1, 1] for i in range(self.num_layers)
-            ],
-            "isEmbeddingParallel": False,
-            "isLmHeadParallel": not self.config.parallel_config.vocab_emb_dp,
-            "lmHeadTransposeType": 1,
-            "enableSwiGLU": True,
-            "enablekvQuant": self.kv_quant is not None,
-            "rank": self.rank_id,
-            "worldSize": self.device_num,
-            "backend": self.config.communication_backend,
-            "rankTableFile": "",
-            "positionEmbeddingType": PositionEmbeddingType.ROPE,
-            "hiddenSize": self.config.hidden_size,
-            "gemma": False,
-            "enableAddNorm": False,
-            "enableCompressHead": False,
-            "isUnpadInputs": True,
-        }
-        encoder_param = {
-            **coder_param,
-            "isPrefill": True,
-            "enableLcoc": True,
-            "enableSpeculate": False,
-            "skipWordEmbedding": False,
-            "enableSplitFuse": False,
-        }
-        decoder_param = {
-            **coder_param,
-            "isPrefill": False,
-            "enableLcoc": False,
-            "enableSpeculate": False,
-        }
-        self.atb_encoder_operation.init(json.dumps({**encoder_param}))
-        self.atb_decoder_operation.init(json.dumps({**decoder_param}))
-        return True
-    def _prepare_inputs(
-            self,
-            prefill=None,
-            input_ids=None,
-            position_ids=None,
-            cos_embed=None,
-            sin_embed=None,
-            attention_mask=None,
-            block_tables=None,
-            slots=None,
-            input_lengths=None,
-            lm_head_indices=None,
-            seqLen=None,
-            **kwargs
-    ):
-        """prepare inputs"""
-        self.acl_param = json.dumps(
-            {
-                "seqLen": seqLen,
-            }
-        )
-        self.acl_decoder_operation_inputs[0] = input_ids
-        self.acl_decoder_operation_inputs[1] = self.placeholder
-        self.acl_decoder_operation_inputs[2] = position_ids
-        self.acl_decoder_operation_inputs[3] = cos_embed
-        self.acl_decoder_operation_inputs[4] = sin_embed
-        self.acl_decoder_operation_inputs[5] = attention_mask
-        self.acl_decoder_operation_inputs[6] = block_tables
-        self.acl_decoder_operation_inputs[7] = slots
-        self.acl_decoder_operation_inputs[8] = self.placeholder
-        self.acl_decoder_operation_inputs[9] = self.placeholder
-        self.acl_decoder_operation_inputs[10] = self.placeholder
-        self.acl_decoder_operation_inputs[11] = input_lengths
-        self.acl_decoder_operation_inputs[12] = lm_head_indices
-        return self.acl_decoder_operation_inputs, self.acl_param

mindspore/experimental/llm_boost/atb/qwen_boost.py DELETED Viewed

@@ -1,124 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""llm boost"""
-import json
-import mindspore.common.dtype as mstype
-from mindspore.experimental.llm_boost.atb.boost_base import AtbBoostBase, NormType
-from mindspore._c_expression import LlmBoostBinder
-from mindspore.experimental.llm_boost.register import LlmBoostRegister, LlmBoostType
-CPP_QWEN_MODEL_CLASS_NAME = "qwen_QwenDecoderModel"
-@LlmBoostRegister.register(LlmBoostType.BUILDIN, "Qwen")
-class QwenBoost(AtbBoostBase):
-    """QwenBoost class"""
-    def __init__(self, config):
-        super().__init__(config)
-        self.in_tensor_length = 12
-        self.acl_encoder_operation_inputs = [None] * self.in_tensor_length
-        self.acl_decoder_operation_inputs = [None] * self.in_tensor_length
-        self.atb_encoder_operation = LlmBoostBinder(
-            self.backend_name, CPP_QWEN_MODEL_CLASS_NAME
-        )
-        self.atb_decoder_operation = LlmBoostBinder(
-            self.backend_name, CPP_QWEN_MODEL_CLASS_NAME
-        )
-    def init(self):
-        """set param"""
-        param_dict = {
-            "isFA": False,
-            "isBF16": self.dtype == mstype.bfloat16,
-            "withEmbedding": True,
-            "isEmbeddingParallel": True,
-            "isLmHeadParallel": True,
-            "linearTransposeType": [
-                [1, -1, -1, 1, 1, -1, 1] for i in range(self.num_layers)
-            ],
-            "lmHeadTransposeType": 1,
-            "enableSwiGLU": not self.need_nz,
-            "normEps": self.config.rms_norm_eps,
-            "normType": NormType.RMS_NORM,
-            "numAttentionHeadsPerRank": self.config.num_heads // self.device_num,
-            "hiddenSizePerAttentionHead": self.head_dim,
-            "numHiddenLayers": self.num_layers,
-            "numKeyValueHeadsPerRank": self.n_kv_heads // self.device_num,
-            "rank": self.rank_id,
-            "worldSize": self.device_num,
-            "backend": self.config.communication_backend,
-            "packQuantType": [[1, 1] for _ in range(self.num_layers)],
-            "linearQuantType": [
-                [0, -1, -1, 0, 0, -1, 0] for _ in range(self.num_layers)
-            ],
-            "linearHasBias": [[True, False, False, False]] * self.num_layers,
-            "enableKvQuant": self.kv_quant is not None,
-            "enableLora": False,
-            "isUnpadInputs": True,
-            "enableAddNorm": False,
-        }
-        encoder_param = {
-            **param_dict,
-            "isPrefill": True,
-            "enableLcoc": False,
-            "enableSplitFuse": False,
-        }
-        decoder_param = {
-            **param_dict,
-            "isPrefill": False,
-            "enableLcoc": False,
-            "enableSpeculate": False,
-            "enablePrefixCache": False,
-        }
-        self.atb_encoder_operation.init(json.dumps({**encoder_param}))
-        self.atb_decoder_operation.init(json.dumps({**decoder_param}))
-    def _prepare_inputs(
-            self,
-            prefill=None,
-            input_ids=None,
-            position_ids=None,
-            cos_embed=None,
-            sin_embed=None,
-            attention_mask=None,
-            block_tables=None,
-            slots=None,
-            input_lengths=None,
-            lm_head_indices=None,
-            seqLen=None,
-            **kwargs
-    ):
-        """prepare inputs"""
-        self.acl_param = json.dumps(
-            {
-                "seqLen": seqLen,
-            }
-        )
-        self.acl_decoder_operation_inputs[0] = input_ids
-        self.acl_decoder_operation_inputs[1] = position_ids
-        self.acl_decoder_operation_inputs[2] = cos_embed
-        self.acl_decoder_operation_inputs[3] = sin_embed
-        self.acl_decoder_operation_inputs[4] = attention_mask
-        self.acl_decoder_operation_inputs[5] = block_tables
-        self.acl_decoder_operation_inputs[6] = slots
-        self.acl_decoder_operation_inputs[7] = self.placeholder
-        self.acl_decoder_operation_inputs[8] = self.placeholder
-        self.acl_decoder_operation_inputs[9] = self.placeholder
-        self.acl_decoder_operation_inputs[10] = input_lengths
-        self.acl_decoder_operation_inputs[11] = lm_head_indices
-        return self.acl_decoder_operation_inputs, self.acl_param