PyPI - mindspore - Versions diffs - 2.7.0rc1__cp310-cp310-win_amd64.whl → 2.7.1__cp310-cp310-win_amd64.whl - Mend

mindspore 2.7.0rc1__cp310-cp310-win_amd64.whl → 2.7.1__cp310-cp310-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (370) hide show

mindspore/.commit_id +1 -1
mindspore/__init__.py +5 -2
mindspore/_c_dataengine.cp310-win_amd64.pyd +0 -0
mindspore/_c_expression.cp310-win_amd64.pyd +0 -0
mindspore/_c_mindrecord.cp310-win_amd64.pyd +0 -0
mindspore/_checkparam.py +2 -2
mindspore/_extends/builtin_operations.py +3 -3
mindspore/_extends/parallel_compile/akg_compiler/custom.py +1109 -0
mindspore/_extends/parallel_compile/akg_compiler/gen_custom_op_files.py +1 -1
mindspore/_extends/parse/__init__.py +3 -3
mindspore/_extends/parse/compile_config.py +24 -1
mindspore/_extends/parse/deprecated/deprecated_tensor_method.py +6 -3
mindspore/_extends/parse/parser.py +28 -22
mindspore/_extends/parse/resources.py +1 -1
mindspore/_extends/parse/standard_method.py +23 -2
mindspore/_extends/parse/trope.py +2 -1
mindspore/_extends/pijit/pijit_func_white_list.py +9 -27
mindspore/amp.py +0 -18
mindspore/avcodec-59.dll +0 -0
mindspore/avdevice-59.dll +0 -0
mindspore/avfilter-8.dll +0 -0
mindspore/avformat-59.dll +0 -0
mindspore/avutil-57.dll +0 -0
mindspore/boost/base.py +29 -2
mindspore/common/__init__.py +18 -12
mindspore/common/_decorator.py +3 -2
mindspore/common/_grad_function.py +3 -1
mindspore/common/_tensor_cpp_method.py +1 -1
mindspore/common/_tensor_docs.py +371 -96
mindspore/common/_utils.py +7 -43
mindspore/common/api.py +434 -135
mindspore/common/dtype.py +98 -57
mindspore/common/dump.py +7 -108
mindspore/common/dynamic_shape/__init__.py +0 -0
mindspore/common/{auto_dynamic_shape.py → dynamic_shape/auto_dynamic_shape.py} +15 -23
mindspore/common/dynamic_shape/enable_dynamic.py +197 -0
mindspore/common/file_system.py +59 -9
mindspore/common/hook_handle.py +82 -3
mindspore/common/jit_config.py +5 -1
mindspore/common/jit_trace.py +27 -12
mindspore/common/lazy_inline.py +5 -3
mindspore/common/np_dtype.py +3 -3
mindspore/common/parameter.py +17 -127
mindspore/common/recompute.py +4 -13
mindspore/common/tensor.py +50 -217
mindspore/communication/_comm_helper.py +11 -1
mindspore/communication/comm_func.py +138 -4
mindspore/communication/management.py +85 -1
mindspore/config/op_info.config +0 -15
mindspore/context.py +20 -106
mindspore/dataset/__init__.py +1 -1
mindspore/dataset/audio/transforms.py +1 -1
mindspore/dataset/core/config.py +35 -1
mindspore/dataset/engine/datasets.py +338 -319
mindspore/dataset/engine/datasets_user_defined.py +38 -22
mindspore/dataset/engine/datasets_vision.py +1 -1
mindspore/dataset/engine/validators.py +1 -15
mindspore/dataset/transforms/c_transforms.py +2 -2
mindspore/dataset/transforms/transforms.py +3 -3
mindspore/dataset/vision/__init__.py +1 -1
mindspore/dataset/vision/py_transforms.py +8 -8
mindspore/dataset/vision/transforms.py +17 -5
mindspore/dataset/vision/utils.py +632 -21
mindspore/device_context/ascend/op_tuning.py +35 -1
mindspore/dnnl.dll +0 -0
mindspore/{profiler/common/validator → graph}/__init__.py +9 -1
mindspore/graph/custom_pass.py +55 -0
mindspore/include/api/cell.h +28 -4
mindspore/include/api/cfg.h +24 -7
mindspore/include/api/context.h +1 -0
mindspore/include/api/delegate.h +0 -2
mindspore/include/api/dual_abi_helper.h +100 -19
mindspore/include/api/graph.h +14 -1
mindspore/include/api/kernel.h +16 -3
mindspore/include/api/kernel_api.h +9 -1
mindspore/include/api/metrics/accuracy.h +9 -0
mindspore/include/api/model.h +5 -1
mindspore/include/api/model_group.h +4 -0
mindspore/include/api/model_parallel_runner.h +2 -0
mindspore/include/api/status.h +48 -10
mindspore/include/api/types.h +6 -1
mindspore/include/dataset/constants.h +9 -0
mindspore/include/dataset/execute.h +2 -2
mindspore/jpeg62.dll +0 -0
mindspore/mindrecord/__init__.py +3 -3
mindspore/mindrecord/common/exceptions.py +1 -0
mindspore/mindrecord/config.py +1 -1
mindspore/{parallel/mpi → mindrecord/core}/__init__.py +4 -1
mindspore/mindrecord/{shardheader.py → core/shardheader.py} +2 -1
mindspore/mindrecord/{shardindexgenerator.py → core/shardindexgenerator.py} +1 -1
mindspore/mindrecord/{shardreader.py → core/shardreader.py} +2 -1
mindspore/mindrecord/{shardsegment.py → core/shardsegment.py} +2 -2
mindspore/mindrecord/{shardutils.py → core/shardutils.py} +1 -1
mindspore/mindrecord/{shardwriter.py → core/shardwriter.py} +1 -1
mindspore/mindrecord/filereader.py +4 -4
mindspore/mindrecord/filewriter.py +5 -5
mindspore/mindrecord/mindpage.py +2 -2
mindspore/mindrecord/tools/cifar10.py +4 -3
mindspore/mindrecord/tools/cifar100.py +1 -1
mindspore/mindrecord/tools/cifar100_to_mr.py +1 -1
mindspore/mindrecord/tools/cifar10_to_mr.py +6 -6
mindspore/mindrecord/tools/csv_to_mr.py +1 -1
mindspore/mindrecord/tools/imagenet_to_mr.py +1 -1
mindspore/mindrecord/tools/mnist_to_mr.py +1 -1
mindspore/mindrecord/tools/tfrecord_to_mr.py +1 -1
mindspore/mindspore_backend_common.dll +0 -0
mindspore/mindspore_backend_manager.dll +0 -0
mindspore/mindspore_cluster.dll +0 -0
mindspore/mindspore_common.dll +0 -0
mindspore/mindspore_core.dll +0 -0
mindspore/mindspore_cpu.dll +0 -0
mindspore/mindspore_dump.dll +0 -0
mindspore/mindspore_frontend.dll +0 -0
mindspore/mindspore_glog.dll +0 -0
mindspore/mindspore_hardware_abstract.dll +0 -0
mindspore/mindspore_memory_pool.dll +0 -0
mindspore/mindspore_ms_backend.dll +0 -0
mindspore/mindspore_ops.dll +0 -0
mindspore/{mindspore_ops_host.dll → mindspore_ops_cpu.dll} +0 -0
mindspore/mindspore_profiler.dll +0 -0
mindspore/mindspore_pyboost.dll +0 -0
mindspore/mindspore_pynative.dll +0 -0
mindspore/mindspore_runtime_pipeline.dll +0 -0
mindspore/mindspore_runtime_utils.dll +0 -0
mindspore/mindspore_tools.dll +0 -0
mindspore/mint/__init__.py +15 -10
mindspore/mint/distributed/__init__.py +4 -0
mindspore/mint/distributed/distributed.py +392 -69
mindspore/mint/nn/__init__.py +2 -16
mindspore/mint/nn/functional.py +4 -110
mindspore/mint/nn/layer/__init__.py +0 -2
mindspore/mint/nn/layer/_functions.py +1 -2
mindspore/mint/nn/layer/activation.py +0 -6
mindspore/mint/nn/layer/basic.py +0 -47
mindspore/mint/nn/layer/conv.py +10 -10
mindspore/mint/nn/layer/normalization.py +11 -16
mindspore/mint/nn/layer/pooling.py +0 -4
mindspore/nn/__init__.py +1 -3
mindspore/nn/cell.py +231 -239
mindspore/nn/layer/activation.py +4 -2
mindspore/nn/layer/basic.py +56 -14
mindspore/nn/layer/container.py +16 -0
mindspore/nn/layer/embedding.py +4 -169
mindspore/nn/layer/image.py +1 -1
mindspore/nn/layer/normalization.py +2 -1
mindspore/nn/layer/thor_layer.py +4 -85
mindspore/nn/optim/ada_grad.py +0 -1
mindspore/nn/optim/adafactor.py +0 -1
mindspore/nn/optim/adam.py +32 -127
mindspore/nn/optim/adamax.py +0 -1
mindspore/nn/optim/asgd.py +0 -1
mindspore/nn/optim/ftrl.py +8 -102
mindspore/nn/optim/lamb.py +1 -4
mindspore/nn/optim/lars.py +0 -3
mindspore/nn/optim/lazyadam.py +25 -218
mindspore/nn/optim/momentum.py +5 -43
mindspore/nn/optim/optimizer.py +6 -55
mindspore/nn/optim/proximal_ada_grad.py +0 -1
mindspore/nn/optim/rmsprop.py +0 -1
mindspore/nn/optim/rprop.py +0 -1
mindspore/nn/optim/sgd.py +0 -1
mindspore/nn/optim/tft_wrapper.py +2 -4
mindspore/nn/optim/thor.py +0 -2
mindspore/nn/probability/bijector/bijector.py +7 -8
mindspore/nn/probability/bijector/gumbel_cdf.py +2 -2
mindspore/nn/probability/bijector/power_transform.py +20 -21
mindspore/nn/probability/bijector/scalar_affine.py +5 -5
mindspore/nn/probability/bijector/softplus.py +13 -14
mindspore/nn/probability/distribution/_utils/utils.py +2 -2
mindspore/nn/wrap/cell_wrapper.py +39 -5
mindspore/nn/wrap/grad_reducer.py +4 -89
mindspore/numpy/array_creations.py +4 -4
mindspore/numpy/fft.py +9 -9
mindspore/numpy/utils_const.py +1 -1
mindspore/{nn/reinforcement → onnx}/__init__.py +5 -8
mindspore/onnx/onnx_export.py +137 -0
mindspore/opencv_core4110.dll +0 -0
mindspore/opencv_imgcodecs4110.dll +0 -0
mindspore/{opencv_imgproc452.dll → opencv_imgproc4110.dll} +0 -0
mindspore/ops/__init__.py +2 -0
mindspore/ops/_grad_experimental/grad_comm_ops.py +38 -2
mindspore/ops/_grad_experimental/grad_inner_ops.py +0 -9
mindspore/ops/_op_impl/aicpu/__init__.py +0 -10
mindspore/ops/_op_impl/cpu/__init__.py +1 -5
mindspore/ops/_op_impl/cpu/{buffer_append.py → joinedstr_op.py} +8 -8
mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py +28 -24
mindspore/ops/auto_generate/gen_extend_func.py +6 -11
mindspore/ops/auto_generate/gen_ops_def.py +385 -154
mindspore/ops/auto_generate/gen_ops_prim.py +5676 -5167
mindspore/ops/communication.py +97 -0
mindspore/ops/composite/__init__.py +5 -2
mindspore/ops/composite/base.py +16 -2
mindspore/ops/composite/multitype_ops/__init__.py +3 -1
mindspore/ops/composite/multitype_ops/_compile_utils.py +150 -8
mindspore/ops/composite/multitype_ops/_constexpr_utils.py +1 -1
mindspore/ops/composite/multitype_ops/add_impl.py +7 -0
mindspore/ops/composite/multitype_ops/mod_impl.py +27 -0
mindspore/ops/function/__init__.py +2 -0
mindspore/ops/function/array_func.py +24 -18
mindspore/ops/function/comm_func.py +3883 -0
mindspore/ops/function/debug_func.py +7 -6
mindspore/ops/function/grad/grad_func.py +4 -12
mindspore/ops/function/math_func.py +89 -86
mindspore/ops/function/nn_func.py +92 -313
mindspore/ops/function/random_func.py +9 -18
mindspore/ops/functional.py +4 -1
mindspore/ops/functional_overload.py +377 -30
mindspore/ops/operations/__init__.py +2 -5
mindspore/ops/operations/_custom_ops_utils.py +7 -9
mindspore/ops/operations/_inner_ops.py +12 -50
mindspore/ops/operations/_rl_inner_ops.py +0 -933
mindspore/ops/operations/array_ops.py +5 -50
mindspore/ops/operations/comm_ops.py +95 -17
mindspore/ops/operations/custom_ops.py +237 -22
mindspore/ops/operations/debug_ops.py +33 -35
mindspore/ops/operations/manually_defined/ops_def.py +39 -318
mindspore/ops/operations/math_ops.py +5 -5
mindspore/ops/operations/nn_ops.py +3 -3
mindspore/ops/operations/sparse_ops.py +0 -83
mindspore/ops/primitive.py +4 -27
mindspore/ops/tensor_method.py +88 -10
mindspore/ops_generate/aclnn/aclnn_kernel_register_auto_cc_generator.py +5 -5
mindspore/ops_generate/aclnn/gen_aclnn_implement.py +8 -8
mindspore/ops_generate/api/functions_cc_generator.py +53 -4
mindspore/ops_generate/api/tensor_func_reg_cpp_generator.py +25 -11
mindspore/ops_generate/common/gen_constants.py +11 -10
mindspore/ops_generate/common/op_proto.py +18 -1
mindspore/ops_generate/common/template.py +102 -245
mindspore/ops_generate/common/template_utils.py +212 -0
mindspore/ops_generate/gen_custom_ops.py +69 -0
mindspore/ops_generate/op_def/ops_def_cc_generator.py +78 -7
mindspore/ops_generate/op_def_py/base_op_prim_py_generator.py +360 -0
mindspore/ops_generate/op_def_py/custom_op_prim_py_generator.py +140 -0
mindspore/ops_generate/op_def_py/op_def_py_generator.py +54 -7
mindspore/ops_generate/op_def_py/op_prim_py_generator.py +5 -312
mindspore/ops_generate/pyboost/auto_grad_impl_cc_generator.py +74 -17
mindspore/ops_generate/pyboost/auto_grad_reg_cc_generator.py +22 -5
mindspore/ops_generate/pyboost/gen_pyboost_func.py +0 -16
mindspore/ops_generate/pyboost/op_template_parser.py +3 -2
mindspore/ops_generate/pyboost/pyboost_functions_cpp_generator.py +21 -5
mindspore/ops_generate/pyboost/pyboost_functions_h_generator.py +2 -2
mindspore/ops_generate/pyboost/pyboost_functions_impl_cpp_generator.py +30 -10
mindspore/ops_generate/pyboost/pyboost_grad_function_cpp_generator.py +10 -3
mindspore/ops_generate/pyboost/pyboost_internal_kernel_info_adapter_generator.py +1 -1
mindspore/ops_generate/pyboost/pyboost_native_grad_functions_generator.py +19 -9
mindspore/ops_generate/pyboost/pyboost_op_cpp_code_generator.py +71 -28
mindspore/ops_generate/pyboost/pyboost_overload_functions_cpp_generator.py +10 -9
mindspore/ops_generate/pyboost/pyboost_utils.py +27 -16
mindspore/ops_generate/resources/yaml_loader.py +13 -0
mindspore/ops_generate/tensor_py_cc_generator.py +2 -2
mindspore/parallel/_auto_parallel_context.py +5 -15
mindspore/parallel/_cell_wrapper.py +1 -1
mindspore/parallel/_parallel_serialization.py +4 -6
mindspore/parallel/_ps_context.py +2 -2
mindspore/parallel/_utils.py +34 -17
mindspore/parallel/auto_parallel.py +23 -9
mindspore/parallel/checkpoint_transform.py +20 -2
mindspore/parallel/cluster/process_entity/_api.py +28 -33
mindspore/parallel/cluster/process_entity/_utils.py +9 -5
mindspore/parallel/cluster/run.py +5 -3
mindspore/{experimental/llm_boost/ascend_native → parallel/distributed}/__init__.py +21 -22
mindspore/parallel/distributed/distributed_data_parallel.py +393 -0
mindspore/parallel/distributed/flatten_grad_buffer.py +295 -0
mindspore/parallel/function/reshard_func.py +6 -5
mindspore/parallel/nn/parallel_cell_wrapper.py +40 -3
mindspore/parallel/nn/parallel_grad_reducer.py +0 -8
mindspore/parallel/shard.py +7 -21
mindspore/parallel/strategy.py +336 -0
mindspore/parallel/transform_safetensors.py +127 -20
mindspore/profiler/analysis/viewer/ascend_kernel_details_viewer.py +13 -9
mindspore/profiler/analysis/viewer/ascend_op_memory_viewer.py +1 -1
mindspore/profiler/analysis/viewer/ms_minddata_viewer.py +1 -1
mindspore/profiler/common/constant.py +5 -0
mindspore/profiler/common/file_manager.py +9 -0
mindspore/profiler/common/msprof_cmd_tool.py +40 -4
mindspore/profiler/common/path_manager.py +65 -24
mindspore/profiler/common/profiler_context.py +27 -14
mindspore/profiler/common/profiler_info.py +3 -3
mindspore/profiler/common/profiler_meta_data.py +1 -0
mindspore/profiler/common/profiler_op_analyse.py +10 -6
mindspore/profiler/common/profiler_path_manager.py +13 -0
mindspore/profiler/common/util.py +30 -3
mindspore/profiler/dynamic_profiler.py +91 -46
mindspore/profiler/envprofiler.py +30 -5
mindspore/profiler/experimental_config.py +18 -2
mindspore/profiler/platform/cpu_profiler.py +10 -4
mindspore/profiler/platform/npu_profiler.py +34 -7
mindspore/profiler/profiler.py +193 -145
mindspore/profiler/profiler_action_controller.py +1 -1
mindspore/profiler/profiler_interface.py +2 -2
mindspore/rewrite/symbol_tree/symbol_tree.py +1 -1
mindspore/run_check/_check_version.py +108 -24
mindspore/runtime/__init__.py +9 -6
mindspore/runtime/executor.py +35 -0
mindspore/runtime/memory.py +113 -0
mindspore/runtime/thread_bind_core.py +1 -1
mindspore/swresample-4.dll +0 -0
mindspore/swscale-6.dll +0 -0
mindspore/tinyxml2.dll +0 -0
mindspore/{experimental/llm_boost → tools}/__init__.py +5 -5
mindspore/tools/data_dump.py +130 -0
mindspore/tools/sdc_detect.py +91 -0
mindspore/tools/stress_detect.py +63 -0
mindspore/train/__init__.py +6 -6
mindspore/train/_utils.py +8 -21
mindspore/train/amp.py +6 -7
mindspore/train/callback/_callback.py +2 -1
mindspore/train/callback/_checkpoint.py +1 -17
mindspore/train/callback/_flops_collector.py +10 -6
mindspore/train/callback/_train_fault_tolerance.py +72 -25
mindspore/train/data_sink.py +5 -9
mindspore/train/dataset_helper.py +5 -5
mindspore/train/model.py +41 -230
mindspore/train/serialization.py +160 -401
mindspore/train/train_thor/model_thor.py +2 -2
mindspore/turbojpeg.dll +0 -0
mindspore/utils/__init__.py +6 -3
mindspore/utils/dlpack.py +92 -0
mindspore/utils/dryrun.py +1 -1
mindspore/utils/runtime_execution_order_check.py +10 -0
mindspore/utils/sdc_detect.py +14 -12
mindspore/utils/stress_detect.py +43 -0
mindspore/utils/utils.py +152 -16
mindspore/version.py +1 -1
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/METADATA +3 -2
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/RECORD +330 -344
mindspore/_extends/remote/kernel_build_server_ascend.py +0 -75
mindspore/communication/_hccl_management.py +0 -297
mindspore/experimental/llm_boost/ascend_native/llama_boost_ascend_native.py +0 -207
mindspore/experimental/llm_boost/ascend_native/llm_boost.py +0 -52
mindspore/experimental/llm_boost/atb/__init__.py +0 -23
mindspore/experimental/llm_boost/atb/boost_base.py +0 -385
mindspore/experimental/llm_boost/atb/llama_boost.py +0 -137
mindspore/experimental/llm_boost/atb/qwen_boost.py +0 -124
mindspore/experimental/llm_boost/register.py +0 -130
mindspore/experimental/llm_boost/utils.py +0 -31
mindspore/include/OWNERS +0 -7
mindspore/mindspore_cpu_res_manager.dll +0 -0
mindspore/mindspore_ops_kernel_common.dll +0 -0
mindspore/mindspore_res_manager.dll +0 -0
mindspore/nn/optim/_dist_optimizer_registry.py +0 -111
mindspore/nn/reinforcement/_batch_read_write.py +0 -142
mindspore/nn/reinforcement/_tensors_queue.py +0 -152
mindspore/nn/reinforcement/tensor_array.py +0 -145
mindspore/opencv_core452.dll +0 -0
mindspore/opencv_imgcodecs452.dll +0 -0
mindspore/ops/_op_impl/aicpu/priority_replay_buffer.py +0 -113
mindspore/ops/_op_impl/aicpu/reservoir_replay_buffer.py +0 -96
mindspore/ops/_op_impl/aicpu/sparse_cross.py +0 -42
mindspore/ops/_op_impl/cpu/buffer_get.py +0 -28
mindspore/ops/_op_impl/cpu/buffer_sample.py +0 -28
mindspore/ops/_op_impl/cpu/priority_replay_buffer.py +0 -42
mindspore/ops/operations/_tensor_array.py +0 -359
mindspore/ops/operations/rl_ops.py +0 -288
mindspore/parallel/_offload_context.py +0 -275
mindspore/parallel/_recovery_context.py +0 -115
mindspore/parallel/_transformer/__init__.py +0 -35
mindspore/parallel/_transformer/layers.py +0 -765
mindspore/parallel/_transformer/loss.py +0 -251
mindspore/parallel/_transformer/moe.py +0 -693
mindspore/parallel/_transformer/op_parallel_config.py +0 -222
mindspore/parallel/_transformer/transformer.py +0 -3124
mindspore/parallel/mpi/_mpi_config.py +0 -116
mindspore/profiler/common/validator/validate_path.py +0 -84
mindspore/train/memory_profiling_pb2.py +0 -298
mindspore/utils/hooks.py +0 -81
/mindspore/common/{_auto_dynamic.py → dynamic_shape/_auto_dynamic.py} +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/WHEEL +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/entry_points.txt +0 -0
{mindspore-2.7.0rc1.dist-info → mindspore-2.7.1.dist-info}/top_level.txt +0 -0

mindspore/_extends/remote/kernel_build_server_ascend.py DELETED Viewed

@@ -1,75 +0,0 @@
-# Copyright 2020-2021 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""kernel build server for ascend"""
-import sys
-import warnings
-import json
-from mindspore._extends.parallel_compile.tbe_compiler.tbe_job_manager import TbeJobManager
-from mindspore._extends.remote.kernel_build_server import Messager, get_logger, AkgBuilder
-class AscendMessager(Messager):
-    """
-    Ascend Messager
-    It works as a server, communicating with c++ client.
-    """
-    def __init__(self, fdin, fdout):
-        super().__init__(fdin, fdout)
-        get_logger().info("[TRACE] Ascend Messager init...")
-        self.tbe_builder = TbeJobManager()
-        self.akg_builder = AkgBuilder("ASCEND")
-    def handle(self):
-        """
-        Communicate with remote client.
-        Reference protocol between them at PR#3821 and PR#3935
-        """
-        arg = self.get_message()
-        if arg.startswith('AKG'):
-            self.akg_builder.handle(self, arg)
-        else:
-            job_json = dict()
-            try:
-                job_json = json.loads(arg)
-            except json.decoder.JSONDecodeError:
-                get_logger().error("[TRACE] Request is not a json message: {}".format(arg))
-                self.send_ack(False)
-                self.exit()
-            finally:
-                pass
-            if "job_type" in job_json:
-                res = self.tbe_builder.job_handler(arg)
-                self.send_res(res)
-            else:
-                get_logger().error("[TRACE] Request is not a TBE Job message: {}".format(arg))
-                self.send_ack(False)
-                self.exit()
-    def exit(self):
-        self.tbe_builder.reset()
-        get_logger().info("[TRACE] Ascend Messager Exit...")
-        exit()
-if __name__ == '__main__':
-    warnings.simplefilter("ignore")
-    if len(sys.argv) != 3:
-        raise Exception('Incorrect argv: {}'.format(sys.argv))
-    get_logger().debug(f"[TRACE] argv: {str(sys.argv)}")
-    messager = AscendMessager(int(sys.argv[1]), int(sys.argv[2]))
-    messager.run()

mindspore/communication/_hccl_management.py DELETED Viewed

@@ -1,297 +0,0 @@
-# Copyright 2020 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""HCCL management API"""
-from __future__ import absolute_import
-from __future__ import division
-import ctypes
-import os
-from mindspore import context
-from mindspore._c_expression import get_hccl_rank_id, get_hccl_rank_size
-MAX_GROUP_NAME_LEN = 127
-MAX_RANK_NUM = 4096
-HCCL_LIB = 'libhccl_plugin.so'
-HCCL_LIB_CTYPES = ""
-def check_group(group):
-    """
-    A function that check if a collection communication group is legal.
-    Returns:
-        None
-    """
-    if isinstance(group, (str)):
-        group_len = len(group)
-        if group_len > MAX_GROUP_NAME_LEN or group_len == 0:
-            raise ValueError("The length of communication group name must be in range [1, 127), "
-                             "but got the value : {} ".format(group_len))
-    else:
-        raise TypeError("The type of communication group name must be type of string, "
-                        "but got 'group' type : {}.".format(type(group)))
-def check_rank_num(rank_num):
-    """
-    A function that check if a collection communication rank number is legal.If not raise error.
-    Returns:
-        None
-    """
-    if isinstance(rank_num, (int)):
-        if rank_num > MAX_RANK_NUM or rank_num <= 0:
-            raise ValueError("For 'create_group', the size of argument 'rand_ids' should be greater than 0 and"
-                             "less than {}, but got the size of 'rank_ids' : {}.".format(MAX_RANK_NUM, rank_num))
-    else:
-        raise TypeError("The argument 'rank_num' must be type of int, "
-                        "but got 'rank_num' type : {}.".format(type(rank_num)))
-def check_rank_id(rank_id):
-    """
-    A function that check if a collection communication rank id is legal.If not raise error.
-    Returns:
-        None
-    """
-    if isinstance(rank_id, (int)):
-        if rank_id >= MAX_RANK_NUM or rank_id < 0:
-            raise ValueError("The rand id in the communication group must be greater or equal 0 and "
-                             "less than {}, but got type value : {}.".format(MAX_RANK_NUM, rank_id))
-    else:
-        raise TypeError("The rand id in the communication group must be must be type of int, "
-                        "but got type value : {}.".format(type(rank_id)))
-def load_lib():
-    """load hccl lib"""
-    try:
-        base_dir = os.path.dirname(os.path.realpath(__file__))
-        lib_path = os.path.join(base_dir, "../lib/plugin/ascend", HCCL_LIB)
-        hccl_lib = ctypes.CDLL(lib_path)
-    except Exception:
-        raise RuntimeError('Get hccl lib error.')
-    global HCCL_LIB_CTYPES
-    HCCL_LIB_CTYPES = hccl_lib
-def c_str(string):
-    """Convert a python string to C string."""
-    if not isinstance(string, str):
-        string = string.decode('ascii')
-    return ctypes.c_char_p(string.encode('utf-8'))
-def c_array(ctype, values):
-    """Create ctypes array from a python array."""
-    return (ctype * len(values))(*values)
-def create_group(group, rank_num, rank_ids):
-    """
-    Create group.
-    A function that creates a collection communication group which includes 'rank_num'
-    device and 'rank_ids' is the list of these ranks of devices.
-    Note:
-        The world group can not be created.
-    Returns:
-        None
-    """
-    check_group(group)
-    check_rank_num(rank_num)
-    if isinstance(rank_ids, (list)):
-        if rank_num != len(rank_ids):
-            raise ValueError("The argument 'rank_num' number should be equal to the length "
-                             "of rank_ids, but got 'rank_num' value : {} and 'rank_ids' value : {}."
-                             .format(rank_num, rank_ids))
-        for rank_id in rank_ids:
-            if not isinstance(rank_id, (int)) or rank_id < 0:
-                raise ValueError("The elements of argument 'rank_ids' must be "
-                                 "unsigned integer, but got the type : {}".format(type(rank_id)))
-        c_array_rank_ids = c_array(ctypes.c_uint, rank_ids)
-        c_rank_num = ctypes.c_uint(rank_num)
-        c_group = c_str(group)
-        ret = HCCL_LIB_CTYPES.HcomCreateGroup(c_group, c_rank_num, c_array_rank_ids)
-        if ret != 0:
-            raise RuntimeError('Create group error, the error code is {}.'.format(ret))
-    else:
-        raise TypeError("For 'create_group', the argument 'rank_ids' must be type of list, "
-                        "but got 'rank_ids' type : {}.".format(type(rank_ids)))
-def destroy_group(group):
-    """
-    A function that destroy the group which created by user.
-    Note:
-        The world group can not be destroy.
-    Returns:
-        None
-    """
-    check_group(group)
-    c_group = c_str(group)
-    ret = HCCL_LIB_CTYPES.HcomDestroyGroup(c_group)
-    if ret != 0:
-        raise RuntimeError('Destroy group error.')
-def get_rank_size(group="hccl_world_group"):
-    """
-    A function that returns the number of ranks within the given collection communication group.
-    Note:
-        The default group is hccl_world_group.
-    Returns:
-        An integer scalar with the num of ranks.
-    """
-    if context.get_context("mode") == context.PYNATIVE_MODE:
-        return get_hccl_rank_size()
-    check_group(group)
-    c_group = c_str(group)
-    c_rank_size = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetRankSize(c_group, ctypes.byref(c_rank_size))
-    if ret != 0:
-        raise RuntimeError('Get rank size error.')
-    return c_rank_size.value
-def get_rank_id(group="hccl_world_group"):
-    """
-    A function that returns the rank id of the calling process, within the given collection communication group.
-    Returns:
-        An integer scalar with the rank id of the calling process.
-    """
-    if context.get_context("mode") == context.PYNATIVE_MODE:
-        return get_hccl_rank_id()
-    check_group(group)
-    c_group = c_str(group)
-    c_rank_id = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetRankId(c_group, ctypes.byref(c_rank_id))
-    if ret != 0:
-        raise RuntimeError('Get rank id error.')
-    return c_rank_id.value
-def get_local_rank_size(group="hccl_world_group"):
-    """
-    A function that returns the number of local ranks within the given collection communication group.
-    Note:
-        The default group is hccl_world_group.
-    Returns:
-        An integer scalar with the num of local ranks.
-    """
-    if context.get_context("mode") is context.PYNATIVE_MODE:
-        raise RuntimeError("The function 'get_local_rank_size' is not supported in PYNATIVE_MODE, "
-                           "'get_local_rank_size' only support GRAPH_MODE")
-    check_group(group)
-    c_group = c_str(group)
-    c_local_rank_size = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetLocalRankSize(c_group, ctypes.byref(c_local_rank_size))
-    if ret != 0:
-        raise RuntimeError('Get local rank size error.')
-    return c_local_rank_size.value
-def get_local_rank_id(group="hccl_world_group"):
-    """
-    Get local rank id.
-    A function that returns the local rank id of the calling process, within the given collection communication group.
-    Returns:
-        An integer scalar with the local rank id of the calling process.
-    """
-    if context.get_context("mode") is context.PYNATIVE_MODE:
-        raise RuntimeError("The function 'get_local_rank_id' is not supported in PYNATIVE_MODE, "
-                           "'get_local_rank_id' only support GRAPH_MODE")
-    check_group(group)
-    c_group = c_str(group)
-    c_local_rank_id = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetLocalRankId(c_group, ctypes.byref(c_local_rank_id))
-    if ret != 0:
-        raise RuntimeError('Get local rank id error.')
-    return c_local_rank_id.value
-def get_world_rank_from_group_rank(group, group_rank_id):
-    """
-    Get world rank from group rank.
-    A function that returns the rank id in the world group corresponding to the
-    rank which id is 'group_rank_id' in the user group.
-    Returns:
-        An integer scalar with the rank id in the world group.
-    """
-    if context.get_context("mode") is context.PYNATIVE_MODE:
-        raise RuntimeError("The function 'get_world_rank_from_group_rank' is not supported in PYNATIVE_MODE, "
-                           "'get_world_rank_from_group_rank' only support GRAPH_MODE")
-    check_group(group)
-    check_rank_id(group_rank_id)
-    c_group = c_str(group)
-    c_group_rank_id = ctypes.c_uint(group_rank_id)
-    c_world_rank_id = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetWorldRankFromGroupRank(c_group, c_group_rank_id, ctypes.byref(c_world_rank_id))
-    if ret != 0:
-        raise RuntimeError('Get world rank from group rank error.')
-    return c_world_rank_id.value
-def get_group_rank_from_world_rank(world_rank_id, group):
-    """
-    Get group rank from world rank.
-    A function that returns the rank id in the user group corresponding to the
-    rank which id is 'world_rank_id' in the world group.
-    Returns:
-        An integer scalar with the rank id in the user group.
-    """
-    if context.get_context("mode") is context.PYNATIVE_MODE:
-        raise RuntimeError("The function 'get_group_rank_from_world_rank' is not supported in PYNATIVE_MODE, "
-                           "'get_group_rank_from_world_rank' only support GRAPH_MODE")
-    check_group(group)
-    check_rank_id(world_rank_id)
-    c_group = c_str(group)
-    c_world_rank_id = ctypes.c_uint(world_rank_id)
-    c_group_rank_id = ctypes.c_uint()
-    ret = HCCL_LIB_CTYPES.HcomGetGroupRankFromWorldRank(c_world_rank_id, c_group, ctypes.byref(c_group_rank_id))
-    if ret != 0:
-        raise RuntimeError('Get group rank from world rank error.')
-    return c_group_rank_id.value

mindspore/experimental/llm_boost/ascend_native/llama_boost_ascend_native.py DELETED Viewed

@@ -1,207 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""AscendNative Llama Boost APIs."""
-import os
-import numpy as np
-from mindspore.common import Tensor, dtype
-from mindspore.experimental.llm_boost.ascend_native.llm_boost import LLMBoost
-def RoundUp(val: int, align: int) -> int:
-    if align == 0:
-        return 0
-    return -(val // -align) * align
-def ConvertTensor(nd_mat: np.ndarray, transpose: bool = True, nd2nz: bool = True) -> np.ndarray:
-    """ Transforms tensor format from Nd to Nz """
-    if transpose:
-        nd_mat = np.transpose(nd_mat)
-    if not nd2nz:
-        return nd_mat
-    block_size = (16, 16)
-    r = RoundUp(nd_mat.shape[0], block_size[0])
-    c = RoundUp(nd_mat.shape[1], block_size[1])
-    r_pad = r - nd_mat.shape[0]
-    c_pad = c - nd_mat.shape[1]
-    nd_mat = np.pad(nd_mat, ((0, r_pad), (0, c_pad)))
-    nz_mat = np.transpose(np.reshape(
-        nd_mat, (r, c // block_size[1], block_size[1])), (1, 0, 2))
-    nz_mat = nz_mat.reshape(r, c)
-    return nz_mat
-class LlamaBoostAscendNative(LLMBoost):
-    r"""
-    Implements an Llama model in a single kernel.
-    it forwards the python functions to the C++ binded object
-    """
-    def _get_from_dict(self, dictionary, name):
-        """ internal function to get a specific tensor from the dictionary """
-        all_relevant_layers = [value for key, value in dictionary.items() if name in key]
-        if all_relevant_layers:
-            return all_relevant_layers[0].asnumpy()
-        return None
-    def _get_quant_triplet_from_dict(self, dictionary, name):
-        """ internal function to get a weight triple tensor from the dictionary """
-        weights = self._get_from_dict(dictionary, name + "._handler.weight")
-        scale = self._get_from_dict(dictionary, name + "._weight_quantizer.scale")
-        offset = self._get_from_dict(dictionary, name + "._weight_quantizer.zp_neg")
-        return weights, scale, offset
-    def _prepare_single_layer(self, ckpt, config, id):
-        """ prepares the dictionary of weights of a single layer """
-        prefix = 'model.layers.' + str(id)
-        is_last = id == config.num_layers-1
-        layer = 'layers.' + str(id) + '.'
-        l_dict = {key: value for key, value in ckpt.items() if layer in key}
-        if config.n_kv_heads is None:
-            config.n_kv_heads = config.num_heads
-        start = 0
-        end = config.hidden_size
-        kv_start = 0
-        kv_end = int(config.hidden_size*config.n_kv_heads/config.num_heads)
-        ffn_hid = [value for key, value in l_dict.items() if "w3" in key][0].shape[0]
-        ffn_start = 0
-        ffn_end = ffn_hid
-        rank_size = int(os.getenv('RANK_SIZE', '1'))
-        #Emir if (config.parallel_mode != 2): # 2 - AUTO_PARALLEL
-        hid_size = end
-        kv_hid_size = kv_end
-        embed_size = config.vocab_size
-        rank_id = int(os.getenv('RANK_ID', '0'))
-        if (hid_size % rank_size == 0) and (ffn_hid % rank_size == 0) and (embed_size % rank_size == 0):
-            start = int(rank_id * hid_size / rank_size)
-            end = int((rank_id + 1) * hid_size / rank_size)
-            kv_start = int(rank_id * kv_hid_size / rank_size)
-            kv_end = int((rank_id + 1) * kv_hid_size / rank_size)
-            ffn_start = int(rank_id * ffn_hid / rank_size)
-            ffn_end = int((rank_id + 1) * ffn_hid / rank_size)
-        else:
-            raise RuntimeError("hidden size and ffn hidden size must be divided by rank size without remainder.  \
-                                hidden_size: ", hid_size, " ffn_hidden_size: ", ffn_hid, " rank_size: ", rank_size)
-        quant = self._get_from_dict(l_dict, "_weight_quantizer") is not None
-        unite_qkv = config.num_heads == config.n_kv_heads
-        self.dictionary[prefix + ".attention_norm.weight"] = \
-            Tensor(self._get_from_dict(l_dict, "attention_norm"), dtype=dtype.float16)
-        self.dictionary[prefix + ".ffn_norm.weight"] = \
-            Tensor(self._get_from_dict(l_dict, "ffn_norm"), dtype=dtype.float16)
-        if is_last:
-            self.dictionary['lm_head.weight'] = Tensor(ConvertTensor(ckpt['lm_head.weight'].asnumpy()[:, start:end]))
-        if not quant:
-            self._pack_attn_weights(l_dict, prefix, start, end, kv_start, kv_end, unite_qkv)
-            self._pack_ffn_weights(l_dict, prefix, ffn_start, ffn_end)
-        else:
-            self._pack_attn_quant_weights(l_dict, prefix, start, end, kv_start, kv_end, unite_qkv)
-            self._pack_ffn_quant_weights(l_dict, prefix, ffn_start, ffn_end)
-    def _pack_attn_weights(self, l_dict, prefix, start, end, kv_start, kv_end, unite_qkv):
-        """ prepares the dictionary of weights of an attention block """
-        wq = self._get_from_dict(l_dict, "wq")[start:end, :]
-        wk = self._get_from_dict(l_dict, "wk")[kv_start:kv_end, :]
-        wv = self._get_from_dict(l_dict, "wv")[kv_start:kv_end, :]
-        self.dictionary[prefix + ".attention.wo.weight"] = \
-            Tensor(ConvertTensor(self._get_from_dict(l_dict, "wo")[:, start:end]))
-        if unite_qkv:
-            self.dictionary[prefix + ".attention.wqkv.weight"] = Tensor(ConvertTensor(np.concatenate((wq, wk, wv))))
-        else:
-            self.dictionary[prefix + ".attention.wq.weight"] = Tensor(ConvertTensor(wq))
-            self.dictionary[prefix + ".attention.wkv.weight"] = Tensor(ConvertTensor(np.concatenate((wk, wv))))
-    def _pack_ffn_weights(self, l_dict, prefix, ffn_start, ffn_end):
-        """ prepares the dictionary of weights of an ffn block """
-        self.dictionary[prefix + ".feed_forward.w2.weight"] = \
-            Tensor(ConvertTensor(self._get_from_dict(l_dict, "w2")[:, ffn_start:ffn_end]))
-        w1 = self._get_from_dict(l_dict, "w1")[ffn_start:ffn_end, :]
-        w3 = self._get_from_dict(l_dict, "w3")[ffn_start:ffn_end, :]
-        self.dictionary[prefix + ".feed_forward.w13.weight"] = Tensor(ConvertTensor(np.concatenate((w1, w3))))
-    def _pack_attn_quant_weights(self, l_dict, prefix, start, end, kv_start, kv_end, unite_qkv):
-        """ prepares the dictionary of weights of a quantized attention block """
-        wq, wq_scale, wq_offset = self._get_quant_triplet_from_dict(l_dict, "wq")
-        wk, wk_scale, wk_offset = self._get_quant_triplet_from_dict(l_dict, "wk")
-        wv, wv_scale, wv_offset = self._get_quant_triplet_from_dict(l_dict, "wv")
-        wo, wo_scale, wo_offset = self._get_quant_triplet_from_dict(l_dict, "wo")
-        self.dictionary[prefix + ".attention.wo.weight"] = Tensor(ConvertTensor(wo[:, start:end], nd2nz=False))
-        self.dictionary[prefix + ".attention.wo.weight.scale"] = Tensor(wo_scale[start:end])
-        self.dictionary[prefix + ".attention.wo.weight.offset"] = Tensor(wo_offset[start:end])
-        if unite_qkv:
-            self.dictionary[prefix + ".attention.wqkv.weight"] = \
-             Tensor(ConvertTensor(np.concatenate((wq[start:end, :], wk[kv_start:kv_end, :], wv[kv_start:kv_end, :])),
-                                  nd2nz=False))
-            self.dictionary[prefix + ".attention.wqkv.weight.scale"] = \
-                Tensor(np.concatenate((wq_scale[start:end], wk_scale[kv_start:kv_end], wv_scale[kv_start:kv_end])))
-            self.dictionary[prefix + ".attention.wqkv.weight.offset"] = \
-                Tensor(np.concatenate((wq_offset[start:end], wk_offset[kv_start:kv_end], wv_offset[kv_start:kv_end])))
-        else:
-            self.dictionary[prefix + ".attention.wq.weight"] = Tensor(ConvertTensor(wq[start:end, :], nd2nz=False))
-            self.dictionary[prefix + ".attention.wq.weight.scale"] = Tensor(wq_scale[start:end])
-            self.dictionary[prefix + ".attention.wq.weight.offset"] = Tensor(wq_offset[start:end])
-            self.dictionary[prefix + ".attention.wkv.weight"] = \
-                Tensor(ConvertTensor(np.concatenate((wk[kv_start:kv_end, :], wv[kv_start:kv_end, :])), nd2nz=False))
-            self.dictionary[prefix + ".attention.wkv.weight.scale"] = \
-                Tensor(np.concatenate((wk_scale[kv_start:kv_end], wv_scale[kv_start:kv_end])))
-            self.dictionary[prefix + ".attention.wkv.weight.offset"] = \
-                Tensor(np.concatenate((wk_offset[kv_start:kv_end], wv_offset[kv_start:kv_end])))
-    def _pack_ffn_quant_weights(self, l_dict, prefix, ffn_start, ffn_end):
-        """ prepares the dictionary of weights of a quantized ffn block """
-        w1, w1_scale, w1_offset = self._get_quant_triplet_from_dict(l_dict, "w1")
-        w2, w2_scale, w2_offset = self._get_quant_triplet_from_dict(l_dict, "w2")
-        w3, w3_scale, w3_offset = self._get_quant_triplet_from_dict(l_dict, "w3")
-        self.dictionary[prefix + ".feed_forward.w2.weight"] = Tensor(ConvertTensor(w2[:, ffn_start:ffn_end],
-                                                                                   nd2nz=False))
-        self.dictionary[prefix + ".feed_forward.w2.weight.scale"] = Tensor(w2_scale[ffn_start:ffn_end])
-        self.dictionary[prefix + ".feed_forward.w2.weight.offset"] = Tensor(w2_offset[ffn_start:ffn_end])
-        self.dictionary[prefix + ".feed_forward.w13.weight"] = \
-                Tensor(ConvertTensor(np.concatenate((w1[ffn_start:ffn_end, :], w3[ffn_start:ffn_end, :])), nd2nz=False))
-        self.dictionary[prefix + ".feed_forward.w13.weight.scale"] = \
-                Tensor(np.concatenate((w1_scale[ffn_start:ffn_end], w3_scale[ffn_start:ffn_end])))
-        self.dictionary[prefix + ".feed_forward.w13.weight.offset"] = \
-            Tensor(np.concatenate((w1_offset[ffn_start:ffn_end], w3_offset[ffn_start:ffn_end])))
-    def _prepare_cos_sin_arrays(self, config, theta=10000):
-        """ prepares the cosine and sine arrays """
-        head_dim = config.hidden_size // config.num_heads
-        max_position_embedding = \
-            config.max_position_embedding if config.max_position_embedding is not None else config.seq_length
-        freqs_base = np.arange(0, head_dim, 2)[: (head_dim // 2)].astype(np.float32)
-        freqs = 1.0 / (theta ** (freqs_base / head_dim))
-        t = np.arange(0, max_position_embedding, 1).astype(np.float32)
-        freqs = np.outer(t, freqs)
-        emb = np.concatenate((freqs, freqs), axis=-1)
-        freqs_cos = Tensor(np.cos(emb), dtype=dtype.float16)
-        sin = np.sin(emb)
-        sin[:, :int(emb.shape[1]/2)] = -sin[:, :int(emb.shape[1]/2)]
-        self.dictionary['model.cos.weight'] = freqs_cos
-        freqs_sin = Tensor(sin, dtype=dtype.float16)
-        self.dictionary['model.sin.weight'] = freqs_sin
-    def set_weights(self, ckpt_dict):
-        """ load the checkpoint """
-        self.dictionary = {}
-        self.dictionary['model.tok_embeddings.embedding_weight'] = \
-            Tensor(ckpt_dict['model.tok_embeddings.embedding_weight'].asnumpy())
-        self.dictionary['model.norm_out.weight'] = \
-            Tensor(ckpt_dict['model.norm_out.weight'].asnumpy(), dtype=dtype.float16)
-        self._prepare_cos_sin_arrays(self.config)
-        for layer_id in range(self.config.num_layers):
-            self._prepare_single_layer(ckpt_dict, self.config, layer_id)
-        self.binder.set_weights_map(self.dictionary)

mindspore/experimental/llm_boost/ascend_native/llm_boost.py DELETED Viewed

@@ -1,52 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""LLMBoost APIs."""
-from mindspore.common import Tensor
-class LLMBoost():
-    r"""
-    Implements an LLM in a single kernel.
-    it forwards the python function to the C++ binded object
-    """
-    def __init__(self, config):
-        r"""
-        initialize the parameters of the llm binder.
-        config is simply the config object of the model
-        """
-        from mindspore._c_expression import LlmBoostBinder
-        self.config = config
-        self.binder = LlmBoostBinder("AscendNative", config.model_type)
-        self.binder.init_model(config.to_dict())
-    def init(self):
-        """
-        Initialize the object
-        returns True if object needs input manipulation by mindformers
-        """
-        return False
-    def set_kvcache(self, k_caches=None, v_caches=None):
-        return
-    def forward(self, input_ids, batch_valid_length, position_ids=None):
-        ret = self.binder.forward([input_ids, batch_valid_length], "nothing really")
-        return Tensor(ret[0])
-    def set_weights(self, ckpt_dict):
-        self.binder.set_weights_map(ckpt_dict)
-    def add_flags(self, is_first_iteration=False):
-        self.binder.add_flags(is_first_iteration=is_first_iteration)

mindspore/experimental/llm_boost/atb/__init__.py DELETED Viewed

@@ -1,23 +0,0 @@
-# Copyright 2024 Huawei Technologies Co., Ltd
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-# ============================================================================
-"""
-Provide llm boost for inference, such as LlamaBoost.
-"""
-from __future__ import absolute_import
-from mindspore.experimental.llm_boost.atb.llama_boost import LlamaBoost
-from mindspore.experimental.llm_boost.atb.qwen_boost import QwenBoost
-__all__ = ['LlamaBoost', 'QwenBoost']