PyPI - mindspore - Versions diffs - 2.3.0__cp310-cp310-win_amd64.whl → 2.4.0__cp310-cp310-win_amd64.whl - Mend

mindspore 2.3.0__cp310-cp310-win_amd64.whl → 2.4.0__cp310-cp310-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (308) hide show

mindspore/.commit_id +1 -1
mindspore/Microsoft.VisualStudio.Telemetry.dll +0 -0
mindspore/Newtonsoft.Json.dll +0 -0
mindspore/__init__.py +3 -1
mindspore/_c_dataengine.cp310-win_amd64.pyd +0 -0
mindspore/_c_expression.cp310-win_amd64.pyd +0 -0
mindspore/_c_mindrecord.cp310-win_amd64.pyd +0 -0
mindspore/_checkparam.py +50 -9
mindspore/_extends/parse/compile_config.py +41 -0
mindspore/_extends/parse/parser.py +9 -7
mindspore/_extends/parse/standard_method.py +52 -14
mindspore/_extends/pijit/pijit_func_white_list.py +350 -24
mindspore/amp.py +24 -10
mindspore/atlprov.dll +0 -0
mindspore/avcodec-59.dll +0 -0
mindspore/avdevice-59.dll +0 -0
mindspore/avfilter-8.dll +0 -0
mindspore/avformat-59.dll +0 -0
mindspore/avutil-57.dll +0 -0
mindspore/c1.dll +0 -0
mindspore/c1xx.dll +0 -0
mindspore/c2.dll +0 -0
mindspore/common/__init__.py +6 -4
mindspore/common/_pijit_context.py +190 -0
mindspore/common/_register_for_tensor.py +2 -1
mindspore/common/_tensor_overload.py +139 -0
mindspore/common/api.py +102 -87
mindspore/common/dump.py +5 -6
mindspore/common/generator.py +1 -7
mindspore/common/hook_handle.py +14 -26
mindspore/common/mindir_util.py +2 -2
mindspore/common/parameter.py +46 -13
mindspore/common/recompute.py +39 -9
mindspore/common/sparse_tensor.py +7 -3
mindspore/common/tensor.py +209 -29
mindspore/communication/__init__.py +1 -1
mindspore/communication/_comm_helper.py +38 -3
mindspore/communication/comm_func.py +310 -55
mindspore/communication/management.py +14 -14
mindspore/context.py +123 -22
mindspore/dataset/__init__.py +1 -1
mindspore/dataset/audio/__init__.py +1 -1
mindspore/dataset/core/config.py +7 -0
mindspore/dataset/core/validator_helpers.py +7 -0
mindspore/dataset/engine/cache_client.py +1 -1
mindspore/dataset/engine/datasets.py +72 -44
mindspore/dataset/engine/datasets_audio.py +7 -7
mindspore/dataset/engine/datasets_standard_format.py +53 -3
mindspore/dataset/engine/datasets_text.py +20 -20
mindspore/dataset/engine/datasets_user_defined.py +174 -104
mindspore/dataset/engine/datasets_vision.py +33 -33
mindspore/dataset/engine/iterators.py +29 -0
mindspore/dataset/engine/obs/util.py +7 -0
mindspore/dataset/engine/queue.py +114 -60
mindspore/dataset/engine/serializer_deserializer.py +2 -2
mindspore/dataset/engine/validators.py +34 -14
mindspore/dataset/text/__init__.py +1 -4
mindspore/dataset/transforms/__init__.py +0 -3
mindspore/dataset/utils/line_reader.py +2 -0
mindspore/dataset/vision/__init__.py +1 -4
mindspore/dataset/vision/utils.py +1 -1
mindspore/dataset/vision/validators.py +2 -1
mindspore/dnnl.dll +0 -0
mindspore/dpcmi.dll +0 -0
mindspore/{nn/extend → experimental/es}/__init__.py +4 -11
mindspore/experimental/es/embedding_service.py +883 -0
mindspore/{nn/layer → experimental/es}/embedding_service_layer.py +218 -30
mindspore/experimental/llm_boost/__init__.py +21 -0
mindspore/{nn/extend/layer → experimental/llm_boost/atb}/__init__.py +4 -8
mindspore/experimental/llm_boost/atb/boost_base.py +211 -0
mindspore/experimental/llm_boost/atb/llama_boost.py +115 -0
mindspore/experimental/llm_boost/atb/qwen_boost.py +101 -0
mindspore/experimental/llm_boost/register.py +129 -0
mindspore/experimental/llm_boost/utils.py +31 -0
mindspore/experimental/optim/adamw.py +85 -0
mindspore/experimental/optim/optimizer.py +3 -0
mindspore/hal/__init__.py +3 -3
mindspore/hal/contiguous_tensors_handle.py +175 -0
mindspore/hal/stream.py +18 -0
mindspore/include/api/model_group.h +13 -1
mindspore/include/api/types.h +10 -10
mindspore/include/dataset/config.h +2 -2
mindspore/include/dataset/constants.h +2 -2
mindspore/include/dataset/execute.h +2 -2
mindspore/include/dataset/vision.h +4 -0
mindspore/jpeg62.dll +0 -0
mindspore/log.py +1 -1
mindspore/mindrecord/filewriter.py +68 -51
mindspore/mindspore_backend.dll +0 -0
mindspore/mindspore_common.dll +0 -0
mindspore/mindspore_core.dll +0 -0
mindspore/mindspore_glog.dll +0 -0
mindspore/mindspore_np_dtype.dll +0 -0
mindspore/mindspore_ops.dll +0 -0
mindspore/mint/__init__.py +495 -46
mindspore/mint/distributed/__init__.py +31 -0
mindspore/mint/distributed/distributed.py +254 -0
mindspore/mint/nn/__init__.py +266 -21
mindspore/mint/nn/functional.py +125 -19
mindspore/mint/nn/layer/__init__.py +39 -0
mindspore/mint/nn/layer/activation.py +133 -0
mindspore/mint/nn/layer/normalization.py +477 -0
mindspore/mint/nn/layer/pooling.py +110 -0
mindspore/mint/optim/adamw.py +28 -7
mindspore/mint/special/__init__.py +63 -0
mindspore/msobj140.dll +0 -0
mindspore/mspdb140.dll +0 -0
mindspore/mspdbcore.dll +0 -0
mindspore/mspdbst.dll +0 -0
mindspore/mspft140.dll +0 -0
mindspore/msvcdis140.dll +0 -0
mindspore/msvcp140_1.dll +0 -0
mindspore/msvcp140_2.dll +0 -0
mindspore/msvcp140_atomic_wait.dll +0 -0
mindspore/msvcp140_codecvt_ids.dll +0 -0
mindspore/multiprocessing/__init__.py +2 -1
mindspore/nn/__init__.py +0 -1
mindspore/nn/cell.py +275 -93
mindspore/nn/layer/activation.py +211 -44
mindspore/nn/layer/basic.py +113 -3
mindspore/nn/layer/embedding.py +120 -2
mindspore/nn/layer/normalization.py +101 -5
mindspore/nn/layer/padding.py +34 -48
mindspore/nn/layer/pooling.py +161 -7
mindspore/nn/layer/transformer.py +3 -3
mindspore/nn/loss/__init__.py +2 -2
mindspore/nn/loss/loss.py +84 -6
mindspore/nn/optim/__init__.py +2 -1
mindspore/nn/optim/adadelta.py +1 -1
mindspore/nn/optim/adam.py +1 -1
mindspore/nn/optim/lamb.py +1 -1
mindspore/nn/optim/tft_wrapper.py +127 -0
mindspore/nn/wrap/cell_wrapper.py +12 -23
mindspore/nn/wrap/grad_reducer.py +5 -5
mindspore/nn/wrap/loss_scale.py +17 -3
mindspore/numpy/__init__.py +1 -1
mindspore/numpy/array_creations.py +65 -68
mindspore/numpy/array_ops.py +64 -60
mindspore/numpy/fft.py +610 -75
mindspore/numpy/logic_ops.py +11 -10
mindspore/numpy/math_ops.py +85 -84
mindspore/numpy/utils_const.py +4 -4
mindspore/opencv_core452.dll +0 -0
mindspore/opencv_imgcodecs452.dll +0 -0
mindspore/opencv_imgproc452.dll +0 -0
mindspore/ops/__init__.py +6 -4
mindspore/ops/_grad_experimental/grad_comm_ops.py +47 -3
mindspore/ops/_grad_experimental/grad_math_ops.py +0 -22
mindspore/ops/_vmap/vmap_array_ops.py +2 -4
mindspore/ops/_vmap/vmap_math_ops.py +17 -1
mindspore/ops/_vmap/vmap_nn_ops.py +43 -2
mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py +85 -7
mindspore/ops/auto_generate/gen_arg_dtype_cast.py +2 -0
mindspore/ops/auto_generate/gen_extend_func.py +734 -13
mindspore/ops/auto_generate/gen_ops_def.py +2420 -381
mindspore/ops/auto_generate/gen_ops_prim.py +5196 -1659
mindspore/ops/auto_generate/pyboost_inner_prim.py +176 -56
mindspore/ops/composite/base.py +85 -48
mindspore/ops/composite/multitype_ops/_compile_utils.py +1 -0
mindspore/ops/composite/multitype_ops/not_in_impl.py +2 -2
mindspore/ops/function/__init__.py +22 -0
mindspore/ops/function/array_func.py +490 -153
mindspore/ops/function/debug_func.py +113 -1
mindspore/ops/function/fft_func.py +15 -2
mindspore/ops/function/grad/grad_func.py +3 -2
mindspore/ops/function/math_func.py +558 -207
mindspore/ops/function/nn_func.py +817 -383
mindspore/ops/function/other_func.py +3 -2
mindspore/ops/function/random_func.py +184 -8
mindspore/ops/function/reshard_func.py +13 -11
mindspore/ops/function/sparse_unary_func.py +1 -1
mindspore/ops/function/vmap_func.py +3 -2
mindspore/ops/functional.py +24 -14
mindspore/ops/op_info_register.py +3 -3
mindspore/ops/operations/__init__.py +6 -1
mindspore/ops/operations/_grad_ops.py +2 -76
mindspore/ops/operations/_infer_ops.py +1 -1
mindspore/ops/operations/_inner_ops.py +71 -94
mindspore/ops/operations/array_ops.py +12 -146
mindspore/ops/operations/comm_ops.py +42 -53
mindspore/ops/operations/custom_ops.py +83 -19
mindspore/ops/operations/debug_ops.py +42 -10
mindspore/ops/operations/manually_defined/_inner.py +12 -0
mindspore/ops/operations/manually_defined/ops_def.py +265 -10
mindspore/ops/operations/math_ops.py +12 -223
mindspore/ops/operations/nn_ops.py +20 -114
mindspore/ops/operations/other_ops.py +7 -4
mindspore/ops/operations/random_ops.py +46 -1
mindspore/ops/primitive.py +18 -6
mindspore/ops_generate/arg_dtype_cast.py +2 -0
mindspore/ops_generate/gen_aclnn_implement.py +11 -11
mindspore/ops_generate/gen_constants.py +36 -0
mindspore/ops_generate/gen_ops.py +67 -52
mindspore/ops_generate/gen_ops_inner_prim.py +1 -1
mindspore/ops_generate/gen_pyboost_func.py +131 -47
mindspore/ops_generate/op_proto.py +10 -3
mindspore/ops_generate/pyboost_utils.py +14 -1
mindspore/ops_generate/template.py +43 -21
mindspore/parallel/__init__.py +3 -1
mindspore/parallel/_auto_parallel_context.py +28 -8
mindspore/parallel/_cell_wrapper.py +83 -0
mindspore/parallel/_parallel_serialization.py +47 -19
mindspore/parallel/_tensor.py +81 -11
mindspore/parallel/_utils.py +13 -1
mindspore/parallel/algo_parameter_config.py +5 -5
mindspore/parallel/checkpoint_transform.py +46 -39
mindspore/parallel/cluster/process_entity/__init__.py +1 -1
mindspore/parallel/cluster/process_entity/_api.py +31 -23
mindspore/parallel/cluster/process_entity/_utils.py +2 -27
mindspore/parallel/parameter_broadcast.py +3 -4
mindspore/parallel/shard.py +162 -31
mindspore/parallel/transform_safetensors.py +993 -0
mindspore/pgodb140.dll +0 -0
mindspore/pgort140.dll +0 -0
mindspore/profiler/__init__.py +2 -1
mindspore/profiler/common/constant.py +29 -0
mindspore/profiler/common/registry.py +47 -0
mindspore/profiler/common/util.py +28 -0
mindspore/profiler/dynamic_profiler.py +694 -0
mindspore/profiler/envprofiling.py +17 -19
mindspore/profiler/parser/ascend_analysis/constant.py +18 -0
mindspore/profiler/parser/ascend_analysis/file_manager.py +25 -4
mindspore/profiler/parser/ascend_analysis/function_event.py +43 -19
mindspore/profiler/parser/ascend_analysis/fwk_cann_parser.py +31 -26
mindspore/profiler/parser/ascend_analysis/fwk_file_parser.py +56 -10
mindspore/profiler/parser/ascend_analysis/msprof_timeline_parser.py +55 -8
mindspore/profiler/parser/ascend_analysis/path_manager.py +313 -0
mindspore/profiler/parser/ascend_analysis/profiler_info_parser.py +27 -20
mindspore/profiler/parser/ascend_analysis/trace_event_manager.py +9 -2
mindspore/profiler/parser/ascend_msprof_exporter.py +5 -4
mindspore/profiler/parser/ascend_timeline_generator.py +27 -25
mindspore/profiler/parser/base_timeline_generator.py +19 -25
mindspore/profiler/parser/cpu_gpu_timeline_generator.py +25 -12
mindspore/profiler/parser/framework_parser.py +1 -391
mindspore/profiler/parser/gpu_analysis/__init__.py +14 -0
mindspore/profiler/parser/gpu_analysis/function_event.py +44 -0
mindspore/profiler/parser/gpu_analysis/fwk_file_parser.py +89 -0
mindspore/profiler/parser/gpu_analysis/profiler_info_parser.py +72 -0
mindspore/profiler/parser/memory_usage_parser.py +0 -154
mindspore/profiler/parser/profiler_info.py +78 -6
mindspore/profiler/profiler.py +153 -0
mindspore/profiler/profiling.py +280 -412
mindspore/rewrite/__init__.py +1 -2
mindspore/rewrite/common/namespace.py +4 -4
mindspore/rewrite/symbol_tree/symbol_tree.py +3 -3
mindspore/run_check/_check_version.py +36 -103
mindspore/safeguard/rewrite_obfuscation.py +591 -247
mindspore/swresample-4.dll +0 -0
mindspore/swscale-6.dll +0 -0
mindspore/tbbmalloc.dll +0 -0
mindspore/tinyxml2.dll +0 -0
mindspore/train/__init__.py +4 -3
mindspore/train/_utils.py +28 -2
mindspore/train/amp.py +171 -53
mindspore/train/callback/__init__.py +2 -2
mindspore/train/callback/_callback.py +4 -4
mindspore/train/callback/_checkpoint.py +85 -22
mindspore/train/callback/_cluster_monitor.py +1 -1
mindspore/train/callback/_flops_collector.py +1 -0
mindspore/train/callback/_loss_monitor.py +3 -3
mindspore/train/callback/_on_request_exit.py +134 -31
mindspore/train/callback/_summary_collector.py +5 -5
mindspore/train/callback/_tft_register.py +352 -0
mindspore/train/dataset_helper.py +7 -3
mindspore/train/metrics/metric.py +3 -3
mindspore/train/metrics/roc.py +4 -4
mindspore/train/mind_ir_pb2.py +44 -39
mindspore/train/model.py +134 -58
mindspore/train/serialization.py +336 -112
mindspore/turbojpeg.dll +0 -0
mindspore/utils/__init__.py +21 -0
mindspore/utils/utils.py +60 -0
mindspore/vcmeta.dll +0 -0
mindspore/vcruntime140.dll +0 -0
mindspore/vcruntime140_1.dll +0 -0
mindspore/version.py +1 -1
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/METADATA +6 -2
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/RECORD +281 -275
mindspore/include/c_api/ms/abstract.h +0 -67
mindspore/include/c_api/ms/attribute.h +0 -197
mindspore/include/c_api/ms/base/handle_types.h +0 -43
mindspore/include/c_api/ms/base/macros.h +0 -32
mindspore/include/c_api/ms/base/status.h +0 -33
mindspore/include/c_api/ms/base/types.h +0 -283
mindspore/include/c_api/ms/context.h +0 -102
mindspore/include/c_api/ms/graph.h +0 -160
mindspore/include/c_api/ms/node.h +0 -606
mindspore/include/c_api/ms/tensor.h +0 -161
mindspore/include/c_api/ms/value.h +0 -84
mindspore/mindspore_shared_lib.dll +0 -0
mindspore/nn/extend/basic.py +0 -140
mindspore/nn/extend/embedding.py +0 -143
mindspore/nn/extend/layer/normalization.py +0 -109
mindspore/nn/extend/pooling.py +0 -117
mindspore/nn/layer/embedding_service.py +0 -531
mindspore/ops/_op_impl/aicpu/strided_slice_v2.py +0 -93
mindspore/ops/_op_impl/aicpu/strided_slice_v2_grad.py +0 -66
mindspore/ops/extend/__init__.py +0 -53
mindspore/ops/extend/array_func.py +0 -218
mindspore/ops/extend/math_func.py +0 -76
mindspore/ops/extend/nn_func.py +0 -308
mindspore/ops/silent_check.py +0 -162
mindspore/profiler/parser/msadvisor_analyzer.py +0 -82
mindspore/profiler/parser/msadvisor_parser.py +0 -240
mindspore/train/callback/_mindio_ttp.py +0 -443
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/WHEEL +0 -0
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/entry_points.txt +0 -0
{mindspore-2.3.0.dist-info → mindspore-2.4.0.dist-info}/top_level.txt +0 -0

mindspore/ops/__init__.py CHANGED Viewed

@@ -29,13 +29,14 @@ from mindspore.ops.vm_impl_registry import get_vm_impl_fn, vm_impl_registry
 from mindspore.ops.op_info_register import op_info_register, custom_info_register, AkgGpuRegOp, AkgAscendRegOp, \
     AiCPURegOp, TBERegOp, CpuRegOp, CustomRegOp, DataType
 from mindspore.ops.primitive import constexpr
-from mindspore.ops import composite, operations, functional, function, auto_generate, extend
+from mindspore.ops import composite, operations, functional, function
 from mindspore.ops import signature
+from mindspore.ops.auto_generate import cpp_create_prim_instance_helper, gen_arg_dtype_cast, gen_arg_handler, \
+    gen_extend_func, gen_ops_def, gen_ops_prim, pyboost_inner_prim
 from mindspore.ops.composite import *
 from mindspore.ops.operations import *
 from mindspore.ops.function import *
 from mindspore.ops.functional import *
-from mindspore.ops.silent_check import _silent_check
 __primitive__ = [
     "prim_attr_register", "prim_arg_register", "Primitive", "PrimitiveWithInfer", "PrimitiveWithCheck", "signature"
@@ -44,11 +45,12 @@ __primitive__ = [
 __all__ = ["get_vm_impl_fn", "vm_impl_registry",
            "op_info_register", "custom_info_register", "AkgGpuRegOp", "AkgAscendRegOp", "AiCPURegOp", "TBERegOp",
            "CpuRegOp", "CustomRegOp", "DataType",
-           "constexpr", "reshard"]
+           "constexpr", "reshard",
+           "cpp_create_prim_instance_helper", "gen_arg_dtype_cast", "gen_arg_handler", "gen_extend_func", "gen_ops_def",
+           "gen_ops_prim", "pyboost_inner_prim"]
 __all__.extend(__primitive__)
 __all__.extend(composite.__all__)
 __all__.extend(operations.__all__)
 __all__.extend(functional.__all__)
 __all__.extend(function.__all__)
 __all__.extend(auto_generate.__all__)
-_silent_check()

mindspore/ops/_grad_experimental/grad_comm_ops.py CHANGED Viewed

@@ -34,6 +34,7 @@ from mindspore.ops.operations.comm_ops import (AllGather, _MiniStepAllGather, _H
                                                _MicroStepAllGather, Reduce, CollectiveGather, CollectiveScatter)
 from mindspore.ops._grad_experimental.grad_base import bprop_getters
 from mindspore.ops.operations import _grad_ops as G
+import mindspore as ms
 @bprop_getters.register(AllReduce)
@@ -95,6 +96,12 @@ def get_bprop_send(self):
     dtype = self.get_attr_dict()["dtype"]
     tag = self.get_attr_dict()["sr_tag"]
     send_grad = Receive(tag, self.rank, shape, dtype, self.group_back)
+    if "dst_global_rank" in self.get_attr_dict():
+        dst_global_rank = self.get_attr_dict().get("dst_global_rank")
+        send_grad.add_prim_attr("src_global_rank", dst_global_rank)
+    if "RING_ATTENTION_INDEX" in self.get_attr_dict():
+        ringattention = self.get_attr_dict().get("RING_ATTENTION_INDEX")
+        send_grad.add_prim_attr("RING_ATTENTION_INDEX", ringattention)
     virtual_input = Tensor(0.0, dtype)
     def bprop(x, out, dout):
@@ -108,8 +115,16 @@ def get_bprop_send(self):
 def get_bprop_receive(self):
     """Generate bprop for Receive."""
     tag = self.get_attr_dict()["sr_tag"]
+    flash_tag = self.get_attr_dict().get("flash_tag")
     receive_grad = Send(tag, self.rank, self.group_back)
-    receive_grad.add_prim_attr("shape", self.shape)
+    shape = self.get_attr_dict()["shape"]
+    receive_grad.add_prim_attr("shape", shape)
+    if "src_global_rank" in self.get_attr_dict():
+        src_global_rank = self.get_attr_dict().get("src_global_rank")
+        receive_grad.add_prim_attr("dst_global_rank", src_global_rank)
+    if "RING_ATTENTION_INDEX" in self.get_attr_dict():
+        ringattention = self.get_attr_dict().get("RING_ATTENTION_INDEX")
+        receive_grad.add_prim_attr("RING_ATTENTION_INDEX", ringattention)
     depend = P.Depend()
     cast = P.Cast()
     out_tensor = Tensor(0.0, mstype.float16)
@@ -117,7 +132,7 @@ def get_bprop_receive(self):
     def bprop(x, out, dout):
         send_out = receive_grad(dout)
-        if is_opt_shard:
+        if is_opt_shard or (flash_tag == "True"):
             dx = depend(F.zeros_like(x), send_out)
         else:
             dx = depend(cast(out_tensor, F.dtype(x)), send_out)
@@ -186,6 +201,9 @@ def get_bprop_mirror_micro_step_operator(self):
     group = self.group
     dev_num = self.dev_num
     mean_flag = self.mean_flag
+    param_name = " "
+    if 'mirror_user_id' in self.get_attr_dict():
+        param_name = self.get_attr_dict()['mirror_user_id']
     scale = 1 / dev_num
     all_reduce = AllReduce(group=group)
@@ -196,7 +214,6 @@ def get_bprop_mirror_micro_step_operator(self):
     if hasattr(self, 'parameter'):
         parameter = self.parameter
         all_reduce.add_prim_attr("parameter", parameter)
     if self.instance_name:
         instance_name = "grad_mirror" + self.instance_name
         all_reduce.set_prim_instance_name(instance_name)
@@ -207,8 +224,14 @@ def get_bprop_mirror_micro_step_operator(self):
         assign.add_prim_attr("parameter_micro", 0)
     out_tensor = Tensor(1.0, mstype.float16)
     opt_shard = _get_enable_parallel_optimizer()
+    ln_print = P.Print()
+    reduce_sum = P.ReduceSum(keep_dims=False)
+    square = P.Square()
+    dump_local_norm = ms.get_auto_parallel_context("dump_local_norm")
     def bprop(x, z, out, dout):
+        if dump_local_norm:
+            z = F.depend(z, ln_print("dump local norm: ", param_name, reduce_sum(square((z)))))
         real_grad = z
         assign_out = dout
         if issubclass_(F.typeof(dout), mstype.tensor_type):
@@ -309,6 +332,9 @@ def get_bprop_micro_step_all_gather(self):
     """Generate bprop for _MicroStepAllGather"""
     fusion = self.get_attr_dict()["fusion"]
     mean_flag = self.get_attr_dict()["mean_flag"]
+    param_name = " "
+    if 'mirror_user_id' in self.get_attr_dict():
+        param_name = self.get_attr_dict()['mirror_user_id']
     do_mirror = False
     if self.group != "":
         do_mirror = self.get_attr_dict()["do_mirror"]
@@ -324,6 +350,10 @@ def get_bprop_micro_step_all_gather(self):
     dtype = P.DType()
     out_tensor = Tensor(1.0, mstype.float16)
     with_mirror_operator = self.get_attr_dict()["with_mirror_operator"]
+    ln_print = P.Print()
+    reduce_sum = P.ReduceSum(keep_dims=False)
+    square = P.Square()
+    dump_local_norm = ms.get_auto_parallel_context("dump_local_norm")
     def bprop(x, z, out, dout):
         if with_mirror_operator:
@@ -334,6 +364,8 @@ def get_bprop_micro_step_all_gather(self):
                 real_grad = F.tensor_mul(real_grad, scale)
             return (real_grad, cast(out_tensor, dtype(z)))
         z = F.depend(z, dout)
+        if dump_local_norm:
+            z = F.depend(z, ln_print("dump local norm: ", param_name, reduce_sum(square((z)))))
         if not do_mirror:
             return (z, cast(out_tensor, dtype(z)))
         real_grad = reduce_scatter(z)
@@ -529,16 +561,25 @@ def get_bprop_mirror_operator(self):
     group = self.get_attr_dict()['group']
     dev_num = self.get_attr_dict()['dev_num']
     mean_flag = self.get_attr_dict()['mean_flag']
+    param_name = " "
+    if 'mirror_user_id' in self.get_attr_dict():
+        param_name = self.get_attr_dict()['mirror_user_id']
     dev_num_r = 1.0
+    dump_local_norm = ms.get_auto_parallel_context("dump_local_norm")
     if dev_num > 1:
         dev_num_r = 1.0 / dev_num
         all_reduce = AllReduce(group=group)
         all_gather = AllGather(group=group)
         mul = P.Mul()
         cast = P.Cast()
+        ln_print = P.Print()
+        reduce_sum = P.ReduceSum(keep_dims=False)
+        square = P.Square()
         fusion = self.get_attr_dict()["fusion"]
         all_reduce.add_prim_attr("fusion", fusion)
+        parameter = " "
         if hasattr(self, 'parameter'):
             parameter = self.parameter
             all_reduce.add_prim_attr("parameter", parameter)
@@ -548,6 +589,9 @@ def get_bprop_mirror_operator(self):
             all_reduce.set_prim_instance_name(instance_name)
     def bprop(x, out, dout):
+        if dump_local_norm:
+            dout = F.depend(dout, ln_print("dump local norm: ", param_name, reduce_sum(square((dout)))))
         if dev_num == 1:
             return (dout,)
         if mean_flag:

mindspore/ops/_grad_experimental/grad_math_ops.py CHANGED Viewed

@@ -18,12 +18,9 @@
 import numpy as np
 import mindspore.numpy as mnp
 from mindspore.common import dtype as mstype
-import mindspore.ops as ops
 from mindspore.ops import functional as F
 from mindspore.ops import operations as P
 from mindspore import Tensor
-from mindspore.ops.operations.math_ops import SilentCheck
-from mindspore.ops.operations._inner_ops import _MirrorSilentCheck
 from mindspore.ops.operations.math_ops import CumulativeLogsumexp
 from mindspore.ops.operations.math_ops import MatrixSolve
 from mindspore.ops.operations.math_ops import MatrixSolveLs
@@ -803,22 +800,3 @@ def get_bprop_tensor_add(self):
         return binop_grad_common(x, y, dout, dout)
     return bprop
-@bprop_getters.register(_MirrorSilentCheck)
-def get_bprop_mirror_silent_check(self):
-    """Grad definition for '_MirrorSilentCheck' op"""
-    silent_check = SilentCheck(self.min_steps, self.thresh_l1, self.coeff_l1, self.thresh_l2, self.coeff_l2)
-    out_tensor = Tensor([0.0], mstype.float32)
-    def bporp(x, pre_val, min_val, max_val, n_step, loss_scale, out, dout):
-        if dout.dtype == mstype.float16:
-            return (dout, out_tensor, out_tensor, out_tensor, out_tensor, out_tensor)
-        if loss_scale is not None:
-            gnorm = ops.norm(dout / loss_scale)
-        else:
-            gnorm = ops.norm(dout)
-        dx, _, _, _, _ = silent_check(gnorm, dout, pre_val, min_val, max_val, n_step)
-        return (dx, out_tensor, out_tensor, out_tensor, out_tensor, out_tensor)
-    return bporp

mindspore/ops/_vmap/vmap_array_ops.py CHANGED Viewed

@@ -2113,6 +2113,7 @@ def get_split_vmap_rule(prim, axis_size):
     return vmap_rule
 @vmap_rules_getters.register(P.SearchSorted)
 def get_searchsorted_vmap_rule(prim, axis_size):
     """VmapRule for `SearchSorted`."""
@@ -2131,10 +2132,7 @@ def get_searchsorted_vmap_rule(prim, axis_size):
         if sorter is not None and sorter_dim is not None:
             sorter = _bdim_at_front(sorter, sorter_dim, axis_size)
-        dtype, _ = dtype_bdim
-        right, _ = right_bdim
-        outputs = prim(sequence, values, sorter, dtype, right)
+        outputs = prim(sequence, values, sorter, dtype_bdim[0], right_bdim[0])
         return outputs, 0

mindspore/ops/_vmap/vmap_math_ops.py CHANGED Viewed

@@ -916,6 +916,23 @@ def get_isclose_vmap_rule(prim, axis_size):
     return vmap_rule
+@vmap_rules_getters.register(P.Round)
+def get_round_vmap_rule(prim, axis_size):
+    """VmapRule for round."""
+    if isinstance(prim, str):
+        prim = Primitive(prim)
+    def vmap_rule(x_bdim, decimal_bdim):
+        var, x_dim = x_bdim
+        decimal_var, decimal_dim = decimal_bdim
+        if decimal_dim is not None:
+            _raise_value_error("For vmap, the batch axis of decimal must be none.")
+        out = prim(var, decimal_var)
+        return out, x_dim
+    return vmap_rule
 get_assign_vmap_rule = vmap_rules_getters.register(P.AssignAdd)(get_assign_vmap_rule)
 get_assign_vmap_rule = vmap_rules_getters.register(P.AssignSub)(get_assign_vmap_rule)
@@ -949,7 +966,6 @@ get_unop_vmap_rule = vmap_rules_getters.register(P.Reciprocal)(get_unop_vmap_rul
 get_unop_vmap_rule = vmap_rules_getters.register(P.Inv)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Invert)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Rint)(get_unop_vmap_rule)
-get_unop_vmap_rule = vmap_rules_getters.register(P.Round)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Rsqrt)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register("Sigmoid")(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Sqrt)(get_unop_vmap_rule)

mindspore/ops/_vmap/vmap_nn_ops.py CHANGED Viewed

@@ -517,7 +517,6 @@ def get_in_top_k_vmap_rule(prim, axis_size):
 @vmap_rules_getters.register(G.FastGeLUGrad)
 @vmap_rules_getters.register(G.HSwishGrad)
-@vmap_rules_getters.register(G.SoftShrinkGrad)
 def get_common_activation_grad_vmap_rule(prim, axis_size):
     """VmapRule for common activation grad operation."""
     prim_name = prim.name
@@ -547,6 +546,49 @@ def get_common_activation_grad_vmap_rule(prim, axis_size):
     return vmap_rule
+@vmap_rules_getters.register("SoftShrink")
+def get_softshrink_vmap_rule(prim, axis_size):
+    """VmapRule for `SoftShrink`."""
+    def vmap_rule(x_bdim, lambd_bdim):
+        var, dim = x_bdim
+        lambd, _ = lambd_bdim
+        out = prim(var, lambd)
+        return out, dim
+    return vmap_rule
+@vmap_rules_getters.register("SoftShrinkGrad")
+def get_softshrink_grad_vmap_rule(prim, axis_size):
+    """VmapRule for `SoftShrinkGrad`."""
+    prim_name = prim.name
+    def vmap_rule(dy_bdim, x_bdim, lambd_bdim):
+        x, x_dim = x_bdim
+        lambd, _ = lambd_bdim
+        dy, dy_dim = dy_bdim
+        x_shape = F.shape(x)
+        dy_shape = F.shape(dy)
+        if x_dim == dy_dim and x_shape == dy_shape:
+            out = prim(dy, x, lambd)
+            return out, x_dim
+        if F.rank(x):
+            x = _bdim_at_front(x, x_dim, 1)
+        if F.rank(dy):
+            dy = _bdim_at_front(dy, dy_dim, 1)
+        x_shape = F.shape(x)
+        dy_shape = F.shape(dy)
+        if x_shape != dy_shape:
+            raise RuntimeError("For {} vmap, input x shape is supposed to be the same as input dy shape "
+                               "after batch transforming, but got x_shape {}, dy_shape {}"
+                               .format(prim_name, x_shape, dy_shape))
+        out = prim(dy, x, lambd)
+        return out, 0
+    return vmap_rule
 @vmap_rules_getters.register("HShrink")
 def get_hshrink_vmap_rule(prim, axis_size):
     """VmapRule for `HShrink`."""
@@ -2196,7 +2238,6 @@ get_unop_vmap_rule = vmap_rules_getters.register(P.SeLU)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.HSigmoid)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Softplus)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.Softsign)(get_unop_vmap_rule)
-get_unop_vmap_rule = vmap_rules_getters.register(P.SoftShrink)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.GeLU)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.FastGeLU)(get_unop_vmap_rule)
 get_unop_vmap_rule = vmap_rules_getters.register(P.HSwish)(get_unop_vmap_rule)

mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py CHANGED Viewed

@@ -21,6 +21,7 @@ op_args_default_value = {
     "AdamW": {"amsgrad": False, "maximize": False},
     "AddExt": {"alpha": 1},
     "AddLayerNormV2": {"epsilon": 1e-5, "additionalOut": False},
+    "ApplyAdamW": {"max_grad_norm": None, "amsgrad": False, "maximize": False},
     "ApplyCamePart2": {"sum_r": None, "global_shape": None},
     "ApplyCamePart3": {"global_shape": None, "use_first_moment": False},
     "ApplyCamePart4": {"global_shape": None},
@@ -29,6 +30,7 @@ op_args_default_value = {
     "ArgMaxExt": {"dim": None, "keepdim": False},
     "Argmax": {"axis": -1, "output_type": mstype.int32},
     "ArgMaxWithValue": {"axis": 0, "keep_dims": False},
+    "ArgMinExt": {"dim": None, "keepdim": False},
     "Argmin": {"axis": -1, "output_type": mstype.int32},
     "ArgMinWithValue": {"axis": 0, "keep_dims": False},
     "AvgPool2DGrad": {"padding": 0, "ceil_mode": False, "count_include_pad": True, "divisor_override": None},
@@ -36,8 +38,8 @@ op_args_default_value = {
     "AvgPoolGrad": {"kernel_size": 1, "strides": 1, "pad_mode": 'VALID', "data_format": 'NCHW'},
     "AvgPool": {"kernel_size": 1, "strides": 1, "pad_mode": 'VALID', "data_format": 'NCHW'},
     "BatchMatMul": {"transpose_a": False, "transpose_b": False},
-    "BatchNormExt": {"training": False, "momentum": 0.1, "epsilon": 1e-5},
-    "BatchNormGradExt": {"training": False, "eps": 1e-5},
+    "BatchNormExt": {"running_mean": None, "runnning_var": None, "training": False, "momentum": 0.1, "epsilon": 1e-5},
+    "BatchNormGradExt": {"running_mean": None, "running_var": None, "saved_mean": None, "saved_rstd": None, "training": False, "eps": 1e-5},
     "BatchNormGradGrad": {"is_training": False, "epsilon": 1e-5, "data_format": 'NCHW'},
     "BatchNormGrad": {"is_training": False, "epsilon": 1e-5, "data_format": 'NCHW'},
     "BatchNormGradWithActivation": {"is_training": False, "epsilon": 1e-5, "data_format": 'NCHW'},
@@ -63,10 +65,12 @@ op_args_default_value = {
     "ConvolutionGrad": {"bias": None, "stride": 1, "padding": 0, "dilation": 1, "transposed": False, "output_padding": 0, "groups": 1, "output_mask": ()},
     "Convolution": {"bias": None, "stride": 1, "padding": 0, "dilation": 1, "transposed": False, "output_padding": 0, "groups": 1},
     "Correlate": {"mode": 'valid'},
+    "Cross": {"dim": -65530},
     "CumProd": {"exclusive": False, "reverse": False},
     "CumSum": {"exclusive": False, "reverse": False},
     "CumsumExt": {"dtype": None},
-    "DCT": {"axis": -1, "norm": 'BACKWARD', "forward": True, "grad": False},
+    "DCT": {"type": 2, "n": None, "axis": -1, "norm": None},
+    "DCTN": {"type": 2, "s": None, "axes": None, "norm": None},
     "Dense": {"bias": None},
     "Diagonal": {"offset": 0, "dim1": 0, "dim2": 1},
     "DivMod": {"rounding_mode": None},
@@ -75,13 +79,25 @@ op_args_default_value = {
     "EluExt": {"alpha": 1.0},
     "EluGradExt": {"alpha": 1.0},
     "Elu": {"alpha": 1.0},
+    "EmbeddingApplyAdaGrad": {"mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
+    "EmbeddingApplyAdam": {"mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
+    "EmbeddingApplyAdamW": {"ams_grad": (0,), "mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
+    "EmbeddingApplyFtrl": {"mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
+    "EmbeddingApplyRmsprop": {"mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
+    "EmbeddingApplySgd": {"mask_zero": (0,), "padding_key": (0,), "padding_key_mask": (1,), "completion_key": (0,), "completion_key_mask": (1,), "_embedding_dim": 1, "_max_key_num": 1},
     "EmbeddingDenseBackward": {"padding_idx": None, "scale_grad_by_freq": False},
+    "EmbeddingFeatureMappingFileSize": {"only_offset_flag": True},
+    "EmbeddingFeatureMappingFind": {"num": 1},
+    "EmbeddingFeatureMappingImport": {"only_offset_flag": True, "num": 1},
     "Embedding": {"padding_idx": None, "max_norm": None, "norm_type": 2.0, "scale_grad_by_freq": False},
+    "EmbeddingTableEvict": {"steps_to_live": 0},
     "ExtractImagePatches": {"padding": 'VALID'},
     "FFNExt": {"expertTokens": None, "bias1": None, "bias2": None, "scale": None, "offset": None, "deqScale1": None, "deqScale2": None, "antiquant_scale1": None, "antiquant_scale2": None, "antiquant_offset1": None, "antiquant_offset2": None, "activation": 'fastgelu', "inner_precise": 0},
     "FFT2": {"s": None, "dim": (-2, -1), "norm": None},
     "FFT": {"n": None, "dim": -1, "norm": None},
+    "FFTOrtho": {"axes": None, "forward": True},
     "FFTWithSize": {"norm": 'backward', "onesided": True, "signal_sizes": ()},
+    "FFTFreq": {"d": 1.0, "dtype": None},
     "FFTN": {"s": None, "dim": None, "norm": None},
     "FFTShift": {"dim": None},
     "FillScalar": {"dtype": None},
@@ -90,23 +106,42 @@ op_args_default_value = {
     "FlashAttentionScore": {"real_shift": None, "drop_mask": None, "padding_mask": None, "attn_mask": None, "prefix": None, "actual_seq_qlen": None, "actual_seq_kvlen": None, "keep_prob": 1.0, "scale_value": 1.0, "pre_tokens": 2147483647, "next_tokens": 2147483647, "inner_precise": 0, "input_layout": 'BSH', "sparse_mode": 0},
     "FlattenExt": {"start_dim": 0, "end_dim": -1},
     "Gather": {"batch_dims": 0},
+    "GenerateEodMaskV2": {"start": 0, "steps": 1, "error_mode": 'cycle', "flip_mode": 'bitflip', "multiply_factor": 0.0, "bit_pos": 0, "flip_probability": 0.0},
     "GridSampler2DGrad": {"interpolation_mode": 'bilinear', "padding_mode": 'zeros', "align_corners": False},
     "GridSampler2D": {"interpolation_mode": 'bilinear', "padding_mode": 'zeros', "align_corners": False},
     "GridSampler3DGrad": {"interpolation_mode": 'bilinear', "padding_mode": 'zeros', "align_corners": False},
     "GridSampler3D": {"interpolation_mode": 'bilinear', "padding_mode": 'zeros', "align_corners": False},
     "GroupNormGrad": {"dx_is_require": True, "dgamma_is_require": True, "dbeta_is_require": True},
     "GroupNorm": {"weight": None, "bias": None, "eps": 1e-5},
+    "HFFT2": {"s": None, "dim": (-2, -1), "norm": None},
+    "HFFT": {"n": None, "dim": -1, "norm": None},
+    "HFFTN": {"s": None, "dim": None, "norm": None},
+    "HistcExt": {"bins": 100, "min": 0, "max": 0},
     "HShrinkGrad": {"lambd": 0.5},
     "HShrink": {"lambd": 0.5},
+    "IDCT": {"type": 2, "n": None, "axis": -1, "norm": None},
+    "IDCTN": {"type": 2, "s": None, "axes": None, "norm": None},
     "IFFT2": {"s": None, "dim": (-2, -1), "norm": None},
     "IFFT": {"n": None, "dim": -1, "norm": None},
     "IFFTN": {"s": None, "dim": None, "norm": None},
     "IFFTShift": {"dim": None},
+    "IHFFT2": {"s": None, "dim": (-2, -1), "norm": None},
+    "IHFFT": {"n": None, "dim": -1, "norm": None},
+    "IHFFTN": {"s": None, "dim": None, "norm": None},
     "Im2ColExt": {"dilation": 1, "padding": 0, "stride": 1},
+    "IncreFlashAttention": {"attn_mask": None, "actual_seq_lengths": None, "pse_shift": None, "dequant_scale1": None, "quant_scale1": None, "dequant_scale2": None, "quant_scale2": None, "quant_offset2": None, "antiquant_scale": None, "antiquant_offset": None, "block_table": None, "kv_padding_size": None, "num_heads": 1, "input_layout": 'BSH', "scale_value": 1.0, "num_key_value_heads": 0, "block_size": 0, "inner_precise": 1},
     "IndexAddExt": {"alpha": 1},
-    "IRFFTGrad": {"n": None, "dim": -1, "norm": None},
+    "InplaceAddExt": {"alpha": 1},
+    "InplaceAddmm": {"beta": 1, "alpha": 1},
+    "InplaceAddsExt": {"alpha": 1},
+    "InsertGemV2InBackward": {"start": 0, "steps": 1, "error_mode": 'cycle', "flip_mode": 'bitflip', "multiply_factor": 0.0, "bit_pos": 0, "flip_probability": 0.0},
+    "IRFFT2": {"s": None, "dim": (-2, -1), "norm": None},
+    "IRFFTDouble": {"dim": -1},
     "IRFFT": {"n": None, "dim": -1, "norm": None},
+    "IRFFTN": {"s": None, "dim": None, "norm": None},
     "IsClose": {"rtol": 1e-05, "atol": 1e-08, "equal_nan": True},
+    "L1LossBackwardExt": {"reduction": 'mean'},
+    "L1LossExt": {"reduction": 'mean'},
     "LayerNormExt": {"weight": None, "bias": None, "eps": 1e-5},
     "LayerNormGradGrad": {"begin_norm_axis": 1, "begin_params_axis": 1},
     "LayerNormGrad": {"begin_norm_axis": 1, "begin_params_axis": 1},
@@ -116,10 +151,13 @@ op_args_default_value = {
     "LeakyReLUExt": {"negative_slope": 0.01},
     "LeakyReLUGradExt": {"negative_slope": 0.01, "is_result": False},
     "LinSpaceExt": {"dtype": None},
+    "LogSoftmaxExt": {"dim": None, "dtype": None},
     "LogSoftmaxGrad": {"axis": -1},
     "LogSoftmax": {"axis": -1},
     "LogitGrad": {"eps": -1.0},
     "Logit": {"eps": -1.0},
+    "LpNormV2": {"p": 2.0, "dim": None, "keepdim": False, "epsilon": 1e-12},
+    "LstsqV2": {"driver": None},
     "MatMul": {"transpose_a": False, "transpose_b": False},
     "MaxPoolGradWithIndices": {"strides": None, "pads": 0, "dilation": (1, 1), "ceil_mode": False, "argmax_type": mstype.int64},
     "MaxPoolGradWithMask": {"strides": None, "pads": 0, "dilation": (1, 1), "ceil_mode": False, "argmax_type": mstype.int64},
@@ -128,15 +166,20 @@ op_args_default_value = {
     "MaximumGradGrad": {"grad_x": True, "grad_y": True},
     "MaximumGrad": {"grad_x": True, "grad_y": True},
     "MeanExt": {"axis": None, "keep_dims": False, "dtype": None},
+    "MedianDim": {"dim": -1, "keepdim": False},
     "MinimumGrad": {"grad_x": True, "grad_y": True},
+    "MSELossExt": {"reduction": 'mean'},
+    "MSELossGradExt": {"reduction": 'mean'},
     "NanToNum": {"nan": None, "posinf": None, "neginf": None},
     "NLLLossGrad": {"reduction": 'mean', "ignore_index": -100},
     "NLLLoss": {"reduction": 'mean', "ignore_index": -100},
-    "Norm": {"ord": None, "dim": None, "keepdim": False, "dtype": None},
+    "Norm": {"p": 2.0, "dim": None, "keepdim": False, "dtype": None},
     "OneHotExt": {"axis": -1},
     "OneHot": {"axis": -1},
     "OnesLikeExt": {"dtype": None},
     "Ones": {"dtype": None},
+    "PagedAttentionMask": {"antiquant_scale": None, "antiquant_offset": None, "alibi_mask": None, "kv_cache_quant_mode": 'DEFAULT'},
+    "PagedAttention": {"antiquant_scale": None, "antiquant_offset": None, "attn_mask": None, "q_seq_lens": None, "kv_cache_quant_mode": 'DEFAULT'},
     "ProdExt": {"axis": None, "keep_dims": False, "dtype": None},
     "PromptKVCache": {"align_mode": 'LEFT'},
     "Qr": {"full_matrices": False},
@@ -165,16 +208,27 @@ op_args_default_value = {
     "ResizeNearestNeighbor": {"align_corners": False, "half_pixel_centers": False},
     "ResizeNearestNeighborV2Grad": {"align_corners": False, "half_pixel_centers": False},
     "ResizeNearestNeighborV2": {"align_corners": False, "half_pixel_centers": False},
-    "RFFTGrad": {"n": None, "dim": -1, "norm": None},
+    "RFFT2": {"s": None, "dim": (-2, -1), "norm": None},
     "RFFT": {"n": None, "dim": -1, "norm": None},
+    "RFFTFreq": {"d": 1.0, "dtype": None},
+    "RFFTN": {"s": None, "dim": None, "norm": None},
     "RmsNorm": {"epsilon": 1e-6},
+    "Roll": {"axis": None},
+    "RotaryPositionEmbeddingGrad": {"dx": None, "mode": 0},
+    "RotaryPositionEmbedding": {"mode": 0},
+    "Round": {"decimals": 0},
     "ScalarToTensor": {"dtype": None},
+    "Scatter": {"reduce": 'none'},
+    "ScatterValue": {"reduce": 'none'},
     "SearchSorted": {"sorter": None, "dtype": mstype.int64, "right": False},
     "SequenceConcat": {"axis": 0},
+    "SilentCheckV2": {"c_min_steps": 7, "c_thresh_l1": 1000000.0, "c_coeff_l1": 100000.0, "c_thresh_l2": 10000.0, "c_coeff_l2": 5000.0, "npu_asd_detect": 1},
     "SoftmaxBackward": {"dim": -1},
     "Softmax": {"axis": -1},
     "SoftplusExt": {"beta": 1, "threshold": 20},
     "SoftplusGradExt": {"beta": 1, "threshold": 20},
+    "SoftShrinkGrad": {"lambd": 0.5},
+    "SoftShrink": {"lambd": 0.5},
     "SolveTriangular": {"trans": 0, "lower": False, "unit_diagonal": False},
     "SortExt": {"dim": -1, "descending": False, "stable": False},
     "Split": {"axis": 0, "output_num": 1},
@@ -184,11 +238,20 @@ op_args_default_value = {
     "StridedSlice": {"begin_mask": 0, "end_mask": 0, "ellipsis_mask": 0, "new_axis_mask": 0, "shrink_axis_mask": 0},
     "SubExt": {"alpha": 1},
     "SumExt": {"dim": None, "keepdim": False, "dtype": None},
+    "SwigluGrad": {"dim": -1},
+    "Swiglu": {"dim": -1},
+    "TensorScatterElements": {"axis": 0, "reduce": 'none'},
     "TopkExt": {"dim": -1, "largest": True, "sorted": True},
+    "TopKRouter": {"drop_type": 0},
+    "TraceV2Grad": {"offset": 0, "axis1": 1, "axis2": 0},
+    "TraceV2": {"offset": 0, "axis1": 1, "axis2": 0, "dtype": None},
+    "TrilExt": {"diagonal": 0},
     "Triu": {"diagonal": 0},
     "TupleToTensor": {"dtype": None},
     "Unique2": {"sorted": True, "return_inverse": False, "return_counts": False},
     "UnstackExt": {"axis": 0},
+    "UpsampleBicubic2DGrad": {"output_size": None, "scales": None, "align_corners": False},
+    "UpsampleBicubic2D": {"output_size": None, "scales": None, "align_corners": False},
     "UpsampleBilinear2DGrad": {"output_size": None, "scales": None, "align_corners": False},
     "UpsampleBilinear2D": {"output_size": None, "scales": None, "align_corners": False},
     "UpsampleLinear1DGrad": {"output_size": None, "scales": None, "align_corners": False},
@@ -203,12 +266,13 @@ op_args_default_value = {
     "UpsampleTrilinear3D": {"output_size": None, "scales": None, "align_corners": False},
     "ZerosLikeExt": {"dtype": None},
     "Zeros": {"dtype": None},
+    "AddRmsNormQuantV2": {"epsilon": 1e-5},
     "DynamicQuantExt": {"smooth_scales": None},
     "FusedInferAttentionScore": {"pse_shift": None, "attn_mask": None, "actual_seq_lengths": None, "actual_seq_lengths_kv": None, "dequant_scale1": None, "quant_scale1": None, "dequant_scale2": None, "quant_scale2": None, "quant_offset2": None, "antiquant_scale": None, "antiquant_offset": None, "block_table": None, "query_padding_size": None, "kv_padding_size": None, "scale_value": 1.0, "pre_tokens": 2147483647, "next_tokens": 2147483647, "input_layout": 'BSH', "num_key_value_heads": 0, "sparse_mode": 0, "inner_precise": 1, "block_size": 0, "antiquant_mode": 0, "softmax_lse_flag": False},
     "GroupedMatmul": {"bias": None, "scale": None, "offset": None, "antiquant_scale": None, "antiquant_offset": None, "group_list": None, "split_item": 0, "group_type": -1},
     "KVCacheScatterUpdate": {"reduce": 'none'},
     "MoeFinalizeRouting": {"x2": None, "bias": None, "scales": None, "expanded_row_idx": None, "expanded_expert_idx": None},
-    "QuantBatchMatmul": {"offset": None, "bias": None, "transpose_x1": False, "transpose_x2": False, "dtype": mstype.float16},
+    "QuantBatchMatmul": {"offset": None, "bias": None, "pertokenScaleOptional": None, "transpose_x1": False, "transpose_x2": False, "dtype": mstype.float16},
     "QuantV2": {"sqrt_mode": False, "rounding_mode": 'ROUND', "dst_type": mstype.int8},
     "WeightQuantBatchMatmul": {"antiquant_offset": None, "quant_scale": None, "quant_offset": None, "bias": None, "transpose_x": False, "transpose_weight": False, "antiquant_group_size": 0},
 }
@@ -216,16 +280,30 @@ op_args_default_value = {
 op_labels = {
     "AdamWeightDecay": {"side_effect_mem": True},
     "AdamW": {"side_effect_mem": True},
+    "ApplyAdamW": {"side_effect_mem": True},
     "AssignAdd": {"side_effect_mem": True},
     "Assign": {"side_effect_mem": True},
+    "CopyExt": {"side_effect_mem": True},
     "DecoderKVCache": {"side_effect_mem": True},
     "DropoutExt": {"side_effect_hidden": True},
     "DropoutGenMaskExt": {"side_effect_hidden": True},
     "Dropout": {"side_effect_hidden": True},
+    "EmbeddingApplyAdaGrad": {"_process_node_engine_id": 'PS'},
+    "EmbeddingApplyAdam": {"_process_node_engine_id": 'PS'},
+    "EmbeddingApplyAdamW": {"_process_node_engine_id": 'PS'},
+    "EmbeddingApplyFtrl": {"_process_node_engine_id": 'PS'},
+    "EmbeddingApplyRmsprop": {"_process_node_engine_id": 'PS'},
+    "EmbeddingApplySgd": {"_process_node_engine_id": 'PS'},
     "Embedding": {"side_effect_mem": True},
+    "EmbeddingTableEvict": {"_process_node_engine_id": 'PS'},
     "Generator": {"side_effect_mem": True},
+    "InplaceAddExt": {"side_effect_mem": True},
+    "InplaceAddmm": {"side_effect_mem": True},
+    "InplaceAddsExt": {"side_effect_mem": True},
     "Log": {"cust_aicpu": 'Log', "base": -1.0, "scale": 1.0, "shift": 0.0},
     "PromptKVCache": {"side_effect_mem": True},
     "ReshapeAndCache": {"side_effect_mem": True},
     "ResizeD": {"mode": 'linear'},
+    "SilentCheckV2": {"side_effect_mem": True},
+    "KVCacheScatterUpdate": {"side_effect_mem": True},
 }

mindspore/ops/auto_generate/gen_arg_dtype_cast.py CHANGED Viewed

@@ -238,6 +238,8 @@ def type_it(op_name, arg_name, data, src_type, dst_type):
     """
     cast operator argument data type.
     """
+    if isinstance(data, type(None)):
+        return data
     if not isinstance(src_type, tuple):
         src_type = int(src_type)
     else: