PyPI - mindspore - Versions diffs - 2.0.0rc1__cp38-cp38-manylinux1_x86_64.whl → 2.2.0__cp38-cp38-manylinux1_x86_64.whl - Mend

mindspore 2.0.0rc1__cp38-cp38-manylinux1_x86_64.whl → 2.2.0__cp38-cp38-manylinux1_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (884) hide show

mindspore/.commit_id +1 -1
mindspore/Third_Party_Open_Source_Software_Notice +2 -2
mindspore/__init__.py +5 -2
mindspore/_akg/akg/build_module.py +5 -6
mindspore/_akg/akg/composite/build_module.py +49 -16
mindspore/_akg/akg/composite/split_stitch.py +10 -11
mindspore/_akg/akg/config/repository.json +195 -0
mindspore/_akg/akg/global_configs.py +5 -1
mindspore/_akg/akg/ms/info_version_adapt.py +67 -1
mindspore/_akg/akg/tvm/api.py +4 -3
mindspore/_akg/akg/tvm/autotvm/__init__.py +1 -2
mindspore/_akg/akg/tvm/autotvm/graph_tuner/base_graph_tuner.py +1 -5
mindspore/_akg/akg/tvm/autotvm/measure/__init__.py +1 -1
mindspore/_akg/akg/tvm/autotvm/measure/measure.py +1 -10
mindspore/_akg/akg/tvm/autotvm/measure/measure_methods.py +1 -372
mindspore/_akg/akg/tvm/build_module.py +16 -1
mindspore/_akg/akg/tvm/contrib/graph_runtime.py +0 -53
mindspore/_akg/akg/tvm/hybrid/parser.py +7 -6
mindspore/_akg/akg/tvm/ir_builder.py +1 -1
mindspore/_akg/akg/tvm/module.py +1 -2
mindspore/_akg/akg/tvm/stmt.py +2 -2
mindspore/_akg/akg/utils/composite_op_helper.py +9 -10
mindspore/_akg/akg/utils/kernel_exec.py +58 -260
mindspore/_akg/akg/utils/op_dsl.py +17 -1
mindspore/_akg/akg/utils/result_analysis.py +4 -24
mindspore/_akg/akg/utils/tbe_codegen_utils.py +198 -0
mindspore/_c_dataengine.cpython-38-x86_64-linux-gnu.so +0 -0
mindspore/_c_expression.cpython-38-x86_64-linux-gnu.so +0 -0
mindspore/_c_mindrecord.cpython-38-x86_64-linux-gnu.so +0 -0
mindspore/_check_jit_forbidden_api.py +5 -1
mindspore/_checkparam.py +79 -62
mindspore/_extends/graph_kernel/__init__.py +0 -1
mindspore/_extends/graph_kernel/model/graph_split.py +2 -0
mindspore/_extends/graph_kernel/model/model_builder.py +9 -50
mindspore/_extends/graph_kernel/splitter.py +1 -9
mindspore/_extends/parallel_compile/akg_compiler/akg_process.py +128 -21
mindspore/_extends/parallel_compile/akg_compiler/build_tbe_kernel.py +2 -2
mindspore/_extends/parallel_compile/akg_compiler/tbe_topi.py +4 -2
mindspore/_extends/parallel_compile/tbe_compiler/tbe_adapter.py +18 -13
mindspore/_extends/parallel_compile/tbe_compiler/tbe_helper.py +13 -9
mindspore/_extends/parallel_compile/tbe_compiler/tbe_job.py +1 -1
mindspore/_extends/parallel_compile/tbe_compiler/tbe_job_manager.py +1 -1
mindspore/_extends/parse/__init__.py +19 -17
mindspore/_extends/parse/namespace.py +7 -36
mindspore/_extends/parse/parser.py +375 -189
mindspore/_extends/parse/resources.py +36 -41
mindspore/_extends/parse/standard_method.py +350 -245
mindspore/_extends/parse/trope.py +2 -12
mindspore/_extends/remote/kernel_build_server.py +24 -7
mindspore/_extends/remote/kernel_build_server_akg_v2.py +55 -0
mindspore/_install_custom.py +43 -0
mindspore/_mindspore_offline_debug.cpython-38-x86_64-linux-gnu.so +0 -0
mindspore/amp.py +85 -19
mindspore/bin/cache_admin +0 -0
mindspore/bin/cache_server +0 -0
mindspore/boost/base.py +2 -2
mindspore/boost/boost.py +27 -32
mindspore/boost/boost_cell_wrapper.py +37 -13
mindspore/boost/grad_accumulation.py +1 -1
mindspore/boost/grad_freeze.py +34 -6
mindspore/boost/group_loss_scale_manager.py +15 -14
mindspore/boost/less_batch_normalization.py +28 -3
mindspore/common/__init__.py +15 -11
mindspore/common/_auto_dynamic.py +68 -0
mindspore/common/_jit_fallback_utils.py +111 -0
mindspore/common/_register_for_adapter.py +17 -5
mindspore/common/_register_for_tensor.py +2 -2
mindspore/common/_stub_tensor.py +18 -15
mindspore/common/_utils.py +31 -7
mindspore/common/api.py +269 -101
mindspore/common/auto_dynamic_shape.py +498 -0
mindspore/common/dtype.py +61 -21
mindspore/common/dump.py +9 -7
mindspore/common/initializer.py +106 -76
mindspore/common/jit_config.py +35 -14
mindspore/common/lazy_inline.py +187 -0
mindspore/common/mindir_util.py +101 -0
mindspore/common/mutable.py +10 -13
mindspore/common/parameter.py +246 -55
mindspore/common/seed.py +13 -7
mindspore/common/sparse_tensor.py +29 -33
mindspore/common/tensor.py +907 -251
mindspore/communication/__init__.py +7 -4
mindspore/communication/_comm_helper.py +84 -4
mindspore/communication/management.py +160 -88
mindspore/config/op_info.config +99 -75
mindspore/config/super_bar_config.json +36 -4
mindspore/context.py +526 -219
mindspore/dataset/__init__.py +9 -46
mindspore/dataset/audio/__init__.py +4 -19
mindspore/dataset/audio/transforms.py +545 -233
mindspore/dataset/audio/utils.py +21 -18
mindspore/dataset/callback/ds_callback.py +42 -13
mindspore/dataset/core/config.py +158 -100
mindspore/dataset/core/validator_helpers.py +1 -63
mindspore/dataset/debug/debug_hook.py +45 -13
mindspore/dataset/debug/pre_defined_hook.py +5 -5
mindspore/dataset/engine/__init__.py +0 -5
mindspore/dataset/engine/cache_client.py +38 -15
mindspore/dataset/engine/datasets.py +615 -278
mindspore/dataset/engine/datasets_audio.py +154 -283
mindspore/dataset/engine/datasets_standard_format.py +104 -116
mindspore/dataset/engine/datasets_text.py +443 -326
mindspore/dataset/engine/datasets_user_defined.py +251 -164
mindspore/dataset/engine/datasets_vision.py +839 -1443
mindspore/dataset/engine/iterators.py +11 -4
mindspore/dataset/engine/obs/obs_mindrecord_dataset.py +7 -3
mindspore/dataset/engine/obs/util.py +3 -0
mindspore/dataset/engine/offload.py +6 -6
mindspore/dataset/engine/queue.py +15 -14
mindspore/dataset/engine/samplers.py +39 -23
mindspore/dataset/engine/serializer_deserializer.py +22 -6
mindspore/dataset/engine/validators.py +21 -331
mindspore/dataset/text/__init__.py +5 -33
mindspore/dataset/text/transforms.py +334 -165
mindspore/dataset/text/utils.py +215 -145
mindspore/dataset/transforms/__init__.py +1 -1
mindspore/dataset/transforms/c_transforms.py +3 -2
mindspore/dataset/transforms/py_transforms_util.py +40 -12
mindspore/dataset/transforms/transforms.py +174 -71
mindspore/dataset/utils/browse_dataset.py +25 -17
mindspore/dataset/utils/line_reader.py +24 -21
mindspore/dataset/vision/__init__.py +5 -26
mindspore/dataset/vision/c_transforms.py +177 -165
mindspore/dataset/vision/py_transforms.py +114 -119
mindspore/dataset/vision/py_transforms_util.py +54 -51
mindspore/dataset/vision/transforms.py +1127 -381
mindspore/dataset/vision/utils.py +54 -38
mindspore/dataset/vision/validators.py +12 -2
mindspore/experimental/map_parameter.py +38 -4
mindspore/{dataset/datapreprocess → experimental/optim}/__init__.py +14 -4
mindspore/experimental/optim/adam.py +192 -0
mindspore/experimental/optim/adamw.py +181 -0
mindspore/experimental/optim/lr_scheduler.py +1427 -0
mindspore/experimental/optim/optimizer.py +252 -0
mindspore/experimental/optim/sgd.py +147 -0
mindspore/gen_ops.py +273 -0
mindspore/include/OWNERS +1 -2
mindspore/include/api/context.h +21 -1
mindspore/include/api/data_type.h +2 -1
mindspore/include/api/graph.h +0 -15
mindspore/include/api/kernel.h +2 -0
mindspore/include/api/kernel_api.h +37 -12
mindspore/include/api/model.h +29 -42
mindspore/include/api/model_group.h +14 -3
mindspore/include/api/model_parallel_runner.h +18 -2
mindspore/include/api/serialization.h +26 -0
mindspore/include/api/status.h +1 -0
mindspore/include/api/types.h +38 -4
mindspore/include/c_api/ms/abstract.h +67 -0
mindspore/include/c_api/ms/attribute.h +197 -0
mindspore/include/c_api/ms/base/handle_types.h +43 -0
mindspore/include/c_api/ms/base/macros.h +32 -0
mindspore/include/c_api/ms/base/status.h +33 -0
mindspore/include/c_api/ms/base/types.h +282 -0
mindspore/include/c_api/ms/context.h +102 -0
mindspore/include/c_api/ms/graph.h +160 -0
mindspore/include/c_api/ms/node.h +606 -0
mindspore/include/c_api/ms/tensor.h +161 -0
mindspore/include/c_api/ms/value.h +84 -0
mindspore/include/c_api/status_c.h +3 -0
mindspore/include/dataset/constants.h +6 -12
mindspore/include/dataset/execute.h +23 -13
mindspore/include/dataset/text.h +26 -26
mindspore/include/dataset/transforms.h +25 -31
mindspore/include/dataset/vision.h +60 -60
mindspore/include/dataset/vision_ascend.h +5 -6
mindspore/include/dataset/vision_lite.h +17 -17
mindspore/include/mindapi/base/format.h +0 -1
mindspore/include/mindapi/base/type_id.h +2 -1
mindspore/include/mindapi/base/types.h +5 -1
mindspore/lib/libdnnl.so.2 +0 -0
mindspore/lib/libjemalloc.so.2 +0 -0
mindspore/lib/libmindspore.so +0 -0
mindspore/lib/libmindspore_backend.so +0 -0
mindspore/lib/libmindspore_common.so +0 -0
mindspore/lib/libmindspore_core.so +0 -0
mindspore/lib/libmindspore_glog.so.0 +0 -0
mindspore/lib/libmindspore_gpr.so.15 +0 -0
mindspore/lib/libmindspore_grpc++.so.1 +0 -0
mindspore/lib/libmindspore_grpc.so.15 +0 -0
mindspore/lib/libmindspore_shared_lib.so +0 -0
mindspore/lib/libmpi_adapter.so +0 -0
mindspore/lib/libnnacl.so +0 -0
mindspore/lib/libopencv_core.so.4.5 +0 -0
mindspore/lib/libopencv_imgcodecs.so.4.5 +0 -0
mindspore/lib/libopencv_imgproc.so.4.5 +0 -0
mindspore/lib/libps_cache.so +0 -0
mindspore/lib/plugin/ascend/custom_aicpu_ops/op_impl/cpu/aicpu_kernel/impl/libcust_aicpu_kernels.so +0 -0
mindspore/lib/plugin/ascend/custom_aicpu_ops/op_impl/cpu/aicpu_kernel/impl/libcust_cpu_kernels.so +0 -0
mindspore/lib/plugin/ascend/custom_aicpu_ops/op_impl/cpu/config/cust_aicpu_kernel.json +9000 -0
mindspore/lib/plugin/ascend/custom_aicpu_ops/op_proto/libcust_op_proto.so +0 -0
mindspore/lib/plugin/ascend/libakg.so +0 -0
mindspore/lib/plugin/ascend/libascend_collective.so +0 -0
mindspore/lib/plugin/ascend/libdvpp_utils.so +0 -0
mindspore/lib/plugin/ascend/libhccl_plugin.so +0 -0
mindspore/lib/plugin/ascend/libmindspore_aicpu_kernels.so +0 -0
mindspore/lib/plugin/ascend/libmindspore_cpu_kernels.so +0 -0
mindspore/lib/plugin/cpu/libakg.so +0 -0
mindspore/lib/plugin/gpu/libcuda_ops.so.10 +0 -0
mindspore/lib/plugin/gpu/libcuda_ops.so.11 +0 -0
mindspore/lib/plugin/gpu10.1/libakg.so +0 -0
mindspore/lib/plugin/gpu10.1/libnccl.so.2 +0 -0
mindspore/lib/plugin/gpu10.1/libnvidia_collective.so +0 -0
mindspore/lib/plugin/gpu11.1/libakg.so +0 -0
mindspore/lib/plugin/gpu11.1/libnccl.so.2 +0 -0
mindspore/lib/plugin/gpu11.1/libnvidia_collective.so +0 -0
mindspore/lib/plugin/gpu11.6/libakg.so +0 -0
mindspore/lib/plugin/gpu11.6/libnccl.so.2 +0 -0
mindspore/lib/plugin/gpu11.6/libnvidia_collective.so +0 -0
mindspore/lib/plugin/libmindspore_ascend.so.1 +0 -0
mindspore/lib/plugin/libmindspore_ascend.so.2 +0 -0
mindspore/lib/plugin/libmindspore_gpu.so.10.1 +0 -0
mindspore/lib/plugin/libmindspore_gpu.so.11.1 +0 -0
mindspore/lib/plugin/libmindspore_gpu.so.11.6 +0 -0
mindspore/log.py +9 -6
mindspore/mindrecord/filereader.py +33 -4
mindspore/mindrecord/filewriter.py +70 -35
mindspore/mindrecord/mindpage.py +40 -34
mindspore/mindrecord/shardreader.py +1 -1
mindspore/mindrecord/shardsegment.py +1 -1
mindspore/mindrecord/tools/cifar100_to_mr.py +25 -18
mindspore/mindrecord/tools/cifar10_to_mr.py +25 -18
mindspore/mindrecord/tools/csv_to_mr.py +29 -13
mindspore/mindrecord/tools/imagenet_to_mr.py +24 -10
mindspore/mindrecord/tools/mnist_to_mr.py +24 -11
mindspore/mindrecord/tools/tfrecord_to_mr.py +31 -26
mindspore/nn/cell.py +463 -169
mindspore/nn/dynamic_lr.py +47 -43
mindspore/nn/layer/activation.py +225 -82
mindspore/nn/layer/basic.py +121 -79
mindspore/nn/layer/channel_shuffle.py +21 -21
mindspore/nn/layer/combined.py +33 -26
mindspore/nn/layer/container.py +277 -22
mindspore/nn/layer/conv.py +441 -304
mindspore/nn/layer/dense.py +19 -13
mindspore/nn/layer/embedding.py +62 -49
mindspore/nn/layer/flash_attention.py +264 -0
mindspore/nn/layer/image.py +50 -39
mindspore/nn/layer/math.py +62 -51
mindspore/nn/layer/normalization.py +219 -167
mindspore/nn/layer/padding.py +58 -70
mindspore/nn/layer/pooling.py +334 -287
mindspore/nn/layer/rnn_cells.py +53 -38
mindspore/nn/layer/rnns.py +59 -56
mindspore/nn/layer/thor_layer.py +52 -44
mindspore/nn/layer/timedistributed.py +6 -4
mindspore/nn/layer/transformer.py +284 -164
mindspore/nn/learning_rate_schedule.py +34 -25
mindspore/nn/loss/__init__.py +3 -2
mindspore/nn/loss/loss.py +554 -311
mindspore/nn/optim/ada_grad.py +12 -9
mindspore/nn/optim/adadelta.py +14 -11
mindspore/nn/optim/adafactor.py +19 -16
mindspore/nn/optim/adam.py +62 -47
mindspore/nn/optim/adamax.py +13 -10
mindspore/nn/optim/adasum.py +12 -8
mindspore/nn/optim/asgd.py +10 -9
mindspore/nn/optim/ftrl.py +20 -17
mindspore/nn/optim/lamb.py +16 -12
mindspore/nn/optim/lars.py +8 -6
mindspore/nn/optim/lazyadam.py +25 -20
mindspore/nn/optim/momentum.py +10 -7
mindspore/nn/optim/optimizer.py +61 -9
mindspore/nn/optim/proximal_ada_grad.py +14 -13
mindspore/nn/optim/rmsprop.py +17 -13
mindspore/nn/optim/rprop.py +30 -17
mindspore/nn/optim/sgd.py +40 -23
mindspore/nn/optim/thor.py +24 -26
mindspore/nn/probability/bijector/bijector.py +11 -11
mindspore/nn/probability/bijector/exp.py +1 -1
mindspore/nn/probability/bijector/gumbel_cdf.py +3 -3
mindspore/nn/probability/bijector/invert.py +1 -1
mindspore/nn/probability/bijector/power_transform.py +29 -29
mindspore/nn/probability/bijector/scalar_affine.py +3 -3
mindspore/nn/probability/bijector/softplus.py +5 -5
mindspore/nn/probability/bnn_layers/bnn_cell_wrapper.py +4 -2
mindspore/nn/probability/bnn_layers/conv_variational.py +13 -13
mindspore/nn/probability/bnn_layers/dense_variational.py +12 -12
mindspore/nn/probability/bnn_layers/layer_distribution.py +9 -8
mindspore/nn/probability/distribution/_utils/custom_ops.py +19 -3
mindspore/nn/probability/distribution/_utils/utils.py +1 -1
mindspore/nn/probability/distribution/bernoulli.py +9 -9
mindspore/nn/probability/distribution/beta.py +8 -8
mindspore/nn/probability/distribution/categorical.py +23 -15
mindspore/nn/probability/distribution/cauchy.py +5 -6
mindspore/nn/probability/distribution/distribution.py +3 -3
mindspore/nn/probability/distribution/exponential.py +4 -4
mindspore/nn/probability/distribution/gamma.py +10 -10
mindspore/nn/probability/distribution/geometric.py +8 -8
mindspore/nn/probability/distribution/gumbel.py +8 -9
mindspore/nn/probability/distribution/half_normal.py +5 -5
mindspore/nn/probability/distribution/laplace.py +5 -5
mindspore/nn/probability/distribution/log_normal.py +12 -11
mindspore/nn/probability/distribution/logistic.py +8 -8
mindspore/nn/probability/distribution/normal.py +6 -5
mindspore/nn/probability/distribution/poisson.py +10 -11
mindspore/nn/probability/distribution/student_t.py +8 -9
mindspore/nn/probability/distribution/transformed_distribution.py +5 -5
mindspore/nn/probability/distribution/uniform.py +11 -11
mindspore/nn/reinforcement/tensor_array.py +2 -2
mindspore/nn/sparse/sparse.py +9 -9
mindspore/nn/wrap/cell_wrapper.py +188 -63
mindspore/nn/wrap/grad_reducer.py +21 -12
mindspore/nn/wrap/loss_scale.py +136 -49
mindspore/numpy/__init__.py +4 -4
mindspore/numpy/array_creations.py +55 -56
mindspore/numpy/array_ops.py +134 -35
mindspore/numpy/logic_ops.py +66 -20
mindspore/numpy/math_ops.py +142 -139
mindspore/numpy/utils_const.py +2 -2
mindspore/offline_debug/convert_async.py +2 -2
mindspore/ops/_grad_experimental/__init__.py +7 -5
mindspore/ops/_grad_experimental/grad_array_ops.py +231 -348
mindspore/ops/{_grad → _grad_experimental}/grad_base.py +1 -33
mindspore/ops/{_grad → _grad_experimental}/grad_comm_ops.py +25 -13
mindspore/ops/{_grad/__init__.py → _grad_experimental/grad_debug_ops.py} +15 -7
mindspore/ops/{_grad → _grad_experimental}/grad_implementations.py +17 -11
mindspore/ops/_grad_experimental/grad_inner_ops.py +33 -52
mindspore/ops/_grad_experimental/grad_math_ops.py +151 -1224
mindspore/ops/_grad_experimental/grad_nn_ops.py +141 -414
mindspore/ops/{_grad → _grad_experimental}/grad_quant_ops.py +10 -6
mindspore/ops/_grad_experimental/grad_sparse.py +317 -2
mindspore/ops/_grad_experimental/grad_sparse_ops.py +3 -13
mindspore/ops/{_grad → _grad_experimental}/taylor_rule.py +1 -1
mindspore/ops/_op_impl/_custom_op/dsd_back_impl.py +1 -1
mindspore/ops/_op_impl/_custom_op/flash_attention/__init__.py +0 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/attention.py +406 -0
mindspore/{_extends/graph_kernel/expanders/complex/__init__.py → ops/_op_impl/_custom_op/flash_attention/constants.py} +27 -8
mindspore/ops/_op_impl/_custom_op/flash_attention/flash_attention_bwd.py +467 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/flash_attention_fwd.py +563 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/flash_attention_impl.py +193 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/tik_ops_utils.py +435 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/tiling_strategy/__init__.py +0 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/tiling_strategy/sparse_tiling.py +45 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/tiling_strategy/strategy.py +67 -0
mindspore/ops/_op_impl/_custom_op/flash_attention/tiling_strategy/wukong_tiling.py +62 -0
mindspore/ops/_op_impl/_custom_op/matmul_cube_dense_left_impl.py +2 -2
mindspore/ops/_op_impl/aicpu/__init__.py +41 -1
mindspore/ops/_op_impl/aicpu/adaptive_max_pool_2d.py +37 -0
mindspore/ops/_op_impl/aicpu/bias_add_grad.py +0 -1
mindspore/ops/_op_impl/aicpu/cast.py +52 -0
mindspore/ops/_op_impl/aicpu/coalesce.py +2 -0
mindspore/ops/_op_impl/aicpu/col2im.py +3 -1
mindspore/ops/_op_impl/aicpu/count_nonzero.py +43 -0
mindspore/ops/_op_impl/aicpu/dropout_genmask.py +6 -0
mindspore/ops/_op_impl/aicpu/eps.py +32 -0
mindspore/ops/_op_impl/aicpu/eye.py +4 -4
mindspore/ops/_op_impl/aicpu/fft_with_size.py +6 -0
mindspore/ops/_op_impl/aicpu/fill_diagonal.py +5 -0
mindspore/ops/_op_impl/aicpu/gamma.py +2 -2
mindspore/ops/_op_impl/aicpu/im2col.py +3 -5
mindspore/ops/_op_impl/aicpu/lgamma.py +1 -0
mindspore/ops/_op_impl/aicpu/log_uniform_candidate_sampler.py +6 -3
mindspore/ops/_op_impl/aicpu/lu.py +39 -0
mindspore/ops/_op_impl/aicpu/lu_unpack_grad.py +0 -1
mindspore/ops/_op_impl/aicpu/masked_scatter.py +1 -0
mindspore/ops/_op_impl/aicpu/masked_select_grad.py +3 -0
mindspore/ops/_op_impl/aicpu/matrix_band_part.py +59 -0
mindspore/ops/_op_impl/aicpu/matrix_power.py +6 -1
mindspore/ops/_op_impl/aicpu/median.py +1 -0
mindspore/ops/_op_impl/aicpu/multinomial.py +9 -9
mindspore/ops/_op_impl/aicpu/not_equal.py +0 -5
mindspore/ops/_op_impl/aicpu/pad_v3.py +3 -1
mindspore/ops/_op_impl/aicpu/pad_v3_grad.py +2 -0
mindspore/ops/_op_impl/aicpu/parameterized_truncated_normal.py +15 -7
mindspore/ops/_op_impl/aicpu/random_categorical.py +39 -19
mindspore/ops/_op_impl/aicpu/random_choice_with_mask.py +5 -2
mindspore/ops/_op_impl/aicpu/random_poisson.py +103 -52
mindspore/ops/_op_impl/aicpu/random_shuffle.py +17 -15
mindspore/ops/_op_impl/aicpu/resize_bilinear_grad.py +0 -1
mindspore/ops/_op_impl/aicpu/resize_nearest_neighbor_v2.py +0 -6
mindspore/ops/_op_impl/aicpu/resize_nearest_neighbor_v2_grad.py +0 -7
mindspore/ops/_op_impl/aicpu/scatter_nd.py +2 -0
mindspore/ops/_op_impl/aicpu/sequence_concat.py +40 -0
mindspore/ops/_op_impl/aicpu/sequence_stack.py +40 -0
mindspore/ops/_op_impl/aicpu/{sparseaddmm.py → sparse_addmm.py} +2 -2
mindspore/ops/_op_impl/aicpu/{sparsesparsemaximum.py → sparse_sparse_maximum.py} +4 -4
mindspore/ops/_op_impl/aicpu/standard_laplace.py +5 -4
mindspore/ops/_op_impl/aicpu/standard_normal.py +5 -4
mindspore/ops/_op_impl/aicpu/truncated_normal.py +9 -7
mindspore/ops/_op_impl/aicpu/uniform.py +5 -3
mindspore/ops/_op_impl/aicpu/uniform_candidate_sampler.py +8 -4
mindspore/ops/_op_impl/aicpu/uniform_int.py +5 -5
mindspore/ops/_op_impl/aicpu/uniform_real.py +4 -4
mindspore/ops/_op_impl/aicpu/upsample_nearest_3d.py +14 -6
mindspore/ops/_op_impl/aicpu/upsample_nearest_3d_grad.py +22 -8
mindspore/ops/_op_impl/aicpu/upsample_trilinear_3d.py +11 -6
mindspore/ops/_op_impl/aicpu/upsample_trilinear_3d_grad.py +21 -10
mindspore/ops/_op_impl/tbe/__init__.py +6 -4
mindspore/ops/_op_impl/tbe/atomic_addr_clean.py +1 -1
mindspore/ops/_op_impl/tbe/avg_pool.py +2 -2
mindspore/ops/_op_impl/tbe/avg_pool_3d.py +3 -3
mindspore/ops/_op_impl/tbe/avg_pool_3d_grad.py +4 -4
mindspore/ops/_op_impl/tbe/avg_pool_ds.py +2 -2
mindspore/ops/_op_impl/tbe/avg_pool_grad.py +3 -3
mindspore/ops/_op_impl/tbe/avg_pool_grad_vm.py +3 -3
mindspore/ops/_op_impl/tbe/batch_to_space.py +1 -1
mindspore/ops/_op_impl/tbe/batch_to_space_nd.py +2 -2
mindspore/ops/_op_impl/tbe/bn_infer.py +2 -2
mindspore/ops/_op_impl/tbe/bn_infer_ds.py +3 -2
mindspore/ops/_op_impl/tbe/broadcast_to.py +1 -1
mindspore/ops/_op_impl/tbe/depthwise_conv2d.py +3 -3
mindspore/ops/_op_impl/tbe/expand_dims.py +1 -1
mindspore/ops/_op_impl/tbe/gather_v2.py +56 -0
mindspore/ops/_op_impl/tbe/im2col.py +4 -4
mindspore/ops/_op_impl/tbe/inplace_index_add.py +7 -3
mindspore/ops/_op_impl/tbe/mem_set.py +38 -0
mindspore/ops/_op_impl/tbe/scatter_nd_add.py +3 -0
mindspore/ops/_op_impl/tbe/scatter_nd_d.py +1 -1
mindspore/ops/_op_impl/tbe/space_to_batch.py +1 -1
mindspore/ops/_op_impl/tbe/space_to_batch_nd.py +2 -2
mindspore/ops/_op_impl/tbe/trans_data_ds.py +2 -0
mindspore/ops/_primitive_cache.py +1 -1
mindspore/ops/_tracefunc.py +241 -0
mindspore/ops/_utils/utils.py +10 -2
mindspore/ops/_vmap/vmap_array_ops.py +5 -3
mindspore/ops/_vmap/vmap_base.py +5 -4
mindspore/ops/_vmap/vmap_convolution_ops.py +1 -1
mindspore/ops/_vmap/vmap_grad_math_ops.py +6 -4
mindspore/ops/_vmap/vmap_grad_nn_ops.py +11 -6
mindspore/ops/_vmap/vmap_math_ops.py +5 -2
mindspore/ops/_vmap/vmap_nn_ops.py +135 -11
mindspore/ops/arg_dtype_cast.py +54 -0
mindspore/ops/composite/__init__.py +7 -5
mindspore/ops/composite/base.py +78 -34
mindspore/ops/composite/math_ops.py +5 -695
mindspore/ops/composite/multitype_ops/_compile_utils.py +403 -97
mindspore/ops/composite/multitype_ops/_constexpr_utils.py +28 -22
mindspore/ops/composite/multitype_ops/add_impl.py +69 -7
mindspore/ops/composite/multitype_ops/bitwise_and_impl.py +2 -1
mindspore/ops/composite/multitype_ops/bitwise_or_impl.py +2 -1
mindspore/ops/composite/multitype_ops/bitwise_xor_impl.py +2 -0
mindspore/ops/composite/multitype_ops/div_impl.py +1 -0
mindspore/ops/composite/multitype_ops/floordiv_impl.py +1 -0
mindspore/ops/composite/multitype_ops/getitem_impl.py +48 -10
mindspore/ops/composite/multitype_ops/greater_equal_impl.py +2 -0
mindspore/ops/composite/multitype_ops/greater_impl.py +2 -0
mindspore/ops/composite/multitype_ops/left_shift_impl.py +2 -0
mindspore/ops/composite/multitype_ops/less_equal_impl.py +2 -0
mindspore/ops/composite/multitype_ops/less_impl.py +2 -0
mindspore/ops/composite/multitype_ops/logic_not_impl.py +2 -2
mindspore/ops/composite/multitype_ops/mod_impl.py +1 -0
mindspore/ops/composite/multitype_ops/mul_impl.py +1 -0
mindspore/ops/composite/multitype_ops/negative_impl.py +1 -0
mindspore/ops/composite/multitype_ops/not_in_impl.py +1 -0
mindspore/ops/composite/multitype_ops/ones_like_impl.py +6 -0
mindspore/ops/composite/multitype_ops/pow_impl.py +1 -0
mindspore/ops/composite/multitype_ops/right_shift_impl.py +2 -0
mindspore/ops/composite/multitype_ops/setitem_impl.py +10 -7
mindspore/ops/composite/multitype_ops/sub_impl.py +1 -0
mindspore/ops/composite/multitype_ops/uadd_impl.py +2 -0
mindspore/ops/composite/multitype_ops/zeros_like_impl.py +9 -0
mindspore/ops/deprecated.py +304 -0
mindspore/ops/function/__init__.py +41 -4
mindspore/ops/function/array_func.py +1108 -467
mindspore/ops/function/clip_func.py +94 -27
mindspore/ops/function/debug_func.py +3 -1
mindspore/ops/function/grad/grad_func.py +82 -73
mindspore/ops/function/image_func.py +28 -12
mindspore/ops/function/linalg_func.py +135 -39
mindspore/ops/function/math_func.py +3779 -894
mindspore/ops/function/nn_func.py +1584 -657
mindspore/ops/function/parameter_func.py +13 -3
mindspore/ops/function/random_func.py +247 -153
mindspore/ops/function/sparse_func.py +14 -11
mindspore/ops/function/sparse_unary_func.py +173 -47
mindspore/ops/function/spectral_func.py +8 -4
mindspore/ops/function/vmap_func.py +8 -7
mindspore/ops/functional.py +47 -16
mindspore/ops/op_info_register.py +346 -86
mindspore/ops/operations/__init__.py +38 -22
mindspore/ops/operations/_grad_ops.py +145 -149
mindspore/ops/operations/_inner_ops.py +298 -56
mindspore/ops/operations/_ms_kernel.py +3 -3
mindspore/ops/operations/_quant_ops.py +24 -28
mindspore/ops/operations/_rl_inner_ops.py +9 -7
mindspore/ops/operations/_scalar_ops.py +115 -0
mindspore/ops/operations/_sequence_ops.py +148 -10
mindspore/ops/operations/_tensor_array.py +1 -1
mindspore/ops/operations/_thor_ops.py +2 -2
mindspore/ops/operations/array_ops.py +1239 -561
mindspore/ops/operations/comm_ops.py +166 -90
mindspore/ops/operations/control_ops.py +3 -3
mindspore/ops/operations/custom_ops.py +124 -102
mindspore/ops/operations/debug_ops.py +24 -11
mindspore/ops/operations/image_ops.py +86 -71
mindspore/ops/operations/inner_ops.py +18 -13
mindspore/ops/operations/linalg_ops.py +30 -11
mindspore/ops/operations/math_ops.py +1730 -435
mindspore/ops/operations/nn_ops.py +1953 -943
mindspore/ops/operations/other_ops.py +65 -43
mindspore/ops/operations/random_ops.py +258 -98
mindspore/ops/operations/rl_ops.py +4 -36
mindspore/ops/operations/sparse_ops.py +38 -33
mindspore/ops/operations/spectral_ops.py +8 -4
mindspore/ops/primitive.py +66 -44
mindspore/ops/signature.py +5 -5
mindspore/parallel/_auto_parallel_context.py +80 -19
mindspore/parallel/_cost_model_context.py +42 -0
mindspore/parallel/_offload_context.py +162 -72
mindspore/parallel/_parallel_serialization.py +2 -2
mindspore/parallel/_ps_context.py +16 -4
mindspore/parallel/_recovery_context.py +2 -1
mindspore/parallel/_tensor.py +15 -13
mindspore/parallel/_transformer/layers.py +8 -6
mindspore/parallel/_transformer/loss.py +1 -0
mindspore/parallel/_transformer/moe.py +7 -7
mindspore/parallel/_transformer/op_parallel_config.py +12 -1
mindspore/parallel/_transformer/transformer.py +34 -14
mindspore/parallel/_utils.py +36 -14
mindspore/parallel/algo_parameter_config.py +114 -20
mindspore/parallel/checkpoint_transform.py +16 -18
mindspore/parallel/shard.py +16 -13
mindspore/profiler/__init__.py +1 -1
mindspore/profiler/common/struct_type.py +3 -3
mindspore/profiler/common/util.py +3 -2
mindspore/profiler/envprofiling.py +11 -4
mindspore/profiler/parser/aicpu_data_parser.py +5 -3
mindspore/profiler/parser/ascend_flops_generator.py +94 -0
mindspore/profiler/parser/ascend_fpbp_generator.py +76 -0
mindspore/profiler/parser/ascend_hccl_generator.py +288 -0
mindspore/profiler/parser/ascend_msprof_exporter.py +213 -0
mindspore/profiler/parser/ascend_msprof_generator.py +199 -0
mindspore/profiler/parser/ascend_op_generator.py +276 -0
mindspore/profiler/parser/ascend_steptrace_generator.py +94 -0
mindspore/profiler/parser/ascend_timeline_generator.py +110 -54
mindspore/profiler/parser/base_timeline_generator.py +11 -7
mindspore/profiler/parser/cpu_gpu_timeline_generator.py +45 -46
mindspore/profiler/parser/flops_parser.py +15 -11
mindspore/profiler/parser/framework_parser.py +92 -73
mindspore/profiler/parser/hccl_parser.py +16 -12
mindspore/profiler/parser/integrator.py +22 -11
mindspore/profiler/parser/memory_usage_parser.py +36 -11
mindspore/profiler/parser/minddata_analyzer.py +12 -14
mindspore/profiler/parser/minddata_pipeline_parser.py +1 -1
mindspore/profiler/parser/msadvisor_parser.py +8 -4
mindspore/profiler/parser/op_intermediate_parser.py +5 -2
mindspore/profiler/parser/optime_parser.py +1 -1
mindspore/profiler/parser/profiler_info.py +4 -5
mindspore/profiler/parser/step_trace_parser.py +11 -14
mindspore/profiler/profiling.py +678 -377
mindspore/rewrite/api/node.py +211 -54
mindspore/rewrite/api/node_type.py +5 -0
mindspore/rewrite/api/pattern_engine.py +22 -23
mindspore/rewrite/api/scoped_value.py +20 -17
mindspore/rewrite/api/symbol_tree.py +252 -106
mindspore/rewrite/api/tree_node_helper.py +3 -0
mindspore/rewrite/ast_helpers/__init__.py +2 -1
mindspore/rewrite/ast_helpers/ast_finder.py +129 -0
mindspore/rewrite/ast_helpers/ast_modifier.py +116 -104
mindspore/rewrite/ast_transformers/flatten_recursive_stmt.py +97 -46
mindspore/rewrite/common/rewrite_elog.py +5 -1
mindspore/rewrite/namer.py +51 -51
mindspore/rewrite/namespace.py +14 -5
mindspore/{ops/bprop_mindir → rewrite/node}/__init__.py +9 -4
mindspore/rewrite/node/call_function.py +79 -0
mindspore/rewrite/node/cell_container.py +135 -0
mindspore/rewrite/node/control_flow.py +88 -0
mindspore/rewrite/{node.py → node/node.py} +313 -247
mindspore/rewrite/node/node_manager.py +254 -0
mindspore/rewrite/node/node_topological_manager.py +243 -0
mindspore/rewrite/parsers/arguments_parser.py +22 -21
mindspore/rewrite/parsers/assign_parser.py +225 -239
mindspore/rewrite/parsers/attribute_parser.py +9 -7
mindspore/rewrite/parsers/class_def_parser.py +179 -218
mindspore/rewrite/parsers/constant_parser.py +9 -6
mindspore/rewrite/parsers/container_parser.py +9 -7
mindspore/rewrite/parsers/for_parser.py +36 -15
mindspore/rewrite/parsers/function_def_parser.py +23 -20
mindspore/rewrite/parsers/if_parser.py +28 -24
mindspore/rewrite/parsers/module_parser.py +202 -25
mindspore/rewrite/{parser.py → parsers/parser.py} +4 -2
mindspore/rewrite/{parser_register.py → parsers/parser_register.py} +1 -1
mindspore/rewrite/parsers/return_parser.py +6 -6
mindspore/rewrite/sparsify/sparse_transformer.py +12 -3
mindspore/rewrite/sparsify/sparsify.py +4 -1
mindspore/rewrite/sparsify/utils.py +11 -5
mindspore/rewrite/symbol_tree.py +577 -732
mindspore/rewrite/symbol_tree_builder.py +9 -175
mindspore/rewrite/symbol_tree_dumper.py +2 -2
mindspore/run_check/_check_version.py +46 -39
mindspore/run_check/run_check.py +3 -2
mindspore/{scipy/sparse → safeguard}/__init__.py +4 -5
mindspore/safeguard/rewrite_obfuscation.py +517 -0
mindspore/scipy/__init__.py +1 -1
mindspore/scipy/linalg.py +67 -61
mindspore/scipy/ops.py +5 -41
mindspore/scipy/ops_grad.py +3 -2
mindspore/scipy/ops_wrapper.py +5 -5
mindspore/scipy/optimize/line_search.py +8 -8
mindspore/scipy/optimize/linear_sum_assignment.py +4 -4
mindspore/scipy/optimize/minimize.py +16 -12
mindspore/scipy/utils.py +1 -52
mindspore/scipy/utils_const.py +4 -4
mindspore/train/__init__.py +4 -4
mindspore/train/_utils.py +13 -5
mindspore/train/amp.py +410 -148
mindspore/train/anf_ir_pb2.py +16 -4
mindspore/train/callback/_backup_and_restore.py +8 -11
mindspore/train/callback/_callback.py +80 -3
mindspore/train/callback/_checkpoint.py +82 -51
mindspore/train/callback/_early_stop.py +12 -15
mindspore/train/callback/_history.py +1 -1
mindspore/train/callback/_lambda_callback.py +13 -13
mindspore/train/callback/_landscape.py +21 -17
mindspore/train/callback/_loss_monitor.py +9 -10
mindspore/train/callback/_on_request_exit.py +16 -33
mindspore/train/callback/_reduce_lr_on_plateau.py +21 -24
mindspore/train/callback/_summary_collector.py +44 -30
mindspore/train/callback/_time_monitor.py +62 -12
mindspore/train/data_sink.py +10 -16
mindspore/train/dataset_helper.py +154 -86
mindspore/train/loss_scale_manager.py +14 -9
mindspore/train/metrics/__init__.py +10 -2
mindspore/train/metrics/accuracy.py +1 -1
mindspore/train/metrics/auc.py +1 -1
mindspore/train/metrics/bleu_score.py +2 -2
mindspore/train/metrics/confusion_matrix.py +14 -14
mindspore/train/metrics/cosine_similarity.py +3 -3
mindspore/train/metrics/dice.py +1 -1
mindspore/train/metrics/fbeta.py +1 -1
mindspore/train/metrics/hausdorff_distance.py +8 -6
mindspore/train/metrics/mean_surface_distance.py +5 -4
mindspore/train/metrics/metric.py +49 -17
mindspore/train/metrics/occlusion_sensitivity.py +4 -4
mindspore/train/metrics/perplexity.py +1 -1
mindspore/train/metrics/precision.py +2 -2
mindspore/train/metrics/recall.py +2 -3
mindspore/train/metrics/roc.py +7 -7
mindspore/train/metrics/root_mean_square_surface_distance.py +5 -4
mindspore/train/metrics/topk.py +7 -4
mindspore/train/mind_ir_pb2.py +193 -48
mindspore/train/model.py +377 -133
mindspore/train/serialization.py +697 -245
mindspore/train/summary/_summary_adapter.py +5 -2
mindspore/train/summary/_writer_pool.py +4 -3
mindspore/train/summary/summary_record.py +25 -23
mindspore/train/train_thor/convert_utils.py +39 -23
mindspore/train/train_thor/dataset_helper.py +4 -3
mindspore/train/train_thor/model_thor.py +8 -8
mindspore/version.py +1 -1
{mindspore-2.0.0rc1.dist-info → mindspore-2.2.0.dist-info}/METADATA +7 -8
{mindspore-2.0.0rc1.dist-info → mindspore-2.2.0.dist-info}/RECORD +647 -818
{mindspore-2.0.0rc1.dist-info → mindspore-2.2.0.dist-info}/entry_points.txt +0 -1
mindspore/_akg/akg/tvm/contrib/debugger/__init__.py +0 -16
mindspore/_akg/akg/tvm/contrib/debugger/debug_result.py +0 -274
mindspore/_akg/akg/tvm/contrib/debugger/debug_runtime.py +0 -259
mindspore/_akg/akg/tvm/contrib/peak.py +0 -341
mindspore/_akg/akg/tvm/contrib/rpc.py +0 -25
mindspore/_akg/akg/tvm/contrib/xcode.py +0 -257
mindspore/_akg/akg/tvm/exec/__init__.py +0 -17
mindspore/_akg/akg/tvm/exec/autotvm_log_editor.py +0 -60
mindspore/_akg/akg/tvm/exec/measure_peak.py +0 -48
mindspore/_akg/akg/tvm/exec/query_rpc_tracker.py +0 -48
mindspore/_akg/akg/tvm/exec/rpc_proxy.py +0 -98
mindspore/_akg/akg/tvm/exec/rpc_server.py +0 -88
mindspore/_akg/akg/tvm/exec/rpc_tracker.py +0 -62
mindspore/_akg/akg/tvm/rpc/__init__.py +0 -29
mindspore/_akg/akg/tvm/rpc/base.py +0 -182
mindspore/_akg/akg/tvm/rpc/client.py +0 -436
mindspore/_akg/akg/tvm/rpc/proxy.py +0 -595
mindspore/_akg/akg/tvm/rpc/server.py +0 -413
mindspore/_akg/akg/tvm/rpc/tornado_util.py +0 -121
mindspore/_akg/akg/tvm/rpc/tracker.py +0 -431
mindspore/_extends/graph_kernel/expander.py +0 -80
mindspore/_extends/graph_kernel/expanders/__init__.py +0 -57
mindspore/_extends/graph_kernel/expanders/_utils.py +0 -269
mindspore/_extends/graph_kernel/expanders/addn.py +0 -33
mindspore/_extends/graph_kernel/expanders/batchnorm.py +0 -152
mindspore/_extends/graph_kernel/expanders/batchnorm_grad.py +0 -105
mindspore/_extends/graph_kernel/expanders/bias_add_grad.py +0 -49
mindspore/_extends/graph_kernel/expanders/clip_by_norm_no_div_sum.py +0 -33
mindspore/_extends/graph_kernel/expanders/complex/abs.py +0 -30
mindspore/_extends/graph_kernel/expanders/complex/add.py +0 -44
mindspore/_extends/graph_kernel/expanders/complex/div.py +0 -62
mindspore/_extends/graph_kernel/expanders/complex/mul.py +0 -52
mindspore/_extends/graph_kernel/expanders/complex/real_div.py +0 -62
mindspore/_extends/graph_kernel/expanders/complex/sub.py +0 -45
mindspore/_extends/graph_kernel/expanders/conv2d.py +0 -200
mindspore/_extends/graph_kernel/expanders/dropout_grad.py +0 -30
mindspore/_extends/graph_kernel/expanders/equal_count.py +0 -50
mindspore/_extends/graph_kernel/expanders/erfc.py +0 -35
mindspore/_extends/graph_kernel/expanders/expand_dims.py +0 -50
mindspore/_extends/graph_kernel/expanders/fused_adam.py +0 -44
mindspore/_extends/graph_kernel/expanders/fused_adam_weight_decay.py +0 -47
mindspore/_extends/graph_kernel/expanders/fused_mul_add.py +0 -28
mindspore/_extends/graph_kernel/expanders/gather.py +0 -43
mindspore/_extends/graph_kernel/expanders/gelu_grad.py +0 -70
mindspore/_extends/graph_kernel/expanders/gkdropout.py +0 -40
mindspore/_extends/graph_kernel/expanders/identity.py +0 -25
mindspore/_extends/graph_kernel/expanders/layernorm.py +0 -93
mindspore/_extends/graph_kernel/expanders/layernorm_grad.py +0 -113
mindspore/_extends/graph_kernel/expanders/logsoftmax.py +0 -46
mindspore/_extends/graph_kernel/expanders/logsoftmax_grad.py +0 -36
mindspore/_extends/graph_kernel/expanders/matmul.py +0 -80
mindspore/_extends/graph_kernel/expanders/maximum_grad.py +0 -59
mindspore/_extends/graph_kernel/expanders/minimum_grad.py +0 -80
mindspore/_extends/graph_kernel/expanders/oneslike.py +0 -26
mindspore/_extends/graph_kernel/expanders/reduce_mean.py +0 -43
mindspore/_extends/graph_kernel/expanders/relu_grad.py +0 -32
mindspore/_extends/graph_kernel/expanders/sigmoid_cross_entropy_with_logits.py +0 -41
mindspore/_extends/graph_kernel/expanders/sigmoid_cross_entropy_with_logits_grad.py +0 -35
mindspore/_extends/graph_kernel/expanders/sigmoid_grad.py +0 -31
mindspore/_extends/graph_kernel/expanders/slice.py +0 -35
mindspore/_extends/graph_kernel/expanders/softmax_cross_entropy_with_logits.py +0 -42
mindspore/_extends/graph_kernel/expanders/softmax_grad_ext.py +0 -41
mindspore/_extends/graph_kernel/expanders/softsign.py +0 -28
mindspore/_extends/graph_kernel/expanders/sqrt_grad.py +0 -29
mindspore/_extends/graph_kernel/expanders/square_sum_all.py +0 -44
mindspore/_extends/graph_kernel/expanders/square_sum_v1.py +0 -37
mindspore/_extends/graph_kernel/expanders/squared_difference.py +0 -43
mindspore/_extends/graph_kernel/expanders/tanh_grad.py +0 -31
mindspore/_extends/graph_kernel/expanders/tile.py +0 -54
mindspore/_extends/graph_kernel/model/op_infer.py +0 -506
mindspore/_extends/parse/jit_fallback_modules.py +0 -51
mindspore/dataset/datapreprocess/preprocess_imagenet_validate_dataset.py +0 -54
mindspore/dataset/engine/graphdata.py +0 -1586
mindspore/include/api/net.h +0 -142
mindspore/ops/_grad/grad_array_ops.py +0 -1347
mindspore/ops/_grad/grad_clip_ops.py +0 -84
mindspore/ops/_grad/grad_debug_ops.py +0 -68
mindspore/ops/_grad/grad_inner_ops.py +0 -235
mindspore/ops/_grad/grad_math_ops.py +0 -1684
mindspore/ops/_grad/grad_nn_ops.py +0 -1529
mindspore/ops/_grad/grad_other_ops.py +0 -89
mindspore/ops/_grad/grad_sequence_ops.py +0 -296
mindspore/ops/_grad/grad_sparse.py +0 -323
mindspore/ops/_grad_experimental/grad_image_ops.py +0 -249
mindspore/ops/_grad_experimental/grad_linalg_ops.py +0 -195
mindspore/ops/_grad_experimental/grad_scalar_ops.py +0 -112
mindspore/ops/bprop_mindir/AdaptiveAvgPool2D_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/AdaptiveMaxPool2D_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/ApproximateEqual_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/Argmax_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/Argmin_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/AssignSub_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/Assign_bprop.mindir +0 -17
mindspore/ops/bprop_mindir/AvgPool3D_bprop.mindir +0 -150
mindspore/ops/bprop_mindir/AvgPool_bprop.mindir +0 -66
mindspore/ops/bprop_mindir/BCEWithLogitsLoss_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/BNTrainingReduce_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/BatchNormGrad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/BatchToSpaceND_bprop.mindir +0 -28
mindspore/ops/bprop_mindir/BiasAddGrad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/BinaryCrossEntropy_bprop.mindir +0 -33
mindspore/ops/bprop_mindir/BroadcastTo_bprop.mindir +0 -306
mindspore/ops/bprop_mindir/Broadcast_bprop.mindir +0 -13
mindspore/ops/bprop_mindir/CTCLoss_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Concat_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Conv2DBackpropFilter_bprop.mindir +0 -240
mindspore/ops/bprop_mindir/Conv2DBackpropInput_bprop.mindir +0 -247
mindspore/ops/bprop_mindir/Conv2DTranspose_bprop.mindir +0 -247
mindspore/ops/bprop_mindir/Conv3DTranspose_bprop.mindir +0 -315
mindspore/ops/bprop_mindir/Conv3D_bprop.mindir +0 -278
mindspore/ops/bprop_mindir/DType_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/DeformableOffsets_bprop.mindir +0 -58
mindspore/ops/bprop_mindir/Depend_bprop.mindir +0 -13
mindspore/ops/bprop_mindir/DepthToSpace_bprop.mindir +0 -23
mindspore/ops/bprop_mindir/DepthwiseConv2dNative_bprop.mindir +0 -138
mindspore/ops/bprop_mindir/DiagPart_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/Dropout2D_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Dropout3D_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/DropoutDoMask_bprop.mindir +0 -25
mindspore/ops/bprop_mindir/DropoutGenMask_bprop.mindir +0 -18
mindspore/ops/bprop_mindir/DropoutGrad_bprop.mindir +0 -27
mindspore/ops/bprop_mindir/Dropout_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/DynamicGRUV2_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/DynamicRNN_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/DynamicShape_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/Elu_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/EmbeddingLookup_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Equal_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/ExpandDims_bprop.mindir +0 -58
mindspore/ops/bprop_mindir/FastGeLU_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/Flatten_bprop.mindir +0 -54
mindspore/ops/bprop_mindir/FloorDiv_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/GatherD_bprop.mindir +0 -26
mindspore/ops/bprop_mindir/GatherNd_bprop.mindir +0 -57
mindspore/ops/bprop_mindir/Gather_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/GreaterEqual_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/Greater_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/HSigmoid_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/HSwish_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/IOU_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/InstanceNorm_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/IsFinite_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/IsInf_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/IsNan_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/KLDivLoss_bprop.mindir +0 -126
mindspore/ops/bprop_mindir/L2Loss_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/L2Normalize_bprop.mindir +0 -30
mindspore/ops/bprop_mindir/LRN_bprop.mindir +0 -43
mindspore/ops/bprop_mindir/LayerNormGrad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/LessEqual_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/Less_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/LinSpace_bprop.mindir +0 -23
mindspore/ops/bprop_mindir/Load_bprop.mindir +0 -13
mindspore/ops/bprop_mindir/LogSoftmax_bprop.mindir +0 -23
mindspore/ops/bprop_mindir/LogicalAnd_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/LogicalNot_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/MaskedSelect_bprop.mindir +0 -21
mindspore/ops/bprop_mindir/MaxPool3DGradGrad_bprop.mindir +0 -74
mindspore/ops/bprop_mindir/MaxPool3DGrad_bprop.mindir +0 -74
mindspore/ops/bprop_mindir/MaxPool3D_bprop.mindir +0 -75
mindspore/ops/bprop_mindir/MaxPoolGradGrad_bprop.mindir +0 -65
mindspore/ops/bprop_mindir/MaxPoolWithArgmax_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Maximum_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Minimum_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/MirrorPad_bprop.mindir +0 -27
mindspore/ops/bprop_mindir/Mish_bprop.mindir +0 -35
mindspore/ops/bprop_mindir/MulNoNan_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/NLLLoss_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/NonZero_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/NotEqual_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/OneHot_bprop.mindir +0 -26
mindspore/ops/bprop_mindir/OnesLike_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/PReLU_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Pad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Padding_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/RNNTLoss_bprop.mindir +0 -29
mindspore/ops/bprop_mindir/ROIAlign_bprop.mindir +0 -82
mindspore/ops/bprop_mindir/Range_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/Rank_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/ReLU6_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/ReLUV2_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/ReduceAll_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/ReduceAny_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/ReluGrad_bprop.mindir +0 -20
mindspore/ops/bprop_mindir/Reshape_bprop.mindir +0 -60
mindspore/ops/bprop_mindir/ResizeBilinear_bprop.mindir +0 -29
mindspore/ops/bprop_mindir/ResizeNearestNeighbor_bprop.mindir +0 -89
mindspore/ops/bprop_mindir/ReverseSequence_bprop.mindir +0 -52
mindspore/ops/bprop_mindir/ReverseV2_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/Round_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/ScatterMax_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/ScatterMin_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/ScatterNdUpdate_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/ScatterNd_bprop.mindir +0 -24
mindspore/ops/bprop_mindir/ScatterNonAliasingAdd_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/ScatterUpdate_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/SeLU_bprop.mindir +0 -21
mindspore/ops/bprop_mindir/Select_bprop.mindir +0 -31
mindspore/ops/bprop_mindir/Shape_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/SigmoidCrossEntropyWithLogits_bprop.mindir +0 -21
mindspore/ops/bprop_mindir/SigmoidGrad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Sigmoid_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/Sign_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/Slice_bprop.mindir +0 -26
mindspore/ops/bprop_mindir/SmoothL1Loss_bprop.mindir +0 -36
mindspore/ops/bprop_mindir/SoftmaxCrossEntropyWithLogits_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Softplus_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/Softsign_bprop.mindir +0 -33
mindspore/ops/bprop_mindir/Sort_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/SpaceToBatchND_bprop.mindir +0 -28
mindspore/ops/bprop_mindir/SpaceToDepth_bprop.mindir +0 -23
mindspore/ops/bprop_mindir/SparseGatherV2_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/SparseSoftmaxCrossEntropyWithLogits_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Split_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/Squeeze_bprop.mindir +0 -54
mindspore/ops/bprop_mindir/StridedSliceGrad_bprop.mindir +0 -95
mindspore/ops/bprop_mindir/StridedSlice_bprop.mindir +0 -98
mindspore/ops/bprop_mindir/Switch_bprop.mindir +0 -29
mindspore/ops/bprop_mindir/TanhGrad_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/Tanh_bprop.mindir +0 -66
mindspore/ops/bprop_mindir/TensorScatterAdd_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/TensorScatterUpdate_bprop.mindir +0 -29
mindspore/ops/bprop_mindir/TensorShape_bprop.mindir +0 -14
mindspore/ops/bprop_mindir/Tile_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/TopK_bprop.mindir +0 -0
mindspore/ops/bprop_mindir/TransShape_bprop.mindir +0 -23
mindspore/ops/bprop_mindir/TruncateDiv_bprop.mindir +0 -19
mindspore/ops/bprop_mindir/TupleGetItem_bprop.mindir +0 -20
mindspore/ops/bprop_mindir/Unique_bprop.mindir +0 -16
mindspore/ops/bprop_mindir/Unstack_bprop.mindir +0 -22
mindspore/ops/bprop_mindir/UpsampleNearest3D_bprop.mindir +0 -32
mindspore/ops/bprop_mindir/UpsampleTrilinear3D_bprop.mindir +0 -38
mindspore/ops/bprop_mindir/ZerosLike_bprop.mindir +0 -15
mindspore/ops/bprop_mindir/generate_mindir.py +0 -114
mindspore/rewrite/node_visitor.py +0 -44
mindspore/rewrite/topological_manager.py +0 -203
mindspore/scipy/sparse/linalg.py +0 -192
{mindspore-2.0.0rc1.dist-info → mindspore-2.2.0.dist-info}/WHEEL +0 -0
{mindspore-2.0.0rc1.dist-info → mindspore-2.2.0.dist-info}/top_level.txt +0 -0

mindspore/nn/layer/dense.py CHANGED Viewed

@@ -41,8 +41,8 @@ def check_dense_inputs_same_shape(input1, input2, prim_name=None):
 @constexpr(check=False)
 def _check_is_tensor(param_name, input_data, cls_name):
     """Internal function, used to check whether the input data is Tensor."""
-    if input_data is not None and not isinstance(P.typeof(input_data), mstype.tensor_type):
-        raise TypeError(f"For '{cls_name}', the '{param_name}' must be '{mstype.tensor_type}', "
+    if input_data is not None and not isinstance(P.typeof(input_data), mstype.TensorType):
+        raise TypeError(f"For '{cls_name}', the '{param_name}' must be '{mstype.TensorType}', "
                         f"but got '{P.typeof(input_data)}'")
@@ -66,17 +66,18 @@ class BiDense(Cell):
     where :math:`x_{1}` is the first input tensor, :math:`x_{2}` is the second input tensor
     , :math:`A` is a weight matrix with the same data type as the :math:`x_{*}` created by the layer
     , and :math:`b` is a bias vector with the same data type as the :math:`x_{*}` created by the layer
-    (only if has_bias is True).
+    (only if has_bias is ``True`` ).
     Args:
         in1_channels (int): The number of channels in the input1 space.
         in2_channels (int): The number of channels in the input2 space.
         out_channels (int): The number of channels in the output space.
         weight_init (Union[Tensor, str, Initializer, numbers.Number]): The trainable weight_init parameter.
-            The values of str refer to the function `initializer`. Default: None.
+            The values of str refer to the function `initializer`. Default: ``None`` .
         bias_init (Union[Tensor, str, Initializer, numbers.Number]): The trainable bias_init parameter.
-            The values of str refer to the function `initializer`. Default: None.
-        has_bias (bool): Specifies whether the layer uses :math:`\text{bias}` vector. Default: True.
+            The values of str refer to the function `initializer`. Default: ``None`` .
+        has_bias (bool): Specifies whether the layer uses :math:`\text{bias}` vector. Default: ``True`` .
+        dtype (:class:`mindspore.dtype`): Dtype of Parameters. Default: ``mstype.float32`` .
     Shape:
         - **input1** - :math:`(*, H_{in1})` where :math:`H_{in1}=\text{in1_channels}` and
@@ -90,17 +91,17 @@ class BiDense(Cell):
           are the same shape as the inputs.
     Dtype:
-        - **input1** (Tensor) - The dtype must be float16 or float32 and be same as **input2**.
-        - **input1** (Tensor) - The dtype must be float16 or float32 and be same as **input1**.
+        - **input1** (Tensor) - The dtype must be float16 or float32 and be same as **input2** .
+        - **input2** (Tensor) - The dtype must be float16 or float32 and be same as **input1** .
         - **output** (Tensor) - With the same dtype as the inputs.
     Weights:
         - **weight** (Parameter) - The learnable weights with shape
           :math:`(\text{out_channels}, \text{in1_channels}, \text{in2_channels})`.
-          When `weight_init` is `None`, the values are initialized from
+          When `weight_init` is ``None`` , the values are initialized from
           :math:`\mathcal{U}(-\sqrt{k}, \sqrt{k})`, where :math:`k = \frac{1}{\text{in1_channels}}`.
         - **bias** (Parameter) - The learnable bias of shape :math:`(\text{out_channels})`.
-          If `has_bias` is `True` and `bias_init` is `None`, the values are initialized from
+          If `has_bias` is ``True`` and `bias_init` is ``None`` , the values are initialized from
           :math:`\mathcal{U}(-\sqrt{k}, \sqrt{k})`, where :math:`k = \frac{1}{\text{in1_channels}}`.
     Raises:
@@ -116,6 +117,9 @@ class BiDense(Cell):
         ``Ascend`` ``GPU`` ``CPU``
     Examples:
+        >>> import mindspore
+        >>> from mindspore import Tensor, nn
+        >>> import numpy as np
         >>> x1 = Tensor(np.random.randn(128, 20), mindspore.float32)
         >>> x2 = Tensor(np.random.randn(128, 30), mindspore.float32)
         >>> net = nn.BiDense(20, 30, 40)
@@ -130,7 +134,8 @@ class BiDense(Cell):
                  out_channels,
                  weight_init=None,
                  bias_init=None,
-                 has_bias=True):
+                 has_bias=True,
+                 dtype=mstype.float32):
         super().__init__()
         self.in_channels = Validator.check_positive_int(in1_channels, "in1_channels", self.cls_name)
         self.in_channels = Validator.check_positive_int(in2_channels, "in2_channels", self.cls_name)
@@ -153,7 +158,8 @@ class BiDense(Cell):
                                  f"equal to 'in2_channels'. But got 'weight_init': {weight_init}, "
                                  f"'out_channels': {out_channels}, 'in_channels': {in1_channels}, "
                                  f"'in2_channels': {in2_channels}")
-        self.weight = Parameter(initializer(weight_init, (out_channels, in1_channels, in2_channels)), 'weight')
+        self.weight = Parameter(initializer(weight_init, (out_channels, in1_channels, in2_channels), dtype=dtype),
+                                'weight')
         if self.has_bias:
             if bias_init is None:
@@ -163,7 +169,7 @@ class BiDense(Cell):
                     raise ValueError(f"For '{self.cls_name}', bias init shape error. The ndim of 'bias_init' should "
                                      f"be equal to 1, and the first dim must be equal to 'out_channels'. But got "
                                      f"'bias_init': {bias_init}, 'out_channels': {out_channels}.")
-            self.bias = Parameter(initializer(bias_init, [out_channels]), name="bias")
+            self.bias = Parameter(initializer(bias_init, [out_channels], dtype=dtype), name="bias")
             self.bias_add = P.BiasAdd()
         self.matmul = P.MatMul()

mindspore/nn/layer/embedding.py CHANGED Viewed

@@ -62,13 +62,15 @@ class Embedding(Cell):
     Args:
         vocab_size (int): Size of the dictionary of embeddings.
         embedding_size (int): The size of each embedding vector.
-        use_one_hot (bool): Specifies whether to apply one_hot encoding form. Default: False.
+        use_one_hot (bool): Specifies whether to apply one_hot encoding form. Default: ``False`` .
         embedding_table (Union[Tensor, str, Initializer, numbers.Number]): Initializer for the embedding_table.
-            Refer to class `initializer` for the values of string when a string
-            is specified. Default: 'normal'.
-        dtype (:class:`mindspore.dtype`): Data type of `x`. Default: mindspore.float32.
+            Refer to class `mindspore.common.initializer
+            <https://www.mindspore.cn/docs/en/r2.2/api_python/mindspore.common.initializer.html>`_
+            for the values of string when a string is specified. Default: ``'normal'`` .
+        dtype (:class:`mindspore.dtype`): Data type of `x`. Default: ``mstype.float32`` .
         padding_idx (int, None): When the padding_idx encounters index, the output embedding vector of this index
-                                 will be initialized to zero. Default: None. The feature is inactivated.
+                                 will be initialized to zero. Default: ``None`` . The feature is inactivated.
     Inputs:
         - **x** (Tensor) - Tensor of shape :math:`(\text{batch_size}, \text{x_length})`. The elements of
           the Tensor must be integer and not larger than vocab_size. Otherwise the corresponding embedding vector will
@@ -86,6 +88,9 @@ class Embedding(Cell):
         ``Ascend`` ``GPU`` ``CPU``
     Examples:
+        >>> import mindspore
+        >>> from mindspore import Tensor, nn
+        >>> import numpy as np
         >>> net = nn.Embedding(20000, 768,  True)
         >>> x = Tensor(np.ones([8, 128]), mindspore.int32)
         >>> # Maps the input word IDs to word embedding.
@@ -126,13 +131,10 @@ class Embedding(Cell):
         self.array_mul = P.MatMul()
         self.reshape = P.Reshape()
         self.get_shp = P.Shape()
-        self.get_tensor_shp = P.TensorShape()
         self.concat = P.Concat()
     def construct(self, ids):
         out_shape = self.get_shp(ids) + (self.embedding_size,)
-        if F.is_sequence_value_unknown(self.get_shp(ids)):
-            out_shape = self.concat((self.get_tensor_shp(ids), Tensor([self.embedding_size])))
         flat_ids = self.reshape_flat(ids, self.shp_flat)
         if self.use_one_hot:
@@ -145,12 +147,11 @@ class Embedding(Cell):
         return output
     def extend_repr(self):
-        s = 'vocab_size={}, embedding_size={}, use_one_hot={}, embedding_table={}, dtype={}, padding_idx={}'.format(
-            self.vocab_size, self.embedding_size, self.use_one_hot, self.embedding_table, self.dtype, self.padding_idx)
-        return s
+        return f'vocab_size={self.vocab_size}, embedding_size={self.embedding_size}, use_one_hot={self.use_one_hot}, ' \
+            f'embedding_table={self.embedding_table}, dtype={self.dtype}, padding_idx={self.padding_idx}'
-@constexpr
+@_primexpr
 def _make_axis_range(start, end):
     axis = tuple(range(start, end))
     return axis
@@ -177,19 +178,20 @@ class EmbeddingLookup(Cell):
         embedding_size (int): The size of each embedding vector.
         param_init (Union[Tensor, str, Initializer, numbers.Number]): Initializer for the embedding_table.
             Refer to class `initializer` for the values of string when a string
-            is specified. Default: 'normal'.
+            is specified. Default: ``'normal'`` .
         target (str): Specifies the target where the op is executed. The value must in
-            ['DEVICE', 'CPU']. Default: 'CPU'.
+            [ ``'DEVICE'`` , ``'CPU'`` ]. Default: ``'CPU'`` .
         slice_mode (str): The slicing way in semi_auto_parallel/auto_parallel. The value must get through
-            :class:`mindspore.nn.EmbeddingLookup`. Default: 'nn.EmbeddingLookup.BATCH_SLICE'.
-        manual_shapes (tuple): The accompaniment array in field slice mode. Default: None.
+            :class:`mindspore.nn.EmbeddingLookup`. Default: ``'batch_slice'`` .
+        manual_shapes (tuple): The accompaniment array in field slice mode. Default: ``None`` .
         max_norm (Union[float, None]): A maximum clipping value. The data type must be float16, float32
-                                       or None. Default: None
-        sparse (bool): Using sparse mode. When 'target' is set to 'CPU', 'sparse' has to be true. Default: True.
-        vocab_cache_size (int): Cache size of the dictionary of embeddings. Default: 0. It is valid only in
+                                       or None. Default: ``None`` .
+        sparse (bool): Using sparse mode. When 'target' is set to 'CPU', 'sparse' has to be true. Default: ``True`` .
+        vocab_cache_size (int): Cache size of the dictionary of embeddings. Default: ``0`` . It is valid only in
             parameter server trainning mode and 'DEVICE' target. And the moment parameter of corresponding
             optimizer will also be set to the cache size. In addition, it should be noted that it will cost the 'DEVICE'
             memory, so suggests setting a reasonable value to avoid insufficient memory.
+        dtype (:class:`mindspore.dtype`): Dtype of Parameters. Default: ``mstype.float32`` .
     Inputs:
         - **input_indices** (Tensor) - The shape of tensor is :math:`(y_1, y_2, ..., y_S)`.
@@ -216,6 +218,9 @@ class EmbeddingLookup(Cell):
         ``Ascend`` ``GPU`` ``CPU``
     Examples:
+        >>> import mindspore
+        >>> from mindspore import Tensor, nn
+        >>> import numpy as np
         >>> input_indices = Tensor(np.array([[1, 0], [3, 2]]), mindspore.int32)
         >>> result = nn.EmbeddingLookup(4,2)(input_indices)
         >>> print(result.shape)
@@ -228,7 +233,7 @@ class EmbeddingLookup(Cell):
     def __init__(self, vocab_size, embedding_size, param_init='normal',
                  target='CPU', slice_mode='batch_slice', manual_shapes=None,
-                 max_norm=None, sparse=True, vocab_cache_size=0):
+                 max_norm=None, sparse=True, vocab_cache_size=0, dtype=mstype.float32):
         """Initialize EmbeddingLookup."""
         super(EmbeddingLookup, self).__init__()
         Validator.check_value_type('sparse', sparse, [bool], self.cls_name)
@@ -252,8 +257,8 @@ class EmbeddingLookup(Cell):
         if enable_ps:
             self._process_vocab_cache(slice_mode)
         self.embedding_size = Validator.check_positive_int(embedding_size, 'embedding_size', self.cls_name)
-        self.embedding_table = Parameter(initializer(param_init, [self.vocab_size, self.embedding_size]),
-                                         name='embedding_table')
+        self.embedding_table = Parameter(initializer(param_init, [self.vocab_size, self.embedding_size],
+                                                     dtype=dtype), name='embedding_table')
         parallel_mode = _get_parallel_mode()
         is_auto_parallel = parallel_mode in (ParallelMode.SEMI_AUTO_PARALLEL, ParallelMode.AUTO_PARALLEL)
         self.gather_revert = P.Gather()
@@ -264,7 +269,7 @@ class EmbeddingLookup(Cell):
         if is_auto_parallel:
             self.unique = P.Unique().shard(((1,),))
         if self.cache_enable and enable_ps:
-            self._set_voacb_cache_enable_for_ps(vocab_cache_size, embedding_size, vocab_size, param_init)
+            self._set_voacb_cache_enable_for_ps(vocab_cache_size, embedding_size, vocab_size, param_init, dtype=dtype)
             if is_auto_parallel:
                 self.unique.add_prim_attr('cache_enable', True)
         indices_shape_size = 2
@@ -300,15 +305,15 @@ class EmbeddingLookup(Cell):
             self.embeddinglookup.shard(((1, get_group_size()), indices_strategy))
         elif slice_mode == "batch_slice" and is_auto_parallel:
             indices_strategy = [get_group_size()]
-            indices_strategy.extend([1]*(indices_shape_size - 1))
+            indices_strategy.extend([1] * (indices_shape_size - 1))
             indices_strategy = tuple(indices_strategy)
             self.gatherv2.shard(((1, 1), indices_strategy))
             self.embeddinglookup.shard(((1, 1), indices_strategy))
         else:
             if is_auto_parallel:
                 support_mode = ["field_slice", "table_row_slice", "table_column_slice", "batch_slice"]
-                raise ValueError("For '{}', the 'slice_mode' must be in {}, "
-                                 "but got \"{}\".".format(self.cls_name, support_mode, slice_mode))
+                raise ValueError(f"For '{self.cls_name}', the 'slice_mode' must be in {support_mode}, "
+                                 f"but got \"{slice_mode}\".")
         if self.cache_enable and not enable_ps:
             raise ValueError(f"For '{self.cls_name}', haven't supported cache enable for not ps mode.")
         self.embedding_table.unique = self.forward_unique
@@ -351,7 +356,8 @@ class EmbeddingLookup(Cell):
             if _is_role_worker():
                 self.vocab_size = self.vocab_cache_size
-    def _set_voacb_cache_enable_for_ps(self, vocab_cache_size, embedding_size, vocab_size, param_init):
+    def _set_voacb_cache_enable_for_ps(self, vocab_cache_size, embedding_size, vocab_size, param_init,
+                                       dtype=mstype.float32):
         """PS embeddingLookup cache enable set."""
         if self.sparse:
             self.forward_unique = True
@@ -365,10 +371,10 @@ class EmbeddingLookup(Cell):
         if _enable_distributed_mindrt():
             self.rank_id = get_rank()
             if self.is_ps_server:
-                self._slice_pserver_embeddings("zeros")
+                self._slice_pserver_embeddings("zeros", dtype=dtype)
                 self._set_cache_enable_and_key_for_pserver(param_key)
-    def _slice_pserver_embeddings(self, param_init):
+    def _slice_pserver_embeddings(self, param_init, dtype=mstype.float32):
         '''
         Method to slice embedding tables on Parameter Servers.
         It helps to train with a large scale embedding table and is used only in Parameter Server training mode.
@@ -396,7 +402,7 @@ class EmbeddingLookup(Cell):
         for i in range(server_num):
             self.embedding_table_list.append(Parameter(initializer(param_init,
                                                                    [self.embedding_table_vocab_dim_list[i],
-                                                                    self.embedding_size]),
+                                                                    self.embedding_size], dtype=dtype),
                                                        name="embedding_table_server_" + str(i)))
             self.embedding_offset.append(offset)
@@ -495,17 +501,20 @@ class MultiFieldEmbeddingLookup(EmbeddingLookup):
         field_size (int): The field size of the final outputs.
         param_init (Union[Tensor, str, Initializer, numbers.Number]): Initializer for the embedding_table.
             Refer to class `initializer` for the values of string when a string
-            is specified. Default: 'normal'.
+            is specified. Default: ``'normal'`` .
         target (str): Specifies the target where the op is executed. The value must in
-            ['DEVICE', 'CPU']. Default: 'CPU'.
+            [ ``'DEVICE'`` , ``'CPU'`` ]. Default: ``'CPU'`` .
         slice_mode (str): The slicing way in semi_auto_parallel/auto_parallel. The value must get through
-            :class:`mindspore.nn.EmbeddingLookup`. Default: 'nn.EmbeddingLookup.BATCH_SLICE'.
-        feature_num_list (tuple): The accompaniment array in field slice mode. This is unused currently. Default: None.
-        max_norm (Union[float, None]): A maximum clipping value. The data type must be float16, float32
-                                       or None. Default: None
-        sparse (bool): Using sparse mode. When 'target' is set to 'CPU', 'sparse' has to be true. Default: True.
-        operator (str): The pooling method for the features in one field. Support 'SUM', 'MEAN' and 'MAX'.
-            Default: 'SUM'.
+            :class:`mindspore.nn.EmbeddingLookup`. Default: ``'batch_slice'``.
+        feature_num_list (tuple): The accompaniment array in field slice mode. This is unused currently.
+            Default:  ``None`` .
+        max_norm (Union[float, None]): A maximum clipping value. The data type must be float16, float32.
+            Default: ``None`` .
+        sparse (bool): Using sparse mode. When 'target' is set to ``'CPU'`` , 'sparse' has to be true.
+            Default: ``True`` .
+        operator (str): The pooling method for the features in one field. Support ``'SUM'`` , ``'MEAN'`` and
+            ``'MAX'`` . Default: ``'SUM'`` .
+        dtype (:class:`mindspore.dtype`): Dtype of Parameters. Default: ``mstype.float32`` .
     Inputs:
         - **input_indices** (Tensor) - The shape of tensor is :math:`(batch\_size, seq\_length)`.
@@ -524,17 +533,19 @@ class MultiFieldEmbeddingLookup(EmbeddingLookup):
         TypeError: If `vocab_size` or `embedding_size` or `field_size` is not an int.
         TypeError: If `sparse` is not a bool or `feature_num_list` is not a tuple.
         ValueError: If `vocab_size` or `embedding_size` or `field_size` is less than 1.
-        ValueError: If `target` is neither 'CPU' nor 'DEVICE'.
-        ValueError: If `slice_mode` is not one of 'batch_slice', 'field_slice', 'table_row_slice',
-                    'table_column_slice'.
-        ValueError: If `sparse` is False and `target` is 'CPU'.
-        ValueError: If `slice_mode` is 'field_slice' and `feature_num_list` is None.
-        ValueError: If `operator` is not one of 'SUM', 'MAX', 'MEAN'.
+        ValueError: If `target` is neither ``'CPU'`` nor ``'DEVICE'``.
+        ValueError: If `slice_mode` is not one of ``'batch_slice'``, ``'field_slice'``, ``'table_row_slice'``,
+                    ``'table_column_slice'`` .
+        ValueError: If `sparse` is False and `target` is ``'CPU'`` .
+        ValueError: If `slice_mode` is ``'field_slice'`` and `feature_num_list` is None.
+        ValueError: If `operator` is not one of ``'SUM'``, ``'MAX'``, ``'MEAN'`` .
     Supported Platforms:
         ``Ascend`` ``GPU``
     Examples:
+        >>> import mindspore
+        >>> from mindspore import Tensor, nn
         >>> input_indices = Tensor([[2, 4, 6, 0, 0], [1, 3, 5, 0, 0]], mindspore.int32)
         >>> input_values = Tensor([[1, 1, 1, 0, 0], [1, 1, 1, 0, 0]], mindspore.float32)
         >>> field_ids = Tensor([[0, 1, 1, 0, 0], [0, 0, 1, 0, 0]], mindspore.int32)
@@ -548,10 +559,11 @@ class MultiFieldEmbeddingLookup(EmbeddingLookup):
     OPERATOR_MAX = 'MAX'
     def __init__(self, vocab_size, embedding_size, field_size, param_init='normal', target='CPU',
-                 slice_mode='batch_slice', feature_num_list=None, max_norm=None, sparse=True, operator='SUM'):
+                 slice_mode='batch_slice', feature_num_list=None, max_norm=None, sparse=True, operator='SUM',
+                 dtype=mstype.float32):
         """Initialize MultiFieldEmbeddingLookup."""
         super(MultiFieldEmbeddingLookup, self).__init__(vocab_size, embedding_size, param_init, target,
-                                                        slice_mode, feature_num_list, max_norm, sparse)
+                                                        slice_mode, feature_num_list, max_norm, sparse, dtype=dtype)
         self.field_size = Validator.check_positive_int(field_size, 'field_size', self.cls_name)
         self.operator = operator
@@ -615,8 +627,9 @@ class MultiFieldEmbeddingLookup(EmbeddingLookup):
                 self.inf_add.shard(((1, 1, get_group_size()), (1, 1, 1)))
         else:
             if is_auto_parallel:
-                raise ValueError("For '{}', the 'slice_mode' must be in ['table_row_slice', 'batch_slice' and \
-                                       'table_column_slice'], but got {}".format(self.cls_name, str(slice_mode)))
+                raise ValueError(
+                    f"For '{self.cls_name}', the 'slice_mode' must be in ['table_row_slice', 'batch_slice' "
+                    f"and 'table_column_slice'], but got {str(slice_mode)}.")
         # Min value for fp32
         self.negative_inf_value = -3.402823466E+38

mindspore/nn/layer/flash_attention.py ADDED Viewed

@@ -0,0 +1,264 @@
+# Copyright 2023 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+"""
+A FlashAttention Layer.
+"""
+import math
+import mindspore.common.dtype as mstype
+from mindspore.common.tensor import Tensor
+from mindspore import ops
+from mindspore.nn.cell import Cell
+from mindspore.ops._op_impl._custom_op.flash_attention.flash_attention_impl import get_flash_attention
+from mindspore.ops.operations.nn_ops import FlashAttentionScore
+from mindspore._c_expression import MSContext
+__all__ = ['FlashAttention']
+class FlashAttention(Cell):
+    """Flash Attention Layer.
+    This function contains the flash attention primitives used in FlashAttention (see paper)
+    `FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness <https://arxiv.org/pdf/2205.14135.pdf>`
+    Specifically, it includes the following:
+    1. An interface for calling flashattention operation.
+    2. Two configuration parameters for enabling local block sparse of flashattention.
+    Args:
+        head_dim(int): The hidden size of input.
+        dropout_rate(float): The dropout rate of the attention score. Default 0.0.
+        prev_block_num(int): A integer to define the number of blocks to look ahead for local block sparse attention.
+            Default 65536.
+        next_block_num(int): A integer to define the number of blocks to look behind for local block sparse attention.
+            Default 65536.
+        tiling_stgy_name(str): A str to define tiling strategy of flash attention.
+        dp(int): data parallel.
+            Default 1.
+        mp(int): model parallel.
+            Default 1.
+        high_precision(bool): This mode has higher precision but some performance loss.
+            Default False.
+        have_attention_mask_batch(bool): indicates whether attention_mask contains the batch dimension.
+            Default True
+        alibi(bool): This parameter indicates whether the flashattention supports the Alibi.
+            Default: False
+    Inputs:
+      - **query** (Tensor) - Tensor query (:class:`mstype.fp16` [batch_size, head_num, seq_length, head_dim])
+      - **key** (Tensor) - Tensor key (:class:`mstype.fp16` [batch_size, head_num, seq_length, head_dim])
+      - **value** (Tensor) - Tensor value (:class:`mstype.fp16` [batch_size, head_num, seq_length, head_dim])
+      - **attention_mask** (Tensor) - Float Tensor the mask of (:class:`mstype.fp16` [batch_size, seq_length,
+          seq_length]): A matrix to pass masked information.
+    Outputs:
+        A Tensor. The output of the attention with shape [batch_size, head_num, seq_length, head_dim]
+    Supported Platforms:
+        ``Ascend``
+    Examples:
+        >>> import numpy as np
+        >>> from mindspore import dtype as mstype
+        >>> from mindspore.nn.layer.flash_attention import FlashAttention
+        >>> from mindspore import Tensor
+        >>> model = FlashAttention(head_dim=128,
+        ...                        dropout_rate=0.1,
+        ...                        prev_block_num=7,
+        ...                        next_block_num=0
+        ...                        )
+        >>> query = Tensor(np.ones((2, 16, 4096, 128)), mstype.float16)
+        >>> key = Tensor(np.ones((2, 16, 4096, 128)), mstype.float16)
+        >>> value = Tensor(np.ones((2, 16, 4096, 128)), mstype.float16)
+        >>> attention_mask = Tensor(np.ones((2, 4096, 4096)), mstype.float16)
+        >>> output = model(query, key, value, attention_mask)
+        >>> print(output.shape)
+        (2, 16, 4096, 128)
+    """
+    def __init__(self,
+                 head_dim,
+                 head_num,
+                 dropout_rate=0.0,
+                 prev_block_num=65536,
+                 next_block_num=65536,
+                 tiling_stgy_name="sparse",
+                 dp=1,
+                 mp=1,
+                 high_precision=False,
+                 have_attention_mask_batch=True,
+                 alibi=False
+                 ):
+        super(FlashAttention, self).__init__()
+        scaling_constant = math.sqrt(head_dim)
+        if scaling_constant == 0:
+            raise ValueError("the scaling constant must not be 0.")
+        self.scale_factor = Tensor([1. / scaling_constant], dtype=mstype.float16)
+        self.is_910A = MSContext.get_instance().get_ascend_soc_version() == "Ascend910"
+        if self.is_910A:
+            self.flash_attention = get_flash_attention(
+                prev_block_num=prev_block_num,
+                next_block_num=next_block_num,
+                tiling_stgy_name=tiling_stgy_name,
+                high_precision=high_precision
+            )
+            self.flash_attention.add_prim_attr("primitive_target", "Ascend")
+        else:
+            if alibi:
+                raise ValueError(f"When soc_version is not Ascend910A, alibi must be False")
+            self.transpose_4d_pre = ops.Transpose().shard(((dp, mp, 1, 1),))
+            self.transpose_4d_post = ops.Transpose().shard(((dp, 1, mp, 1),))
+            self.reshape = ops.Reshape()
+            self.zeros_like = ops.ZerosLike().shard(((dp, mp, 1, 1),))
+            self.zeros = ops.Zeros()
+            self.attn_expand_dims = ops.ExpandDims().shard(((dp, 1, 1),))
+            fa_strategies = ((dp, 1, mp),
+                             (dp, 1, mp),
+                             (dp, 1, mp),
+                             (dp, 1, 1, 1))
+            if dropout_rate > 1e-5:
+                fa_strategies += ((dp, mp, 1, 1),)
+            self.flash_attention = FlashAttentionScore(head_num=head_num, pre_tokens=prev_block_num,
+                                                       next_tokens=next_block_num,
+                                                       keep_prob=1 - dropout_rate,
+                                                       scale_value=1.0,
+                                                       inner_precise=0 if high_precision else 1).shard(fa_strategies)
+        self.ones = ops.Ones()
+        self.dim_mask = Tensor([1 for _ in range(head_dim)], dtype=mstype.int8)
+        self.scale_mul = ops.Mul().shard(((dp, mp, 1, 1), (1,)))
+        self.dropout_rate = dropout_rate
+        self.have_attention_mask_batch = have_attention_mask_batch
+        self.alibi = alibi
+        if self.dropout_rate > 1e-5:
+            self.keep_prob = Tensor(1 - self.dropout_rate, dtype=mstype.float16)
+            self.fill_v2 = ops.FillV2().shard(((dp, mp, 1, 1), ()))
+            self.tensor_one = Tensor(1.0, mstype.float16)
+            self.drop_gen_mask = ops.DropoutGenMask()
+            self.do_dropout = ops.DropoutDoMask().shard(((dp, mp, 1, 1),))
+            self.depend = ops.Depend()
+    def shard(self, in_strategy=None, out_strategy=None):
+        """Distributed configuration of FlashAttention
+        :param in_strategy: Describe the split strategy of operator input. Default: None.
+        :param out_strategy: Describe the split strategy of operator output, it is only for certain operators,
+                                  such as MatMul. Default: None.
+        :return:
+        """
+        if in_strategy is None:
+            # default: dp=1, mp=1, construct inputs only contain query, key, value
+            in_strategy = (
+                (1, 1, 1, 1),
+                (1, 1, 1, 1),
+                (1, 1, 1, 1),
+            )
+        self.flash_attention.shard(in_strategy)
+        dp = in_strategy[0][0]
+        mp = in_strategy[0][1]
+        self.flash_attention.add_prim_attr("dev_matrix_shape", [dp, mp, 1, 1])
+        inputs_tensor_map = [
+            [3, 2, 1, 0],
+            [3, 2, 1, 0],
+            [3, 2, 1, 0],
+        ]
+        if self.have_attention_mask_batch:
+            inputs_tensor_map.append([3, 1, 0])
+        else:
+            inputs_tensor_map.append([-1, 1, 0])
+        input_empty_args_num = 2
+        # dropout_mask
+        if self.dropout_rate > 1e-5:
+            input_empty_args_num -= 1
+            inputs_tensor_map.append([3, 2, 1, 0])
+        if self.alibi:
+            input_empty_args_num -= 1
+            inputs_tensor_map.append([3, 2, 1, 0])
+        self.flash_attention.add_prim_attr("inputs_tensor_map", inputs_tensor_map)
+        self.flash_attention.add_prim_attr("outputs_tensor_map", [
+            [3, 2, 1, 0],  # O
+            [3, 2, 1],  # L
+            [3, 2, 1]  # M
+        ])
+        self.flash_attention.add_prim_attr("as_loss_divisor", 0)
+        self.flash_attention.add_prim_attr("empty_mirror_ops", input_empty_args_num)
+    def construct(self, query, key, value, attn_mask=None, alibi_mask=None):
+        """FlashAttention forward
+        :param query:           [bsz, head_num, seq_len, head_dim]
+        :param key:           [bsz, head_num, seq_len, head_dim]
+        :param value:           [bsz, head_num, seq_len, head_dim]
+        :param attn_mask:   [1 or bsz, seq_len, seq_len], if not None
+        :param alibi_mask: [bsz, head_num, 1, seq_len], if not None
+        :return: output          [bsz, head_num, seq_len, head_dim]
+        """
+        query = self.scale_mul(query, self.scale_factor)
+        bsz, head_num, seq_len, head_dim = query.shape
+        _, k_head_num, k_seq_len, _ = key.shape
+        _, v_head_num, v_seq_len, _ = value.shape
+        if head_num != k_head_num or head_num != v_head_num:
+            raise ValueError(
+                "the head_num of query, key and value must be the same, "
+                "If different head_num are used, users need to change themselves to be same by tile.")
+        if seq_len % 16 != 0 or k_seq_len % 16 != 0 or k_seq_len != v_seq_len:
+            raise ValueError(
+                "query, key, value seq_len must be a multiple of 16, and key seq_len, value seq_len must be the same.")
+        if head_dim > 304:
+            raise ValueError(
+                "the head_dim must be less than 304, otherwise the ub would be OOM.")
+        if self.is_910A:
+            # 910A -- FlashAttentionPrimtive
+            if self.dropout_rate > 1e-5:
+                drop_mask_bits = self.drop_gen_mask((bsz, head_num, seq_len, seq_len), self.keep_prob)
+                tensor_shape = Tensor((bsz, head_num, seq_len, seq_len), mstype.int32)
+                ones = self.fill_v2(tensor_shape, self.tensor_one)
+                ones = self.depend(ones, query)
+                drop_mask = self.do_dropout(ones, drop_mask_bits, self.keep_prob)
+            else:
+                drop_mask = None
+            output, _, _ = self.flash_attention(query, key, value, attn_mask, drop_mask, alibi_mask)
+        else:
+            # FlashAttentionScore
+            # Useless input, just for binary calls.
+            if self.dropout_rate > 1e-5:
+                drop_mask_bits = self.reshape(self.drop_gen_mask((bsz, head_num, seq_len, seq_len), self.keep_prob),
+                                              (bsz, head_num, seq_len, seq_len // 8))
+            else:
+                drop_mask_bits = None
+            # (B, N, S, D) -> (B, S, H)
+            query = self.reshape(self.transpose_4d_pre(query, (0, 2, 1, 3)), (bsz, seq_len, -1))
+            key = self.reshape(self.transpose_4d_pre(key, (0, 2, 1, 3)), (bsz, seq_len, -1))
+            value = self.reshape(self.transpose_4d_pre(value, (0, 2, 1, 3)), (bsz, seq_len, -1))
+            attn_mask = self.attn_expand_dims(attn_mask, 1)
+            output, _, _ = self.flash_attention(query,
+                                                key,
+                                                value,
+                                                attn_mask,
+                                                drop_mask_bits,
+                                                None,
+                                                None)
+            output = self.transpose_4d_post(self.reshape(output, (bsz, seq_len, head_num, head_dim)), (0, 2, 1, 3))
+        return output