PyPI - mindspore - Versions diffs - 2.6.0__cp310-cp310-win_amd64.whl → 2.7.0__cp310-cp310-win_amd64.whl - Mend

mindspore 2.6.0__cp310-cp310-win_amd64.whl → 2.7.0__cp310-cp310-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mindspore might be problematic. Click here for more details.

Files changed (455) hide show

mindspore/.commit_id +1 -1
mindspore/Microsoft.VisualStudio.Telemetry.dll +0 -0
mindspore/Newtonsoft.Json.dll +0 -0
mindspore/__init__.py +2 -2
mindspore/_c_dataengine.cp310-win_amd64.pyd +0 -0
mindspore/_c_expression.cp310-win_amd64.pyd +0 -0
mindspore/_c_mindrecord.cp310-win_amd64.pyd +0 -0
mindspore/_checkparam.py +42 -11
mindspore/_extends/builtin_operations.py +3 -3
mindspore/{_deprecated → _extends/optimize}/__init__.py +9 -3
mindspore/_extends/optimize/cell_utils.py +96 -0
mindspore/_extends/parallel_compile/akg_compiler/custom.py +1109 -0
mindspore/_extends/parallel_compile/akg_compiler/gen_custom_op_files.py +1 -1
mindspore/_extends/parse/__init__.py +3 -3
mindspore/_extends/parse/compile_config.py +44 -22
mindspore/_extends/parse/deprecated/deprecated_tensor_method.py +1 -2
mindspore/_extends/parse/parser.py +64 -83
mindspore/_extends/parse/resources.py +39 -0
mindspore/_extends/parse/standard_method.py +47 -14
mindspore/_extends/parse/trope.py +8 -1
mindspore/_extends/pijit/__init__.py +1 -2
mindspore/_extends/pijit/pijit_func_white_list.py +2 -5
mindspore/amp.py +4 -22
mindspore/atlprov.dll +0 -0
mindspore/avcodec-59.dll +0 -0
mindspore/avdevice-59.dll +0 -0
mindspore/avfilter-8.dll +0 -0
mindspore/avformat-59.dll +0 -0
mindspore/avutil-57.dll +0 -0
mindspore/boost/adasum.py +1 -1
mindspore/boost/boost_cell_wrapper.py +4 -4
mindspore/c1.dll +0 -0
mindspore/c1xx.dll +0 -0
mindspore/c2.dll +0 -0
mindspore/common/__init__.py +43 -12
mindspore/common/_grad_function.py +2 -1
mindspore/common/_pijit_context.py +28 -7
mindspore/common/_stub_tensor.py +1 -209
mindspore/common/_tensor_cpp_method.py +1 -1
mindspore/common/_tensor_docs.py +177 -52
mindspore/common/_utils.py +9 -1
mindspore/common/api.py +338 -208
mindspore/common/dtype.py +108 -57
mindspore/common/dump.py +11 -16
mindspore/common/dynamic_shape/__init__.py +0 -0
mindspore/common/{auto_dynamic_shape.py → dynamic_shape/auto_dynamic_shape.py} +17 -23
mindspore/common/dynamic_shape/enable_dynamic.py +197 -0
mindspore/common/file_system.py +59 -9
mindspore/common/generator.py +2 -3
mindspore/common/hook_handle.py +33 -5
mindspore/common/jit_config.py +1 -1
mindspore/common/jit_trace.py +84 -105
mindspore/common/np_dtype.py +3 -3
mindspore/common/parameter.py +27 -29
mindspore/common/recompute.py +5 -7
mindspore/common/sparse_tensor.py +0 -3
mindspore/common/symbol.py +0 -1
mindspore/common/tensor.py +84 -133
mindspore/communication/_comm_helper.py +46 -4
mindspore/communication/management.py +79 -7
mindspore/context.py +47 -38
mindspore/dataset/__init__.py +1 -1
mindspore/dataset/audio/transforms.py +1 -1
mindspore/dataset/core/config.py +38 -4
mindspore/dataset/engine/datasets.py +350 -322
mindspore/dataset/engine/datasets_user_defined.py +69 -23
mindspore/dataset/engine/iterators.py +2 -2
mindspore/dataset/engine/obs/config_loader.py +2 -2
mindspore/dataset/engine/obs/obs_mindrecord_dataset.py +8 -0
mindspore/dataset/transforms/c_transforms.py +2 -2
mindspore/dataset/transforms/py_transforms.py +7 -3
mindspore/dataset/transforms/transforms.py +10 -6
mindspore/dataset/vision/__init__.py +1 -1
mindspore/dataset/vision/py_transforms.py +8 -8
mindspore/dataset/vision/transforms.py +17 -5
mindspore/dataset/vision/utils.py +632 -21
mindspore/dataset/vision/validators.py +1 -0
mindspore/device_context/ascend/device.py +1 -1
mindspore/device_context/ascend/op_tuning.py +35 -1
mindspore/device_context/gpu/__init__.py +2 -2
mindspore/device_context/gpu/device.py +1 -1
mindspore/device_context/gpu/op_precision.py +4 -2
mindspore/device_context/gpu/op_tuning.py +6 -3
mindspore/device_manager.py +16 -9
mindspore/dnnl.dll +0 -0
mindspore/dpcmi.dll +0 -0
mindspore/experimental/llm_boost/ascend_native/llama_boost_ascend_native.py +5 -4
mindspore/experimental/llm_boost/atb/boost_base.py +2 -3
mindspore/experimental/optim/adadelta.py +13 -20
mindspore/experimental/optim/adagrad.py +15 -22
mindspore/experimental/optim/adam.py +17 -24
mindspore/experimental/optim/adamax.py +14 -22
mindspore/experimental/optim/adamw.py +28 -34
mindspore/experimental/optim/asgd.py +15 -25
mindspore/experimental/optim/lr_scheduler.py +27 -45
mindspore/experimental/optim/nadam.py +14 -24
mindspore/experimental/optim/optimizer.py +13 -23
mindspore/experimental/optim/radam.py +18 -24
mindspore/experimental/optim/rmsprop.py +14 -25
mindspore/experimental/optim/rprop.py +15 -26
mindspore/experimental/optim/sgd.py +9 -19
mindspore/hal/__init__.py +4 -4
mindspore/hal/contiguous_tensors_handle.py +2 -2
mindspore/hal/memory.py +1 -0
mindspore/include/api/cell.h +65 -5
mindspore/include/api/cfg.h +24 -7
mindspore/include/api/context.h +1 -0
mindspore/include/api/delegate.h +10 -2
mindspore/include/api/dual_abi_helper.h +100 -19
mindspore/include/api/graph.h +14 -1
mindspore/include/api/kernel.h +16 -3
mindspore/include/api/kernel_api.h +9 -1
mindspore/include/api/metrics/accuracy.h +9 -0
mindspore/include/api/model.h +8 -1
mindspore/include/api/model_group.h +4 -0
mindspore/include/api/model_parallel_runner.h +2 -0
mindspore/include/api/status.h +48 -10
mindspore/include/api/types.h +8 -3
mindspore/include/c_api/model_c.h +0 -58
mindspore/include/c_api/tensor_c.h +0 -26
mindspore/include/dataset/constants.h +9 -0
mindspore/include/dataset/vision_ascend.h +1 -1
mindspore/jpeg62.dll +0 -0
mindspore/mindrecord/tools/cifar10.py +61 -11
mindspore/mindrecord/tools/cifar10_to_mr.py +5 -0
mindspore/mindspore_backend_common.dll +0 -0
mindspore/mindspore_backend_manager.dll +0 -0
mindspore/mindspore_common.dll +0 -0
mindspore/mindspore_core.dll +0 -0
mindspore/mindspore_cpu_res_manager.dll +0 -0
mindspore/mindspore_dump.dll +0 -0
mindspore/mindspore_frontend.dll +0 -0
mindspore/mindspore_glog.dll +0 -0
mindspore/mindspore_memory_pool.dll +0 -0
mindspore/mindspore_ms_backend.dll +0 -0
mindspore/mindspore_ops.dll +0 -0
mindspore/mindspore_ops_host.dll +0 -0
mindspore/mindspore_ops_kernel_common.dll +0 -0
mindspore/mindspore_profiler.dll +0 -0
mindspore/mindspore_pyboost.dll +0 -0
mindspore/mindspore_pynative.dll +0 -0
mindspore/mindspore_res_manager.dll +0 -0
mindspore/mindspore_runtime_pipeline.dll +0 -0
mindspore/mint/__init__.py +4 -44
mindspore/mint/distributed/__init__.py +5 -0
mindspore/mint/distributed/distributed.py +425 -19
mindspore/mint/nn/__init__.py +1 -1
mindspore/mint/nn/functional.py +53 -6
mindspore/mint/nn/layer/_functions.py +163 -294
mindspore/mint/nn/layer/activation.py +8 -6
mindspore/mint/nn/layer/conv.py +125 -101
mindspore/mint/nn/layer/normalization.py +11 -25
mindspore/mint/optim/adam.py +19 -18
mindspore/mint/optim/adamw.py +14 -8
mindspore/mint/optim/sgd.py +5 -5
mindspore/msobj140.dll +0 -0
mindspore/mspdb140.dll +0 -0
mindspore/mspdbcore.dll +0 -0
mindspore/mspdbst.dll +0 -0
mindspore/mspft140.dll +0 -0
mindspore/msvcdis140.dll +0 -0
mindspore/msvcp140_1.dll +0 -0
mindspore/msvcp140_2.dll +0 -0
mindspore/msvcp140_atomic_wait.dll +0 -0
mindspore/msvcp140_codecvt_ids.dll +0 -0
mindspore/nn/cell.py +488 -620
mindspore/nn/grad/cell_grad.py +11 -12
mindspore/nn/layer/activation.py +36 -36
mindspore/nn/layer/basic.py +74 -77
mindspore/nn/layer/channel_shuffle.py +4 -4
mindspore/nn/layer/combined.py +4 -2
mindspore/nn/layer/conv.py +86 -85
mindspore/nn/layer/dense.py +9 -7
mindspore/nn/layer/embedding.py +50 -52
mindspore/nn/layer/image.py +38 -40
mindspore/nn/layer/math.py +111 -112
mindspore/nn/layer/normalization.py +56 -44
mindspore/nn/layer/pooling.py +58 -63
mindspore/nn/layer/rnn_cells.py +33 -33
mindspore/nn/layer/rnns.py +56 -56
mindspore/nn/layer/thor_layer.py +74 -73
mindspore/nn/layer/transformer.py +11 -1
mindspore/nn/learning_rate_schedule.py +20 -20
mindspore/nn/loss/loss.py +79 -81
mindspore/nn/optim/adam.py +2 -4
mindspore/nn/optim/adasum.py +2 -2
mindspore/nn/optim/lamb.py +1 -3
mindspore/nn/optim/optimizer.py +1 -1
mindspore/nn/optim/tft_wrapper.py +2 -3
mindspore/nn/optim/thor.py +2 -2
mindspore/nn/probability/distribution/_utils/utils.py +2 -2
mindspore/nn/probability/distribution/exponential.py +2 -1
mindspore/nn/probability/distribution/poisson.py +2 -1
mindspore/nn/sparse/sparse.py +3 -3
mindspore/nn/wrap/cell_wrapper.py +73 -42
mindspore/nn/wrap/grad_reducer.py +37 -52
mindspore/nn/wrap/loss_scale.py +72 -74
mindspore/numpy/array_creations.py +7 -7
mindspore/numpy/fft.py +1 -1
mindspore/numpy/math_ops.py +1 -1
mindspore/numpy/utils_const.py +1 -1
mindspore/opencv_core452.dll +0 -0
mindspore/opencv_imgcodecs452.dll +0 -0
mindspore/opencv_imgproc452.dll +0 -0
mindspore/ops/_grad_experimental/grad_comm_ops.py +51 -13
mindspore/ops/_grad_experimental/grad_debug_ops.py +14 -0
mindspore/ops/_grad_experimental/grad_inner_ops.py +0 -9
mindspore/ops/_op_impl/cpu/__init__.py +1 -0
mindspore/{experimental/es/__init__.py → ops/_op_impl/cpu/joinedstr_op.py} +12 -6
mindspore/ops/_vmap/vmap_array_ops.py +6 -13
mindspore/ops/_vmap/vmap_nn_ops.py +8 -16
mindspore/ops/auto_generate/cpp_create_prim_instance_helper.py +29 -10
mindspore/ops/auto_generate/gen_extend_func.py +5 -55
mindspore/ops/auto_generate/gen_ops_def.py +753 -273
mindspore/ops/auto_generate/gen_ops_prim.py +1687 -958
mindspore/ops/auto_generate/pyboost_inner_prim.py +31 -1
mindspore/ops/composite/__init__.py +10 -0
mindspore/ops/composite/base.py +9 -5
mindspore/ops/composite/multitype_ops/__init__.py +12 -1
mindspore/ops/composite/multitype_ops/_compile_utils.py +132 -108
mindspore/ops/composite/multitype_ops/_constexpr_utils.py +1 -1
mindspore/ops/composite/multitype_ops/add_impl.py +70 -2
mindspore/ops/composite/multitype_ops/div_impl.py +49 -0
mindspore/ops/composite/multitype_ops/floordiv_impl.py +29 -0
mindspore/ops/composite/multitype_ops/getitem_impl.py +11 -0
mindspore/ops/composite/multitype_ops/mod_impl.py +5 -3
mindspore/ops/composite/multitype_ops/mul_impl.py +49 -0
mindspore/ops/composite/multitype_ops/setitem_impl.py +57 -0
mindspore/ops/composite/multitype_ops/sub_impl.py +34 -0
mindspore/ops/composite/multitype_ops/zeros_like_impl.py +14 -0
mindspore/ops/function/__init__.py +4 -1
mindspore/ops/function/_add_attr_func.py +11 -6
mindspore/ops/function/array_func.py +17 -100
mindspore/ops/function/debug_func.py +8 -5
mindspore/ops/function/grad/grad_func.py +5 -13
mindspore/ops/function/math_func.py +65 -399
mindspore/ops/function/nn_func.py +44 -61
mindspore/ops/function/other_func.py +4 -1
mindspore/ops/function/random_func.py +31 -4
mindspore/ops/functional.py +2 -3
mindspore/ops/functional_overload.py +486 -18
mindspore/ops/op_info_register.py +21 -0
mindspore/ops/operations/__init__.py +5 -2
mindspore/ops/operations/_custom_ops_utils.py +675 -8
mindspore/ops/operations/_inner_ops.py +14 -18
mindspore/ops/operations/_sequence_ops.py +1 -1
mindspore/ops/operations/array_ops.py +4 -50
mindspore/ops/operations/comm_ops.py +186 -41
mindspore/ops/operations/custom_ops.py +244 -175
mindspore/ops/operations/debug_ops.py +55 -4
mindspore/ops/operations/image_ops.py +13 -13
mindspore/ops/operations/manually_defined/ops_def.py +27 -28
mindspore/ops/operations/math_ops.py +8 -9
mindspore/ops/operations/nn_ops.py +6 -7
mindspore/ops/primitive.py +9 -20
mindspore/ops/tensor_method.py +52 -11
mindspore/ops_generate/api/cpp_create_prim_instance_helper_generator.py +1 -1
mindspore/ops_generate/api/functional_map_cpp_generator.py +10 -9
mindspore/ops_generate/api/functions_cc_generator.py +58 -10
mindspore/ops_generate/api/tensor_func_reg_cpp_generator.py +1 -1
mindspore/ops_generate/common/base_generator.py +14 -0
mindspore/ops_generate/common/gen_constants.py +7 -2
mindspore/ops_generate/common/gen_utils.py +0 -19
mindspore/ops_generate/common/op_proto.py +11 -4
mindspore/ops_generate/common/template.py +88 -11
mindspore/ops_generate/gen_ops.py +1 -1
mindspore/ops_generate/op_def/lite_ops_cpp_generator.py +4 -4
mindspore/ops_generate/op_def/ops_name_h_generator.py +0 -3
mindspore/ops_generate/op_def/ops_primitive_h_generator.py +0 -4
mindspore/ops_generate/op_def_py/op_prim_py_generator.py +5 -2
mindspore/ops_generate/pyboost/auto_grad_impl_cc_generator.py +49 -8
mindspore/ops_generate/pyboost/auto_grad_reg_cc_generator.py +2 -2
mindspore/ops_generate/pyboost/gen_pyboost_func.py +31 -16
mindspore/ops_generate/pyboost/op_template_parser.py +98 -72
mindspore/ops_generate/pyboost/pyboost_functions_cpp_generator.py +70 -273
mindspore/ops_generate/pyboost/pyboost_functions_h_generator.py +14 -6
mindspore/ops_generate/pyboost/pyboost_functions_impl_cpp_generator.py +316 -0
mindspore/ops_generate/pyboost/pyboost_functions_py_generator.py +1 -1
mindspore/ops_generate/pyboost/pyboost_grad_function_cpp_generator.py +5 -3
mindspore/ops_generate/pyboost/pyboost_inner_prim_generator.py +1 -1
mindspore/ops_generate/pyboost/pyboost_internal_functions_cpp_generator.py +76 -0
mindspore/ops_generate/pyboost/pyboost_internal_functions_h_generator.py +76 -0
mindspore/ops_generate/pyboost/pyboost_internal_kernel_info_adapter_generator.py +125 -0
mindspore/ops_generate/pyboost/pyboost_native_grad_functions_generator.py +4 -3
mindspore/ops_generate/pyboost/pyboost_op_cpp_code_generator.py +348 -61
mindspore/ops_generate/pyboost/pyboost_overload_functions_cpp_generator.py +1 -1
mindspore/ops_generate/pyboost/pyboost_utils.py +118 -9
mindspore/ops_generate/tensor_py_cc_generator.py +1 -24
mindspore/parallel/_auto_parallel_context.py +9 -17
mindspore/parallel/_cell_wrapper.py +106 -40
mindspore/parallel/_parallel_serialization.py +4 -3
mindspore/parallel/_ps_context.py +4 -6
mindspore/parallel/_tensor.py +167 -12
mindspore/parallel/_transformer/moe.py +1 -1
mindspore/parallel/_transformer/transformer.py +17 -12
mindspore/parallel/_utils.py +5 -11
mindspore/parallel/auto_parallel.py +33 -12
mindspore/parallel/checkpoint_convert.py +3 -3
mindspore/parallel/checkpoint_transform.py +5 -1
mindspore/parallel/cluster/process_entity/_api.py +88 -49
mindspore/parallel/cluster/process_entity/_utils.py +95 -7
mindspore/parallel/cluster/run.py +48 -7
mindspore/parallel/function/__init__.py +8 -1
mindspore/parallel/function/reshard_func.py +7 -6
mindspore/parallel/nn/__init__.py +15 -2
mindspore/parallel/nn/parallel_cell_wrapper.py +50 -14
mindspore/parallel/nn/parallel_grad_reducer.py +7 -14
mindspore/parallel/shard.py +9 -23
mindspore/parallel/transform_safetensors.py +468 -174
mindspore/pgodb140.dll +0 -0
mindspore/pgort140.dll +0 -0
mindspore/profiler/__init__.py +2 -1
mindspore/profiler/analysis/parser/timeline_assembly_factory/ascend_timeline_assembler.py +7 -7
mindspore/profiler/analysis/parser/timeline_assembly_factory/base_timeline_assembler.py +3 -0
mindspore/profiler/analysis/parser/timeline_assembly_factory/trace_view_container.py +3 -0
mindspore/profiler/analysis/parser/timeline_creator/cpu_op_timeline_creator.py +3 -3
mindspore/profiler/analysis/parser/timeline_creator/fwk_timeline_creator.py +3 -3
mindspore/profiler/analysis/parser/timeline_creator/msprof_timeline_creator.py +4 -4
mindspore/profiler/analysis/parser/timeline_creator/scope_layer_timeline_creator.py +3 -3
mindspore/profiler/analysis/parser/timeline_event/fwk_event.py +4 -1
mindspore/profiler/analysis/parser/timeline_event/timeline_event_pool.py +2 -1
mindspore/profiler/analysis/task_manager.py +1 -1
mindspore/profiler/analysis/viewer/ascend_communication_viewer.py +5 -1
mindspore/profiler/analysis/viewer/ascend_integrate_viewer.py +2 -1
mindspore/profiler/analysis/viewer/ascend_kernel_details_viewer.py +10 -9
mindspore/profiler/analysis/viewer/ascend_op_memory_viewer.py +43 -23
mindspore/profiler/analysis/viewer/ascend_step_trace_time_viewer.py +3 -2
mindspore/profiler/analysis/viewer/ms_minddata_viewer.py +9 -5
mindspore/profiler/analysis/viewer/ms_operator_details_viewer.py +132 -0
mindspore/profiler/common/constant.py +16 -0
mindspore/profiler/common/msprof_cmd_tool.py +2 -2
mindspore/profiler/common/path_manager.py +9 -0
mindspore/profiler/common/profiler_context.py +50 -29
mindspore/profiler/common/profiler_info.py +0 -16
mindspore/profiler/common/profiler_meta_data.py +1 -0
mindspore/profiler/common/profiler_op_analyse.py +239 -0
mindspore/profiler/common/profiler_output_path.py +23 -8
mindspore/profiler/common/profiler_parameters.py +128 -35
mindspore/profiler/dynamic_profile/__init__.py +0 -0
mindspore/profiler/dynamic_profile/dynamic_monitor_proxy.py +39 -0
mindspore/profiler/dynamic_profile/dynamic_profiler_config_context.py +666 -0
mindspore/profiler/dynamic_profile/dynamic_profiler_utils.py +62 -0
mindspore/profiler/dynamic_profiler.py +374 -338
mindspore/profiler/envprofiler.py +42 -12
mindspore/profiler/experimental_config.py +112 -7
mindspore/profiler/mstx.py +33 -12
mindspore/profiler/platform/__init__.py +2 -3
mindspore/profiler/platform/cpu_profiler.py +10 -4
mindspore/profiler/platform/npu_profiler.py +30 -20
mindspore/profiler/profiler.py +218 -154
mindspore/profiler/profiler_action_controller.py +65 -77
mindspore/profiler/profiler_interface.py +2 -2
mindspore/profiler/schedule.py +10 -4
mindspore/rewrite/common/config.py +1 -0
mindspore/rewrite/common/namer.py +1 -0
mindspore/rewrite/common/namespace.py +1 -0
mindspore/rewrite/node/node.py +31 -11
mindspore/rewrite/parsers/assign_parser.py +1 -1
mindspore/rewrite/symbol_tree/symbol_tree.py +2 -2
mindspore/run_check/_check_version.py +7 -10
mindspore/runtime/__init__.py +8 -6
mindspore/runtime/event.py +10 -4
mindspore/runtime/executor.py +87 -45
mindspore/runtime/memory.py +22 -30
mindspore/runtime/thread_bind_core.py +299 -165
mindspore/safeguard/rewrite_obfuscation.py +12 -13
mindspore/swresample-4.dll +0 -0
mindspore/swscale-6.dll +0 -0
mindspore/tbbmalloc.dll +0 -0
mindspore/tinyxml2.dll +0 -0
mindspore/train/_utils.py +9 -5
mindspore/train/amp.py +43 -23
mindspore/train/callback/__init__.py +5 -5
mindspore/train/callback/_callback.py +2 -1
mindspore/train/callback/_checkpoint.py +4 -14
mindspore/train/callback/_flops_collector.py +11 -7
mindspore/train/callback/_landscape.py +0 -1
mindspore/train/callback/_train_fault_tolerance.py +72 -18
mindspore/train/data_sink.py +15 -6
mindspore/train/dataset_helper.py +14 -5
mindspore/train/model.py +49 -47
mindspore/train/serialization.py +168 -126
mindspore/train/summary/summary_record.py +13 -2
mindspore/train/train_thor/model_thor.py +2 -2
mindspore/turbojpeg.dll +0 -0
mindspore/utils/__init__.py +3 -2
mindspore/utils/dryrun.py +0 -6
mindspore/utils/runtime_execution_order_check.py +162 -78
mindspore/utils/sdc_detect.py +68 -0
mindspore/utils/utils.py +14 -17
mindspore/vcmeta.dll +0 -0
mindspore/vcruntime140.dll +0 -0
mindspore/vcruntime140_1.dll +0 -0
mindspore/version.py +1 -1
{mindspore-2.6.0.dist-info → mindspore-2.7.0.dist-info}/METADATA +5 -4
{mindspore-2.6.0.dist-info → mindspore-2.7.0.dist-info}/RECORD +400 -439
mindspore/_deprecated/jit.py +0 -198
mindspore/_extends/remote/kernel_build_server_ascend.py +0 -75
mindspore/communication/_hccl_management.py +0 -297
mindspore/experimental/es/embedding_service.py +0 -891
mindspore/experimental/es/embedding_service_layer.py +0 -581
mindspore/profiler/common/validator/__init__.py +0 -14
mindspore/profiler/common/validator/validate_path.py +0 -84
mindspore/profiler/parser/__init__.py +0 -14
mindspore/profiler/parser/aicpu_data_parser.py +0 -272
mindspore/profiler/parser/ascend_analysis/__init__.py +0 -14
mindspore/profiler/parser/ascend_analysis/constant.py +0 -71
mindspore/profiler/parser/ascend_analysis/file_manager.py +0 -180
mindspore/profiler/parser/ascend_analysis/function_event.py +0 -185
mindspore/profiler/parser/ascend_analysis/fwk_cann_parser.py +0 -136
mindspore/profiler/parser/ascend_analysis/fwk_file_parser.py +0 -131
mindspore/profiler/parser/ascend_analysis/msprof_timeline_parser.py +0 -104
mindspore/profiler/parser/ascend_analysis/path_manager.py +0 -313
mindspore/profiler/parser/ascend_analysis/profiler_info_parser.py +0 -123
mindspore/profiler/parser/ascend_analysis/tlv_decoder.py +0 -86
mindspore/profiler/parser/ascend_analysis/trace_event_manager.py +0 -75
mindspore/profiler/parser/ascend_cluster_generator.py +0 -116
mindspore/profiler/parser/ascend_communicate_generator.py +0 -314
mindspore/profiler/parser/ascend_flops_generator.py +0 -116
mindspore/profiler/parser/ascend_fpbp_generator.py +0 -82
mindspore/profiler/parser/ascend_hccl_generator.py +0 -271
mindspore/profiler/parser/ascend_integrate_generator.py +0 -42
mindspore/profiler/parser/ascend_memory_generator.py +0 -185
mindspore/profiler/parser/ascend_msprof_exporter.py +0 -282
mindspore/profiler/parser/ascend_msprof_generator.py +0 -187
mindspore/profiler/parser/ascend_op_generator.py +0 -334
mindspore/profiler/parser/ascend_steptrace_generator.py +0 -94
mindspore/profiler/parser/ascend_timeline_generator.py +0 -545
mindspore/profiler/parser/base_timeline_generator.py +0 -483
mindspore/profiler/parser/container.py +0 -229
mindspore/profiler/parser/cpu_gpu_timeline_generator.py +0 -697
mindspore/profiler/parser/flops_parser.py +0 -531
mindspore/profiler/parser/framework_enum.py +0 -111
mindspore/profiler/parser/framework_parser.py +0 -464
mindspore/profiler/parser/framework_struct.py +0 -61
mindspore/profiler/parser/gpu_analysis/__init__.py +0 -14
mindspore/profiler/parser/gpu_analysis/function_event.py +0 -44
mindspore/profiler/parser/gpu_analysis/fwk_file_parser.py +0 -89
mindspore/profiler/parser/gpu_analysis/profiler_info_parser.py +0 -72
mindspore/profiler/parser/hccl_parser.py +0 -573
mindspore/profiler/parser/hwts_log_parser.py +0 -122
mindspore/profiler/parser/integrator.py +0 -526
mindspore/profiler/parser/memory_usage_parser.py +0 -277
mindspore/profiler/parser/minddata_analyzer.py +0 -800
mindspore/profiler/parser/minddata_parser.py +0 -186
mindspore/profiler/parser/minddata_pipeline_parser.py +0 -299
mindspore/profiler/parser/op_intermediate_parser.py +0 -149
mindspore/profiler/parser/optime_parser.py +0 -250
mindspore/profiler/parser/profiler_info.py +0 -213
mindspore/profiler/parser/step_trace_parser.py +0 -666
mindspore/utils/hooks.py +0 -81
/mindspore/common/{_auto_dynamic.py → dynamic_shape/_auto_dynamic.py} +0 -0
{mindspore-2.6.0.dist-info → mindspore-2.7.0.dist-info}/WHEEL +0 -0
{mindspore-2.6.0.dist-info → mindspore-2.7.0.dist-info}/entry_points.txt +0 -0
{mindspore-2.6.0.dist-info → mindspore-2.7.0.dist-info}/top_level.txt +0 -0

mindspore/dataset/engine/datasets.py CHANGED Viewed

@@ -29,10 +29,8 @@ import atexit
 import glob
 import json
 import os
-import queue
 import signal
 import stat
-import subprocess
 import warnings
 import time
@@ -41,6 +39,7 @@ import multiprocessing
 from importlib import import_module
 import sys
 import threading
+from types import GeneratorType
 import copy
 import weakref
@@ -65,7 +64,6 @@ from mindspore.dataset.engine import samplers
 from mindspore.dataset.engine.samplers import Shuffle
 from .iterators import DictIterator, TupleIterator, DummyIterator, check_iterator_cleanup, _set_iterator_cleanup, \
     ITERATORS_LIST, _unset_iterator_cleanup, _cleanup_the_iterators_if_created
-from .queue import _SharedQueue, _Queue
 from .validators import check_batch, check_shuffle, check_map, check_filter, check_repeat, check_skip, check_zip, \
     check_rename, check_device_send, check_take, check_output_shape, check_project, \
     check_sync_wait, check_zip_dataset, check_add_column, check_concat, check_split, check_bucket_batch_by_length, \
@@ -73,7 +71,8 @@ from .validators import check_batch, check_shuffle, check_map, check_filter, che
     check_total_batch, check_sync_update
 from ..core.config import get_callback_timeout, _init_device_info, get_enable_shared_mem, get_num_parallel_workers, \
     get_enable_watchdog, get_seed, set_seed, get_debug_mode, get_multiprocessing_timeout_interval, \
-    _get_debug_hook_list, get_multiprocessing_start_method
+    _get_debug_hook_list, get_multiprocessing_start_method, get_video_backend, set_video_backend, \
+    get_error_samples_mode, ErrorSamplesMode
 from ..core.datatypes import mstype_to_detype
 from ..core.validator_helpers import replace_none
 from ..core.py_util_helpers import ExceptionHandler
@@ -575,6 +574,12 @@ class Dataset:
                     create shared memory, and represents ``output_columns`` use the second element as the
                     unit to create shared memory.
+        .. warning::
+            `batch` uses `dill` module implicitly in multiprocessing `spawn` mode to serialize/deserialize
+            `per_batch_map`, which is known to be insecure. It is possible to construct malicious pickle data
+            which will execute arbitrary code during unpickling. Never load data that could have come from
+            untrusted sources, or has been tampered with.
         Returns:
             Dataset, a new dataset with the above operation applied.
@@ -886,6 +891,12 @@ class Dataset:
                 - offload (bool, optional): Flag to indicate whether offload is used. Default: ``None``.
+        .. warning::
+            `map` uses `dill` module implicitly in multiprocessing `spawn` mode to serialize/deserialize `operations`,
+            which is known to be insecure. It is possible to construct malicious pickle data which will
+            execute arbitrary code during unpickling. Never load data that could have come from untrusted sources,
+            or has been tampered with.
         Note:
             - Input `operations` accepts TensorOperations defined in mindspore.dataset part, plus user-defined
               Python functions (PyFuncs).
@@ -1557,7 +1568,7 @@ class Dataset:
         del api_tree
     @check_tuple_iterator
-    def create_tuple_iterator(self, columns=None, num_epochs=-1, output_numpy=False, do_copy=True):
+    def create_tuple_iterator(self, columns=None, num_epochs=-1, output_numpy=False, do_copy=False):
         """
         Create an iterator over the dataset that yields samples of type list, whose elements are
         the data for each column.
@@ -1571,7 +1582,7 @@ class Dataset:
                 convert it to Tensor. Default: ``False`` .
             do_copy (bool, optional): Whether to copy the data when converting output to Tensor,
                 or reuse the buffer for better performance, only works when `output_numpy` is ``False`` .
-                Default: ``True`` .
+                Default: ``False`` .
         Returns:
             Iterator, a dataset iterator that yields samples of type list.
@@ -1598,7 +1609,7 @@ class Dataset:
         return TupleIterator(self, columns, num_epochs, output_numpy, do_copy)
     @check_dict_iterator
-    def create_dict_iterator(self, num_epochs=-1, output_numpy=False, do_copy=True):
+    def create_dict_iterator(self, num_epochs=-1, output_numpy=False, do_copy=False):
         """
         Create an iterator over the dataset that yields samples of type dict,
         while the key is the column name and the value is the data.
@@ -1610,7 +1621,7 @@ class Dataset:
                 convert it to Tensor. Default: ``False`` .
             do_copy (bool, optional): Whether to copy the data when converting output to Tensor,
                 or reuse the buffer for better performance, only works when `output_numpy` is ``False`` .
-                Default: ``True`` .
+                Default: ``False`` .
         Returns:
             Iterator, a dataset iterator that yields samples of type dict.
@@ -2740,8 +2751,6 @@ class BatchDataset(UnionBaseDataset):
             self.process_pool = _PythonMultiprocessing(get_multiprocessing_start_method(), self.num_parallel_workers,
                                                        str(self), [self.per_batch_map], self.max_rowsize)
-            # Wrap per_batch_map into _PythonCallable
-            self.per_batch_map = _PythonCallable(self.per_batch_map, 0, self.process_pool)
         else:
             if self.per_batch_map is not None:
                 self.per_batch_map = FuncWrapper(self.per_batch_map)
@@ -3045,95 +3054,6 @@ _OP_NAME = dict()
 _OP_PROCESS = dict()
-# PythonCallable wrapper for multiprocess pyfunc
-class _PythonCallable:
-    """
-    Internal Python function wrapper for multiprocessing pyfunc.
-    """
-    def __init__(self, py_callable, idx, pool=None):
-        # Original Python callable from user.
-        self.py_callable = py_callable
-        # Process pool created for current iterator.
-        self.pool = pool
-        # Python callable index
-        self.idx = idx
-    def __call__(self, *args):
-        result = None
-        get_data_from_worker_process = False
-        while get_data_from_worker_process is False:
-            if self.pool.is_running() and check_iterator_cleanup() is False:
-                try:
-                    result = self.pool.execute(self.idx, *args)
-                except multiprocessing.TimeoutError:
-                    continue
-                get_data_from_worker_process = True
-            else:
-                # worker process is stopped
-                logger.info("The worker process of map operation is stopped. "
-                            "So return None to main thread and break the main thread.")
-                return None
-        # got value from worker process
-        if not isinstance(result, tuple) and get_data_from_worker_process is True:
-            result = (result,)
-        return result
-    def to_json(self):
-        return self.py_callable.to_json()
-# used when python_multiprocessing=True in map
-class Pipe:
-    """
-    Class to handle communication between the master process and the worker processes.
-    """
-    def __init__(self, warning_ctl, shared_memory=False, max_rowsize=(-1, -1)):
-        self.shared_memory = shared_memory
-        self.eof = multiprocessing.Event()
-        if self.shared_memory:
-            self.in_queue = _SharedQueue(1, warning_ctl, max_rowsize=max_rowsize[0])
-            self.res_queue = _SharedQueue(1, warning_ctl, max_rowsize=max_rowsize[1])
-        else:
-            self.in_queue = _Queue(1)
-            self.res_queue = _Queue(1)
-        self.in_queue.cancel_join_thread()  # Ensure that the process does not hung when exiting
-    def master_send(self, func_index, data):
-        self.in_queue.put_nowait((func_index, *data))
-    def master_receive(self):
-        if self.eof is None:
-            raise RuntimeError("EOF is none when get data from worker.")
-        if self.eof.is_set():
-            return None
-        return self.res_queue.get(timeout=1)
-    def master_close(self):
-        self.eof.set()
-        self.send_finish_signal_to_worker()
-        self.send_finish_signal()
-    def send_finish_signal(self):
-        self.worker_send(None)
-    def send_finish_signal_to_worker(self):
-        self.master_send(0, "QUIT")
-    def worker_send(self, data):
-        self.res_queue.put_until(data, timeout=1, exit_signal=self.eof)
-    def worker_receive(self):
-        result = self.in_queue.get_until(timeout=1, exit_signal=self.eof)
-        if result is None:
-            return result
-        if len(result) == 1:
-            raise RuntimeError(f"Corrupted data. Worker received {len(result)} elements, it should be more than 1.")
-        func_index, *data = result
-        return func_index, tuple(data)
 def _main_process_already_exit():
     """
     Judge whether main process already exit.
@@ -3146,15 +3066,18 @@ def _main_process_already_exit():
     return False
-def _worker_loop(operations, pipe, worker_id):
+def _worker_loop(quit_signal, operations, worker_id, op_type, key, video_backend=None):
     """
     Multiprocess worker process loop.
+    The worker process(Python Layer) gets data from / sends data to map / batch thread(C++ layer) by message queue
+    and shared memory. This logic no longer uses the Python multi-process pool, in_queue, and out_queue for
+    data transferring.
     """
     # Initialize C++ side signal handlers
     cde.register_worker_handlers()
-    # Ensure that the process does not hang when exiting
-    pipe.res_queue.cancel_join_thread()
+    if video_backend is not None:
+        set_video_backend(video_backend)
     def _ignore_sigint():
         """
@@ -3168,121 +3091,197 @@ def _worker_loop(operations, pipe, worker_id):
     if get_seed() != 5489:
         set_seed(get_seed() + worker_id)
+    msg_queue = cde.MessageQueue(key)
+    msg_queue.set_release_flag(False)
+    shm_queue = cde.SharedMemoryQueue(key)
+    shm_queue.set_release_flag(False)
+    pid = str(os.getpid())
+    ppid = str(os.getppid())
+    # Scenario: when the main process is killed, worker processe needs to release shm & msg.
+    # The shm id and msg id should be released by SIGTERM in worker handler
+    cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                   msg_queue.msg_queue_id)
+    num_receive = 0
+    num_send = 0
     while not _main_process_already_exit():
         _ignore_sigint()
-        result = pipe.worker_receive()
-        if result is None:
+        # quit by close_worker
+        if quit_signal.is_set():
             return
-        (idx, input_tensors) = result
-        if input_tensors == "QUIT":
-            break
+        # >> receive procedure >>
+        ## 1. get message queue which contains shared memory info from map C++ thread in main process
         try:
-            output_tensors = operations[idx](*input_tensors)
+            cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                           msg_queue.msg_queue_id)
+            msg_queue.msg_rcv(cde.MASTER_SEND_DATA_MSG)
+            cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                           msg_queue.msg_queue_id)
+        except RuntimeError as err:
+            cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                           msg_queue.msg_queue_id)
+            # the msg_queue had been released by main process, ignore it in worker process
+            if "errno: 2" in str(err):
+                # Because the worker process does not release msg and shm, continue
+                continue
+            raise err
-            pipe.worker_send(output_tensors)
-        except Exception:
-            pipe.worker_send(ExceptionHandler(where="in map(or batch) worker and execute Python function"))
-            # Do not return
+        ## when the message queue had been released, break the loop
+        if msg_queue.message_queue_state() == cde.MessageState.RELEASED:
+            logger.info("The message queue had been released, worker loop end.")
+            break
-    # release the queue when stop the worker by master
-    del pipe.in_queue
-    del pipe.res_queue
+        num_receive += 1
+        logger.info("Python process {} worker({}) receives {} samples from map thread.".format(op_type, worker_id,
+                                                                                               num_receive))
-def worker_target(operations, worker_id):
-    logger.info("Multiprocessing start method: {}".format(multiprocessing.get_start_method()))
-    return lambda pipe: _worker_loop(operations, pipe, worker_id)
+        # convert the data from shm to python data
+        if op_type == cde.MAP_OP:
+            ## 2. construct shared memory to TensorRow which contains one / more columns
+            tensor_row = shm_queue.to_tensor_row(msg_queue.shm_id, msg_queue.shm_size)
+            ## 3. convert TensorRow to Python tuple which elements are a column
+            tuple_column = cde.convert_tensor_row_to_py_tuple(tensor_row)
-class WorkerTarget:
-    def __init__(self, operations, pipe, worker_id):
-        self.operations = operations
-        self.pipe = pipe
-        self.worker_id = worker_id
-        logger.info("Multiprocessing start method: {}".format(multiprocessing.get_start_method()))
+            py_func_input = tuple_column
+        elif op_type == cde.BATCH_OP:
+            ## 2. construct shard memory to TensorTable which contains one / more TensorRow & CBatchInfo
+            tensor_table, batch_info, _ = shm_queue.to_tensor_table(msg_queue.shm_id, msg_queue.shm_size)
-    def __call__(self):
-        return _worker_loop(self.operations, self.pipe, self.worker_id)
+            ## 3. convert TensorTable to Python tuple tuple
+            # The tuple indicate the multi columns
+            # The list indicate the multi rows
+            tuple_list_column = cde.convert_tensor_table_to_py_tuple_list(tensor_table)
+            py_func_input = (*tuple_list_column, batch_info)
+        else:
+            raise RuntimeError("The op_type: {} is invalid.".format(op_type))
-class _MPWorker(multiprocessing.Process):
-    """
-    Worker process for multiprocessing.
-    """
+        # execute the pyfunc
+        try:
+            py_func_output = py_func_input
-    def __init__(self, operations, warning_ctl, max_rowsize=(-1, -1), worker_id=0):
-        shared_memory = get_enable_shared_mem()
-        self.pipe = Pipe(warning_ctl, shared_memory=shared_memory, max_rowsize=max_rowsize)
-        self.check_interval = get_multiprocessing_timeout_interval()
-        super().__init__(target=worker_target(operations, worker_id), name="MapWorker" + str(worker_id),
-                         args=(self.pipe,), daemon=True)
-    def execute(self, idx, *args):
-        """Acquiring data from a worker in an infinite loop"""
-        self.pipe.master_send(idx, args)
-        time_s = time.time()
-        wait_count = 1
-        while True:
-            cost_time = time.time() - time_s
-            if cost_time / self.check_interval >= wait_count:
-                wait_count += 1
-                logger.warning("It has been waiting for " + "%.3f" % cost_time + "s because the sub-process "
-                               "worker of the map operation is hanging. "
-                               "Check whether the user defined data transform is too slow or the "
-                               "output data is too large. You can also set the timeout interval by "
-                               "ds.config.set_multiprocessing_timeout_interval to adjust the output frequency "
-                               "of this log.")
-                pid = self.pid
-                logger.warning("Map worker subprocess ID {} is stuck.".format(pid))
-                install_status, _ = subprocess.getstatusoutput("py-spy --version")
-                if install_status == 0:
-                    stack = subprocess.getoutput("py-spy dump -p {} -l".format(pid))
-                    logger.warning("Map worker subprocess stack:\n{}".format(stack))
+            # execute the remaining operations
+            for idx in range(len(operations)):
+                if isinstance(py_func_output, tuple):
+                    py_func_output = operations[idx](*py_func_output)
                 else:
-                    logger.warning("Please `pip install py-spy` to get the stacks of the stuck process.")
+                    py_func_output = operations[idx](py_func_output)
+            # << send procedure <<
+            # the result is None
+            if py_func_output is None:
+                raise RuntimeError("Got None from Python Function which is defined by {}".format(op_type))
+            # convert the output to tuple
+            if not isinstance(py_func_output, tuple):
+                py_func_output = (py_func_output,)
+            if op_type == cde.MAP_OP:
+                # check if the map return Generator type
+                for item in py_func_output:
+                    if isinstance(item, GeneratorType):
+                        raise RuntimeError("Cannot pickle <class 'generator'> object, please verify pyfunc "
+                                           "return with numpy array")
+                ## 1. convert Python tuple to TensorRow
+                output_tensor_row = cde.convert_py_tuple_to_tensor_row(py_func_output)
+                ## 2. convert TensorRow to shared memory
+                shm_queue.from_tensor_row(output_tensor_row)
+            elif op_type == cde.BATCH_OP:
+                ## 1. convert Python tuple tuple to TensorTable
+                output_tensor_table, concat_batch = cde.convert_py_tuple_list_to_tensor_table(py_func_output)
+                ## 2. convert TensorTable to shared memory
+                shm_queue.from_tensor_table(output_tensor_table, batch_info, concat_batch)
+            else:
+                raise RuntimeError("The op_type: {} is invalid.".format(op_type))
+            ## 3. send message queue which contains shared memory to map C++ thread in main process
+            cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                           msg_queue.msg_queue_id)
+            msg_queue.msg_snd(cde.WORKER_SEND_DATA_MSG, shm_queue.get_shm_id(), shm_queue.get_shm_size())
+            cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                           msg_queue.msg_queue_id)
+            num_send += 1
+            logger.info("Python process {} worker({}) sends {} samples to map thread.".format(op_type, worker_id,
+                                                                                              num_send))
+        except Exception:
             try:
-                res = self.pipe.master_receive()
-            except queue.Empty:
-                continue
-            if res is None:
-                # receive finish signal
-                return None
-            if isinstance(res, ExceptionHandler):
-                res.reraise()
-            return res
-    def close(self):
-        try:
-            if self.is_alive():
-                # release the eager executor which is used by current process
-                transforms.transforms.clean_unused_executors()
-                logger.info(f"Closing worker with PID: {self.pid}")
-                self.pipe.master_close()
-                process_dir = os.path.join('/proc', str(self.pid))
-                while self.is_alive() and os.path.exists(process_dir):
-                    logger.info("Waiting for worker {} closed ...".format(self.pid))
-                    time.sleep(0.001)
-                # del the handle which hold by master
-                del self.pipe.in_queue
-                del self.pipe.res_queue
-                super().terminate()
-                super().join()
-                super().close()
-        except ValueError:
-            # Process has been closed already
+                if op_type == cde.MAP_OP:
+                    pyfunc_err = ExceptionHandler(where="in map worker and execute Python function")
+                elif op_type == cde.BATCH_OP:
+                    pyfunc_err = ExceptionHandler(where="in batch(per_batch_map) worker and execute Python function")
+                else:
+                    pyfunc_err = "The op_type: {} is invalid.".format(op_type)
+                pyfunc_err.reraise()
+            except Exception as err:
+                _, _, exc_tb = sys.exc_info()
+                fname = os.path.split(exc_tb.tb_frame.f_code.co_filename)[1]
+                if op_type == cde.MAP_OP:
+                    logger.info("Got exception {} from Map Worker({})".format(str(err), worker_id))
+                elif op_type == cde.BATCH_OP:
+                    logger.info("Got exception {} from Batch Worker({})".format(str(err), worker_id))
+                else:
+                    logger.info("The op_type: {} is invalid.".format(op_type))
+                # err_code, lineno, filename, err_desc
+                msg_queue.serialize_status(cde.StatusCode.MD_PY_FUNC_EXCEPTION, exc_tb.tb_lineno, fname, str(err))
+                cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                               msg_queue.msg_queue_id)
+                msg_queue.msg_snd(cde.WORKER_SEND_DATA_MSG, shm_queue.get_shm_id(), shm_queue.get_shm_size())
+                cde.register_shm_id_and_msg_id(pid + "_" + ppid + "_" + str(op_type), shm_queue.get_shm_id(),
+                                               msg_queue.msg_queue_id)
+                # worker error
+                if get_error_samples_mode() == ErrorSamplesMode.RETURN:
+                    break
+                else:
+                    # continue the loop, when the get_error_samples_mode() is REPLACE or SKIP
+                    continue
+    # release the eager executor which is used by current process
+    transforms.transforms.clean_unused_executors()
+    while not _main_process_already_exit():
+        # quit by close_worker
+        if quit_signal.is_set():
             return
-        return
-    def is_alive(self):
-        try:
-            return super().is_alive()
-        except ValueError:
-            return False
+        logger.info("The worker process is waiting for the main process to exit.")
+        time.sleep(0.1)
+    # the main process is not exist yet which maybe killed -9
+    msg_queue.set_release_flag(True)
+    msg_queue.release()
+    shm_queue.set_release_flag(True)
+    shm_queue.release()
+class WorkerTarget:
+    """Mulitprocess mode for dataset map or batch"""
+    def __init__(self, quit_signal, operations, worker_id, op_type, ftok_key):
+        self.quit_signal = quit_signal
+        self.operations = operations
+        self.worker_id = worker_id
+        self.op_type = op_type
+        self.ftok_key = ftok_key
+        start_method = multiprocessing.get_start_method()
+        logger.info("Multiprocessing start method: {}".format(start_method))
+        self.video_backend = get_video_backend() if start_method == 'spawn' else None
+    def __call__(self):
+        return _worker_loop(self.quit_signal, self.operations, self.worker_id, self.op_type, self.ftok_key,
+                            self.video_backend)
 def worker_is_alive(worker):
@@ -3293,24 +3292,31 @@ def worker_is_alive(worker):
         return False
-def close_worker(worker, pipe):
+def close_worker(worker, eof):
     """Close the subprocess worker in spawn mode"""
     try:
         if worker_is_alive(worker):
             # release the eager executor which is used by current process
             transforms.transforms.clean_unused_executors()
-            logger.info(f"Closing worker with PID: {worker.pid}")
-            pipe.master_close()
+            # let the worker exit
+            logger.info("Set eof flag for worker with PID: {}.".format(worker.pid))
+            eof.set()
+            # wait timeout
+            wait_timeout = 2
+            start_time = time.time()
             process_dir = os.path.join('/proc', str(worker.pid))
             while worker_is_alive(worker) and os.path.exists(process_dir):
                 logger.info("Waiting for worker {} closed ...".format(worker.pid))
                 time.sleep(0.5)
+                # maybe the worker is hung by msg_queue.MsgRcv, so break the loop and terminate it in next step
+                if time.time() - start_time > wait_timeout:
+                    break
             # del the handle which hold by master
-            del pipe.in_queue
-            del pipe.res_queue
             worker.terminate()
             worker.join()
             worker.close()
@@ -3367,7 +3373,8 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
         self.warning_ctl = None
         # cache thread (get_ident()) to worker_id mapping in Python layer
         self.python_threads_to_workers = {}
-        self.eof = None
+        self.eof_workers = []
+        self.eof_clean_process = None
         self.running = False
     def __del__(self):
@@ -3443,19 +3450,39 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
         del workers
         os.kill(os.getpid(), signal.SIGTERM)
-    def launch(self, op_id=-1):
+    def launch(self, op_id, op_type, ftok_keys):
         """
         Launch Python multiprocessing pool.
         Args:
-            op_id: ID for operation to have Python multiprocessing pool launched
+            op_id (int): ID for operation to have Python multiprocessing pool launched
+            op_type (str): Indicate MapOp / BatchOp
+            ftok_keys (list[int]): the ftok key of list for msg queue and shm queue
         Returns:
             Python multiprocessing pool is launched.
         """
         self.python_threads_to_workers = {}
+        if not isinstance(op_id, int):
+            raise RuntimeError("The op_id is not int.")
         self.op_id = op_id
-        logger.info("Launching new Python multiprocessing pool for Op: " + str(self.op_id))
+        valid_op_type = [cde.MAP_OP, cde.BATCH_OP]
+        if op_type not in valid_op_type:
+            raise RuntimeError("The op_type: {} is not in {}.".format(op_type, valid_op_type))
+        self.op_type = op_type
+        if not isinstance(ftok_keys, list):
+            raise RuntimeError("The ftok_keys is not a list.")
+        if not all(isinstance(x, int) for x in ftok_keys):
+            raise RuntimeError("The item in ftok_keys is not all int.")
+        if len(ftok_keys) != self.num_parallel_workers:
+            raise RuntimeError("The len of ftok_keys is not equal to num_parallel_workers.")
+        self.ftok_keys = ftok_keys
+        logger.info("Launching new Python multiprocessing pool for Op: " + self.op_type + "(" + str(self.op_id) + \
+                    "), ftok_keys: " + str(self.ftok_keys))
         if self.is_mp_enabled():
             message = "Launching a new Python multiprocessing pool while a pool already exists!" + \
                       " The existing pool will be terminated first."
@@ -3478,30 +3505,21 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
             raise Exception("Pool was already created, close it first.")
         self.workers = []
-        self.pipes = []
-        self.check_interval = get_multiprocessing_timeout_interval()
         self.warning_ctl = multiprocessing.Value('i', 0)
-        if self.start_method == "fork":
-            # Construct python worker processes
-            for worker_id in range(self.num_parallel_workers):
-                worker = _MPWorker(self.operations, self.warning_ctl, self.max_rowsize, worker_id)
-                worker.start()
-                self.workers.append(worker)
-        else:
-            multiprocessing.set_start_method(self.start_method, True)
-            # Construct python worker processes
-            for worker_id in range(self.num_parallel_workers):
-                shared_memory = get_enable_shared_mem()
-                pipe = Pipe(self.warning_ctl, shared_memory=shared_memory, max_rowsize=self.max_rowsize)
-                self.check_interval = get_multiprocessing_timeout_interval()
-                worker = multiprocessing.Process(target=WorkerTarget(self.operations, pipe, worker_id),
-                                                 name="MapWorker" + str(worker_id), daemon=True)
-                self.workers.append(worker)
-                self.pipes.append(pipe)
-                worker.start()
+        multiprocessing.set_start_method(self.start_method, True)
+        # Construct python worker processes
+        for worker_id in range(self.num_parallel_workers):
+            eof = multiprocessing.Event()
+            worker = multiprocessing.Process(target=WorkerTarget(eof, self.operations, worker_id, self.op_type,
+                                                                 self.ftok_keys[worker_id]),
+                                             name="MapWorker" + str(worker_id), daemon=True)
+            self.eof_workers.append(eof)
+            self.workers.append(worker)
+            worker.start()
-            multiprocessing.set_start_method("fork", True)
+        multiprocessing.set_start_method("fork", True)
         logger.info("Launch worker process(es): {}".format(self.get_pids()))
@@ -3515,6 +3533,20 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
         atexit.register(lambda cleanup: cleanup()() if cleanup() is not None else None,
                         weakref.WeakMethod(self.terminate))
+        # Ensure that all workers are in the running state
+        start = time.time()
+        wait_time = 120  # 120s
+        while True:
+            if self.is_running():
+                logger.info("All workers has been running state.")
+                break
+            else:
+                time.sleep(0.5)
+                if time.time() - start > wait_time:
+                    logger.error("All worker processes have not reached the running state within " + str(wait_time) +
+                                 " seconds, data processing errors may occur.")
+                    break
     def terminate(self):
         if self.running:
             # abort the monitor first and then close all the workers
@@ -3543,7 +3575,8 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
                         continue
         return self.pids
-    def add_new_workers(self, num_new_workers):
+    def add_new_workers(self, num_new_workers, op_type, ftok_keys):
+        """Used by AutoTune"""
         logger.info(
             "Increasing num_parallel_workers of Python Multiprocessing pool for Op:" + str(self.op_id) +
             ", old num_workers=" + str(self.num_parallel_workers) + " new num_workers=" + str(
@@ -3551,9 +3584,14 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
                 num_new_workers) + ".")
         self.terminate()
         self.num_parallel_workers += num_new_workers
-        self.launch(self.op_id)
-    def remove_workers(self, num_removed_workers):
+        if self.num_parallel_workers != len(ftok_keys):
+            raise RuntimeError("Add new workers failed, the num_workers is not equal size of ftok_keys.")
+        self.launch(self.op_id, op_type, ftok_keys)
+    def remove_workers(self, num_removed_workers, op_type, ftok_keys):
+        """Used by AutoTune"""
         logger.info(
             "Decreasing num_parallel_workers of Python Multiprocessing pool for Op:" + str(self.op_id) +
             ", old num_workers=" + str(self.num_parallel_workers) + " new num_workers=" + str(
@@ -3561,59 +3599,14 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
                 num_removed_workers) + ".")
         self.terminate()
         self.num_parallel_workers -= num_removed_workers
-        self.launch(self.op_id)
-    def is_mp_enabled(self):
-        return self.workers is not None
+        if self.num_parallel_workers != len(ftok_keys):
+            raise RuntimeError("Remove workers failed, the num_workers is not equal size of ftok_keys.")
-    def execute(self, idx, *args):
-        """
-        Execute
-        """
-        t_id = threading.get_ident()
-        # get the worker_id from Python layer cache first, get from Cpp layer if not found.
-        worker_id = self.python_threads_to_workers.setdefault(t_id, self.get_thread_to_worker())
-        if worker_id >= len(self.workers):
-            raise RuntimeError("[Internal] worker_id value is greater than number of available workers!")
-        # todo check_iterator_cleanup
-        if self.is_running() and check_iterator_cleanup() is False:
-            if self.start_method == "fork":
-                return self.workers[worker_id].execute(idx, *args)
-            # spawn mode
-            self.pipes[worker_id].master_send(idx, args)
-            time_s = time.time()
-            wait_count = 1
-            while True:
-                cost_time = time.time() - time_s
-                if cost_time / self.check_interval >= wait_count:
-                    wait_count += 1
-                    logger.warning("It has been waiting for " + "%.3f" % cost_time + "s because the sub-process "
-                                   "worker of the map operation is hanging. "
-                                   "Check whether the user defined data transform is too slow or the "
-                                   "output data is too large. You can also set the timeout interval by "
-                                   "ds.config.set_multiprocessing_timeout_interval to adjust the output frequency "
-                                   "of this log.")
-                    pid = self.workers[worker_id].pid
-                    logger.warning("Map worker subprocess ID {} is stuck.".format(pid))
-                    install_status, _ = subprocess.getstatusoutput("py-spy --version")
-                    if install_status == 0:
-                        stack = subprocess.getoutput("py-spy dump -p {} -l".format(pid))
-                        logger.warning("Map worker subprocess stack:\n{}".format(stack))
-                    else:
-                        logger.warning("Please `pip install py-spy` to get the stacks of the stuck process.")
-                try:
-                    res = self.pipes[worker_id].master_receive()
-                except queue.Empty:
-                    continue
-                if res is None:
-                    # receive finish signal
-                    return None
-                if isinstance(res, ExceptionHandler):
-                    res.reraise()
-                return res
+        self.launch(self.op_id, op_type, ftok_keys)
-        return None
+    def is_mp_enabled(self):
+        return self.workers is not None
     def _launch_monitor(self):
         """
@@ -3622,26 +3615,28 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
         The watch dog will clean up subprocesses and main process when any subprocess exited.
         """
         if platform.system().lower() != 'windows':
-            self.eof = multiprocessing.Event()
+            self.eof_clean_process = multiprocessing.Event()
             self.cleaning_process = multiprocessing.Process(target=self._clean_process,
                                                             name="MapCleanProcess",
-                                                            args=(self.ppid, self.workers, self.eof),
+                                                            args=(self.ppid, self.workers, self.eof_clean_process),
                                                             daemon=True)
             self.cleaning_process.start()
             logger.info("Launch clean process {} to monitor worker "
                         "process(es): {}".format(self.cleaning_process.pid, self.get_pids()))
             if get_enable_watchdog():
-                worker_ids = [worker.pid for worker in self.workers]
+                worker_ids = [os.getpid()]
+                worker_ids.extend([worker.pid for worker in self.workers])
                 worker_ids.append(self.cleaning_process.pid)
-                cde.register_worker_pids(id(self), set(worker_ids))
+                cde.register_worker_pids(id(self), worker_ids)
     def _abort_monitor(self):
         """Deregister workers monitored by the watch dog and join clean process."""
         if get_enable_watchdog():
             cde.deregister_worker_pids(id(self))
-        if hasattr(self, 'eof') and self.eof is not None:
-            self.eof.set()
+        if hasattr(self, 'eof') and self.eof_clean_process is not None:
+            logger.info("Set eof flag for cleaning_process.")
+            self.eof_clean_process.set()
         if hasattr(self, 'cleaning_process') and self.cleaning_process is not None:
             # let the quit event notify the cleaning process to exit
             self.cleaning_process.join(timeout=5)
@@ -3652,20 +3647,14 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
     def is_running(self):
         if hasattr(self, 'workers') and self.workers is not None:
-            if self.start_method == "fork":
-                return all([w.is_alive() for w in self.workers])
             return all([worker_is_alive(w) for w in self.workers])
         return False
     def close_all_workers(self):
         """Close all the subprocess workers"""
         if hasattr(self, 'workers') and self.workers is not None:
-            if self.start_method == "fork":
-                for w in self.workers:
-                    w.close()
-            else:
-                for i, w in enumerate(self.workers):
-                    close_worker(w, self.pipes[i])
+            for index in range(len(self.workers)):
+                close_worker(self.workers[index], self.eof_workers[index])
             check_interval = get_multiprocessing_timeout_interval()
             for w in self.workers:
@@ -3682,12 +3671,8 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
                         continue
                     raise e
                 try:
-                    if self.start_method == "fork":
-                        if w.is_alive():
-                            os.close(subprocess_file_descriptor)
-                    else:
-                        if worker_is_alive(w):
-                            os.close(subprocess_file_descriptor)
+                    if worker_is_alive(w):
+                        os.close(subprocess_file_descriptor)
                 except OSError as e:
                     # Maybe the file descriptor had been released, so ignore the 'Bad file descriptor'
                     if "Bad file descriptor" not in str(e):
@@ -3696,8 +3681,12 @@ class _PythonMultiprocessing(cde.PythonMultiprocessingRuntime):
             # use clear to release the handle which is better than self.workers = None
             self.workers.clear()
             self.workers = None
-            self.pipes.clear()
-            self.pipes = None
+            self.eof_workers.clear()
+            self.eof_workers = []
+            # as it can cause the main process to not exit when PyFunc executes very slowly so release
+            # the shm & msg here
+            cde.release_shm_and_msg_by_worker_pids(self.pids)
             self.pids = None
@@ -3775,7 +3764,22 @@ class MapDataset(UnionBaseDataset):
         count_old_transforms, count_new_transforms, count_non_data_vision_transforms = \
             self.__count_transforms(operations)
+        count_py_ops = self.__count_py_ops(operations)
         count_pyfunc = self.__count_pyfuncs(operations)
+        # Whether to execute ops in the thread mode
+        # op_type                      python_multiprocessing  run_in_thread
+        # c_op(s)                      false                   yes
+        # c_op(s)                      true                    yes
+        # py_op(s) / PyFunc            false                   yes
+        # py_op(s) / PyFunc            true                    no
+        # c_op(s) + py_op(s) / PyFunc  false                   yes
+        # c_op(s) + py_op(s) / PyFunc  true                    no
+        run_in_thread = not self.python_multiprocessing or (count_pyfunc == 0 and count_py_ops == 0) or get_debug_mode()
+        if self.python_multiprocessing and platform.system().lower() == 'windows':
+            run_in_thread = True
         if count_new_transforms + count_pyfunc == len(operations):
             prev_op = None
             for op in operations:
@@ -3793,18 +3797,43 @@ class MapDataset(UnionBaseDataset):
                         op.implementation = Implementation.C
                 prev_op = op
             operations = self.__insert_debug_wrapper(operations)
-            operations = transforms.transforms.Compose.reduce(operations)
+            if run_in_thread:
+                operations = transforms.transforms.Compose.reduce(operations)
         elif count_old_transforms + count_pyfunc + count_non_data_vision_transforms == len(operations):
             operations = self.__insert_debug_wrapper(operations)
-            operations = transforms.py_transforms.Compose.reduce(operations)
+            if run_in_thread:
+                operations = transforms.py_transforms.Compose.reduce(operations)
         else:
             raise RuntimeError("Mixing old legacy c/py_transforms and new unified transforms is not allowed.")
-        self.operations = self.__process_final_operations(operations)
+        if run_in_thread:
+            self.operations = self.__process_final_operations(operations)
+        else:
+            self.operations = operations
         self.prepare_multiprocessing()
         callbacks = [cb.create_runtime_obj() for cb in self.callbacks]
-        return cde.MapNode(children[0], self.operations, self.input_columns, self.output_columns,
+        ## thread mode
+        if run_in_thread:
+            return cde.MapNode(children[0], self.operations, self.input_columns, self.output_columns,
+                               callbacks, OffloadToManualOffloadMode.get(self.offload), self.process_pool)
+        # Bind self.operations with self.process_pool
+        class _BindProcessPoolWithOperations:
+            def __init__(self, pool, operations):
+                self.pool = pool
+                self.operations = operations
+            def __call__(self):
+                pass
+        self.bound = _BindProcessPoolWithOperations(self.process_pool, self.operations)
+        ## process mode
+        # in multi process mode, we just transfer the self.bound which is not really used in c layer
+        # because when the pipeline is running, map thread transfer data through c++ shm & msg to Python Worker Process
+        return cde.MapNode(children[0], [self.bound], self.input_columns, self.output_columns,
                            callbacks, OffloadToManualOffloadMode.get(self.offload), self.process_pool)
     def __deepcopy__(self, memodict):
@@ -3857,10 +3886,22 @@ class MapDataset(UnionBaseDataset):
     @staticmethod
     def __count_pyfuncs(operations):
         """
-        Count the number of pyfuncs operations
+        Count the number of pyfuncs operations which is defined by user
         """
         return sum([1 if isinstance(op, FuncWrapper) else 0 for op in operations])
+    @staticmethod
+    def __count_py_ops(operations):
+        """
+        Count the number of python operations which is built-in
+        """
+        count = 0
+        for op in operations:
+            if hasattr(op, "implementation") and op.implementation != Implementation.C \
+                and op.implementation is not None:
+                count += 1
+        return count
     @staticmethod
     def __count_transforms(operations):
         """
@@ -3924,7 +3965,6 @@ class MapDataset(UnionBaseDataset):
                            " Ignoring Python multiprocessing for map operation.")
             return
         if self.python_multiprocessing:
-            iter_specific_operations = []
             callable_list = []
             # If user didn't specify num_parallel_workers, set it to default
@@ -3941,18 +3981,6 @@ class MapDataset(UnionBaseDataset):
                 self.process_pool = _PythonMultiprocessing(get_multiprocessing_start_method(),
                                                            self.num_parallel_workers, str(self),
                                                            callable_list, self.max_rowsize)
-                # Pass #2
-                idx = 0
-                for op in self.operations:
-                    # our c transforms is now callable and should not be run in Python multithreading
-                    if MapDataset.__operation_valid_for_multiprocessing(op):
-                        # Wrap Python callable into _PythonCallable
-                        iter_specific_operations.append(_PythonCallable(op, idx, self.process_pool))
-                        idx += 1
-                    else:
-                        # CPP ops remain the same
-                        iter_specific_operations.append(op)
-                self.operations = iter_specific_operations
     def __insert_debug_wrapper(self, operations):
         """
@@ -4385,7 +4413,7 @@ class TransferDataset(Dataset):
     def create_dict_iterator(self, num_epochs=-1, output_numpy=False):
         raise RuntimeError("TransferDataset is not iterable.")
-    def create_tuple_iterator(self, columns=None, num_epochs=-1, output_numpy=False, do_copy=True):
+    def create_tuple_iterator(self, columns=None, num_epochs=-1, output_numpy=False, do_copy=False):
         raise RuntimeError("TransferDataset is not iterable.")
     def __iter__(self):