PyPI - numba-cuda - Versions diffs - 0.19.0__py3-none-any.whl → 0.20.0__py3-none-any.whl - Mend

numba-cuda 0.19.0py3-none-any.whl → 0.20.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of numba-cuda might be problematic. Click here for more details.

Files changed (353) hide show

_numba_cuda_redirector.pth +3 -0
_numba_cuda_redirector.py +3 -0
numba_cuda/VERSION +1 -1
numba_cuda/__init__.py +2 -1
numba_cuda/_version.py +2 -13
numba_cuda/numba/cuda/__init__.py +4 -1
numba_cuda/numba/cuda/_internal/cuda_bf16.py +12708 -1469
numba_cuda/numba/cuda/_internal/cuda_fp16.py +2656 -8769
numba_cuda/numba/cuda/api.py +9 -1
numba_cuda/numba/cuda/api_util.py +3 -0
numba_cuda/numba/cuda/args.py +3 -0
numba_cuda/numba/cuda/bf16.py +288 -2
numba_cuda/numba/cuda/cg.py +3 -0
numba_cuda/numba/cuda/cgutils.py +5 -2
numba_cuda/numba/cuda/cloudpickle/__init__.py +21 -0
numba_cuda/numba/cuda/cloudpickle/cloudpickle.py +1598 -0
numba_cuda/numba/cuda/cloudpickle/cloudpickle_fast.py +17 -0
numba_cuda/numba/cuda/codegen.py +4 -1
numba_cuda/numba/cuda/compiler.py +376 -30
numba_cuda/numba/cuda/core/analysis.py +319 -0
numba_cuda/numba/cuda/core/annotations/__init__.py +0 -0
numba_cuda/numba/cuda/core/annotations/type_annotations.py +304 -0
numba_cuda/numba/cuda/core/base.py +1289 -0
numba_cuda/numba/cuda/core/bytecode.py +727 -0
numba_cuda/numba/cuda/core/caching.py +5 -2
numba_cuda/numba/cuda/core/callconv.py +3 -0
numba_cuda/numba/cuda/core/codegen.py +3 -0
numba_cuda/numba/cuda/core/compiler.py +9 -14
numba_cuda/numba/cuda/core/compiler_machinery.py +497 -0
numba_cuda/numba/cuda/core/config.py +747 -0
numba_cuda/numba/cuda/core/consts.py +124 -0
numba_cuda/numba/cuda/core/cpu.py +370 -0
numba_cuda/numba/cuda/core/environment.py +68 -0
numba_cuda/numba/cuda/core/event.py +511 -0
numba_cuda/numba/cuda/core/funcdesc.py +330 -0
numba_cuda/numba/cuda/core/inline_closurecall.py +1889 -0
numba_cuda/numba/cuda/core/interpreter.py +52 -27
numba_cuda/numba/cuda/core/ir_utils.py +17 -29
numba_cuda/numba/cuda/core/options.py +262 -0
numba_cuda/numba/cuda/core/postproc.py +249 -0
numba_cuda/numba/cuda/core/pythonapi.py +1868 -0
numba_cuda/numba/cuda/core/rewrites/__init__.py +26 -0
numba_cuda/numba/cuda/core/rewrites/ir_print.py +90 -0
numba_cuda/numba/cuda/core/rewrites/registry.py +104 -0
numba_cuda/numba/cuda/core/rewrites/static_binop.py +40 -0
numba_cuda/numba/cuda/core/rewrites/static_getitem.py +187 -0
numba_cuda/numba/cuda/core/rewrites/static_raise.py +98 -0
numba_cuda/numba/cuda/core/sigutils.py +3 -0
numba_cuda/numba/cuda/core/ssa.py +496 -0
numba_cuda/numba/cuda/core/targetconfig.py +329 -0
numba_cuda/numba/cuda/core/tracing.py +231 -0
numba_cuda/numba/cuda/core/transforms.py +952 -0
numba_cuda/numba/cuda/core/typed_passes.py +741 -7
numba_cuda/numba/cuda/core/typeinfer.py +1948 -0
numba_cuda/numba/cuda/core/unsafe/__init__.py +0 -0
numba_cuda/numba/cuda/core/unsafe/bytes.py +67 -0
numba_cuda/numba/cuda/core/unsafe/eh.py +66 -0
numba_cuda/numba/cuda/core/unsafe/refcount.py +98 -0
numba_cuda/numba/cuda/core/untyped_passes.py +1983 -0
numba_cuda/numba/cuda/cpython/cmathimpl.py +560 -0
numba_cuda/numba/cuda/cpython/mathimpl.py +499 -0
numba_cuda/numba/cuda/cpython/numbers.py +1474 -0
numba_cuda/numba/cuda/cuda_paths.py +425 -246
numba_cuda/numba/cuda/cudadecl.py +4 -1
numba_cuda/numba/cuda/cudadrv/__init__.py +4 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +5 -1
numba_cuda/numba/cuda/cudadrv/devices.py +3 -0
numba_cuda/numba/cuda/cudadrv/driver.py +14 -140
numba_cuda/numba/cuda/cudadrv/drvapi.py +3 -0
numba_cuda/numba/cuda/cudadrv/dummyarray.py +114 -24
numba_cuda/numba/cuda/cudadrv/enums.py +3 -0
numba_cuda/numba/cuda/cudadrv/error.py +4 -0
numba_cuda/numba/cuda/cudadrv/libs.py +8 -5
numba_cuda/numba/cuda/cudadrv/linkable_code.py +3 -0
numba_cuda/numba/cuda/cudadrv/mappings.py +4 -1
numba_cuda/numba/cuda/cudadrv/ndarray.py +3 -0
numba_cuda/numba/cuda/cudadrv/nvrtc.py +22 -8
numba_cuda/numba/cuda/cudadrv/nvvm.py +4 -4
numba_cuda/numba/cuda/cudadrv/rtapi.py +3 -0
numba_cuda/numba/cuda/cudadrv/runtime.py +4 -1
numba_cuda/numba/cuda/cudaimpl.py +8 -1
numba_cuda/numba/cuda/cudamath.py +3 -0
numba_cuda/numba/cuda/debuginfo.py +88 -2
numba_cuda/numba/cuda/decorators.py +6 -3
numba_cuda/numba/cuda/descriptor.py +6 -4
numba_cuda/numba/cuda/device_init.py +3 -0
numba_cuda/numba/cuda/deviceufunc.py +69 -2
numba_cuda/numba/cuda/dispatcher.py +21 -39
numba_cuda/numba/cuda/errors.py +10 -0
numba_cuda/numba/cuda/extending.py +3 -0
numba_cuda/numba/cuda/flags.py +143 -1
numba_cuda/numba/cuda/fp16.py +3 -2
numba_cuda/numba/cuda/include/13/cuda_bf16.h +5118 -0
numba_cuda/numba/cuda/include/13/cuda_bf16.hpp +3865 -0
numba_cuda/numba/cuda/include/13/cuda_fp16.h +5363 -0
numba_cuda/numba/cuda/include/13/cuda_fp16.hpp +3483 -0
numba_cuda/numba/cuda/initialize.py +4 -0
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -0
numba_cuda/numba/cuda/intrinsics.py +3 -0
numba_cuda/numba/cuda/itanium_mangler.py +3 -0
numba_cuda/numba/cuda/kernels/__init__.py +2 -0
numba_cuda/numba/cuda/kernels/reduction.py +3 -0
numba_cuda/numba/cuda/kernels/transpose.py +3 -0
numba_cuda/numba/cuda/libdevice.py +4 -0
numba_cuda/numba/cuda/libdevicedecl.py +3 -0
numba_cuda/numba/cuda/libdevicefuncs.py +3 -0
numba_cuda/numba/cuda/libdeviceimpl.py +3 -0
numba_cuda/numba/cuda/locks.py +3 -0
numba_cuda/numba/cuda/lowering.py +59 -159
numba_cuda/numba/cuda/mathimpl.py +5 -1
numba_cuda/numba/cuda/memory_management/__init__.py +3 -0
numba_cuda/numba/cuda/memory_management/memsys.cu +5 -0
numba_cuda/numba/cuda/memory_management/memsys.cuh +5 -0
numba_cuda/numba/cuda/memory_management/nrt.cu +5 -0
numba_cuda/numba/cuda/memory_management/nrt.cuh +5 -0
numba_cuda/numba/cuda/memory_management/nrt.py +48 -18
numba_cuda/numba/cuda/misc/findlib.py +75 -0
numba_cuda/numba/cuda/models.py +12 -1
numba_cuda/numba/cuda/np/npdatetime_helpers.py +217 -0
numba_cuda/numba/cuda/np/npyfuncs.py +1807 -0
numba_cuda/numba/cuda/np/numpy_support.py +553 -0
numba_cuda/numba/cuda/np/ufunc/ufuncbuilder.py +59 -0
numba_cuda/numba/cuda/nvvmutils.py +4 -1
numba_cuda/numba/cuda/printimpl.py +15 -1
numba_cuda/numba/cuda/random.py +4 -1
numba_cuda/numba/cuda/reshape_funcs.cu +5 -0
numba_cuda/numba/cuda/serialize.py +4 -1
numba_cuda/numba/cuda/simulator/__init__.py +4 -1
numba_cuda/numba/cuda/simulator/_internal/__init__.py +3 -0
numba_cuda/numba/cuda/simulator/_internal/cuda_bf16.py +2 -0
numba_cuda/numba/cuda/simulator/api.py +4 -1
numba_cuda/numba/cuda/simulator/bf16.py +3 -0
numba_cuda/numba/cuda/simulator/compiler.py +7 -0
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +4 -1
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/dummyarray.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/error.py +4 -0
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +4 -0
numba_cuda/numba/cuda/simulator/cudadrv/linkable_code.py +4 -0
numba_cuda/numba/cuda/simulator/cudadrv/nvrtc.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -0
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -0
numba_cuda/numba/cuda/simulator/dispatcher.py +4 -0
numba_cuda/numba/cuda/simulator/kernel.py +3 -0
numba_cuda/numba/cuda/simulator/kernelapi.py +4 -1
numba_cuda/numba/cuda/simulator/memory_management/__init__.py +3 -0
numba_cuda/numba/cuda/simulator/memory_management/nrt.py +17 -2
numba_cuda/numba/cuda/simulator/reduction.py +3 -0
numba_cuda/numba/cuda/simulator/vector_types.py +3 -0
numba_cuda/numba/cuda/simulator_init.py +3 -0
numba_cuda/numba/cuda/stubs.py +3 -0
numba_cuda/numba/cuda/target.py +38 -17
numba_cuda/numba/cuda/testing.py +7 -19
numba_cuda/numba/cuda/tests/__init__.py +4 -1
numba_cuda/numba/cuda/tests/cloudpickle_main_class.py +9 -0
numba_cuda/numba/cuda/tests/complex_usecases.py +3 -0
numba_cuda/numba/cuda/tests/core/serialize_usecases.py +3 -0
numba_cuda/numba/cuda/tests/core/test_itanium_mangler.py +3 -0
numba_cuda/numba/cuda/tests/core/test_serialize.py +7 -4
numba_cuda/numba/cuda/tests/cudadrv/__init__.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +9 -3
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_is_fp16.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +21 -2
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +5 -1
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_nvrtc.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +4 -1
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +3 -0
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/__init__.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/cg_cache_usecases.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_array.py +5 -1
numba_cuda/numba/cuda/tests/cudapy/test_array_alignment.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_bfloat16.py +542 -2
numba_cuda/numba/cuda/tests/cudapy/test_bfloat16_bindings.py +84 -1
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_copy_propagate.py +130 -0
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +314 -3
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo_types.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +5 -1
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_inline.py +21 -8
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_ir_utils.py +13 -37
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_math.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_print.py +23 -0
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_random.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_ssa.py +453 -0
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_typeinfer.py +538 -0
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +266 -2
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +115 -6
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +3 -0
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +4 -1
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +4 -1
numba_cuda/numba/cuda/tests/cudasim/__init__.py +3 -0
numba_cuda/numba/cuda/tests/cudasim/support.py +3 -0
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +3 -0
numba_cuda/numba/cuda/tests/data/__init__.py +2 -0
numba_cuda/numba/cuda/tests/data/cta_barrier.cu +5 -0
numba_cuda/numba/cuda/tests/data/cuda_include.cu +5 -0
numba_cuda/numba/cuda/tests/data/error.cu +5 -0
numba_cuda/numba/cuda/tests/data/include/add.cuh +5 -0
numba_cuda/numba/cuda/tests/data/jitlink.cu +5 -0
numba_cuda/numba/cuda/tests/data/warn.cu +5 -0
numba_cuda/numba/cuda/tests/doc_examples/__init__.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/ffi/__init__.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/ffi/functions.cu +5 -0
numba_cuda/numba/cuda/tests/doc_examples/ffi/include/mul.cuh +5 -0
numba_cuda/numba/cuda/tests/doc_examples/ffi/saxpy.cu +5 -0
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +3 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cpointer.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +6 -2
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +3 -2
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +3 -2
numba_cuda/numba/cuda/tests/doc_examples/test_ufunc.py +3 -0
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +3 -0
numba_cuda/numba/cuda/tests/enum_usecases.py +3 -0
numba_cuda/numba/cuda/tests/nocuda/__init__.py +3 -0
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +3 -0
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +3 -0
numba_cuda/numba/cuda/tests/nocuda/test_import.py +6 -1
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +27 -12
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +3 -0
numba_cuda/numba/cuda/tests/nrt/__init__.py +3 -0
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +5 -1
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +3 -0
numba_cuda/numba/cuda/tests/support.py +58 -15
numba_cuda/numba/cuda/tests/test_binary_generation/Makefile +3 -0
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -1
numba_cuda/numba/cuda/tests/test_binary_generation/nrt_extern.cu +5 -0
numba_cuda/numba/cuda/tests/test_binary_generation/test_device_functions.cu +5 -0
numba_cuda/numba/cuda/tests/test_binary_generation/undefined_extern.cu +5 -0
numba_cuda/numba/cuda/tests/test_tracing.py +200 -0
numba_cuda/numba/cuda/types.py +59 -0
numba_cuda/numba/cuda/typing/__init__.py +12 -1
numba_cuda/numba/cuda/typing/cffi_utils.py +55 -0
numba_cuda/numba/cuda/typing/context.py +751 -0
numba_cuda/numba/cuda/typing/enumdecl.py +74 -0
numba_cuda/numba/cuda/typing/npydecl.py +658 -0
numba_cuda/numba/cuda/typing/templates.py +10 -14
numba_cuda/numba/cuda/ufuncs.py +6 -3
numba_cuda/numba/cuda/utils.py +9 -112
numba_cuda/numba/cuda/vector_types.py +3 -0
numba_cuda/numba/cuda/vectorizers.py +3 -0
{numba_cuda-0.19.0.dist-info → numba_cuda-0.20.0.dist-info}/METADATA +6 -2
numba_cuda-0.20.0.dist-info/RECORD +357 -0
{numba_cuda-0.19.0.dist-info → numba_cuda-0.20.0.dist-info}/licenses/LICENSE +1 -0
numba_cuda-0.20.0.dist-info/licenses/LICENSE.numba +24 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +0 -57
numba_cuda-0.19.0.dist-info/RECORD +0 -301
{numba_cuda-0.19.0.dist-info → numba_cuda-0.20.0.dist-info}/WHEEL +0 -0
{numba_cuda-0.19.0.dist-info → numba_cuda-0.20.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/typing/npydecl.py ADDED Viewed

@@ -0,0 +1,658 @@
+# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: BSD-2-Clause
+import numpy as np
+import operator
+from numba.cuda.typing.templates import AbstractTemplate, Registry, signature
+from numba.core import types
+from numba.cuda import utils
+from numba.core.errors import TypingError, NumbaTypeError
+from numba.cuda.np.numpy_support import (
+    ufunc_find_matching_loop,
+    supported_ufunc_loop,
+    from_dtype,
+    as_dtype,
+    resolve_output_type,
+    _ufunc_loop_sig,
+)
+registry = Registry()
+infer = registry.register
+infer_global = registry.register_global
+infer_getattr = registry.register_attr
+class Numpy_rules_ufunc(AbstractTemplate):
+    @classmethod
+    def _handle_inputs(cls, ufunc, args, kws):
+        """
+        Process argument types to a given *ufunc*.
+        Returns a (base types, explicit outputs, ndims, layout) tuple where:
+        - `base types` is a tuple of scalar types for each input
+        - `explicit outputs` is a tuple of explicit output types (arrays)
+        - `ndims` is the number of dimensions of the loop and also of
+          any outputs, explicit or implicit
+        - `layout` is the layout for any implicit output to be allocated
+        """
+        nin = ufunc.nin
+        nout = ufunc.nout
+        nargs = ufunc.nargs
+        # preconditions
+        assert nargs == nin + nout
+        if len(args) < nin:
+            msg = "ufunc '{0}': not enough arguments ({1} found, {2} required)"
+            raise TypingError(msg=msg.format(ufunc.__name__, len(args), nin))
+        if len(args) > nargs:
+            msg = "ufunc '{0}': too many arguments ({1} found, {2} maximum)"
+            raise TypingError(msg=msg.format(ufunc.__name__, len(args), nargs))
+        args = [
+            a.as_array if isinstance(a, types.ArrayCompatible) else a
+            for a in args
+        ]
+        arg_ndims = [
+            a.ndim if isinstance(a, types.ArrayCompatible) else 0 for a in args
+        ]
+        ndims = max(arg_ndims)
+        # explicit outputs must be arrays (no explicit scalar return values supported)
+        explicit_outputs = args[nin:]
+        if not all(
+            isinstance(output, types.ArrayCompatible)
+            for output in explicit_outputs
+        ):
+            msg = "ufunc '{0}' called with an explicit output that is not an array"
+            raise TypingError(msg=msg.format(ufunc.__name__))
+        if not all(output.mutable for output in explicit_outputs):
+            msg = "ufunc '{0}' called with an explicit output that is read-only"
+            raise TypingError(msg=msg.format(ufunc.__name__))
+        # find the kernel to use, based only in the input types (as does NumPy)
+        base_types = [
+            x.dtype if isinstance(x, types.ArrayCompatible) else x for x in args
+        ]
+        # Figure out the output array layout, if needed.
+        layout = None
+        if ndims > 0 and (len(explicit_outputs) < ufunc.nout):
+            layout = "C"
+            layouts = [
+                x.layout if isinstance(x, types.ArrayCompatible) else ""
+                for x in args
+            ]
+            # Prefer C contig if any array is C contig.
+            # Next, prefer F contig.
+            # Defaults to C contig if not layouts are C/F.
+            if "C" not in layouts and "F" in layouts:
+                layout = "F"
+        return base_types, explicit_outputs, ndims, layout
+    @property
+    def ufunc(self):
+        return self.key
+    def generic(self, args, kws):
+        # First, strip optional types, ufunc loops are typed on concrete types
+        args = [x.type if isinstance(x, types.Optional) else x for x in args]
+        ufunc = self.ufunc
+        base_types, explicit_outputs, ndims, layout = self._handle_inputs(
+            ufunc, args, kws
+        )
+        ufunc_loop = ufunc_find_matching_loop(ufunc, base_types)
+        if ufunc_loop is None:
+            raise TypingError(
+                "can't resolve ufunc {0} for types {1}".format(
+                    ufunc.__name__, args
+                )
+            )
+        # check if all the types involved in the ufunc loop are supported in this mode
+        if not supported_ufunc_loop(ufunc, ufunc_loop):
+            msg = "ufunc '{0}' using the loop '{1}' not supported in this mode"
+            raise TypingError(
+                msg=msg.format(ufunc.__name__, ufunc_loop.ufunc_sig)
+            )
+        # if there is any explicit output type, check that it is valid
+        explicit_outputs_np = [as_dtype(tp.dtype) for tp in explicit_outputs]
+        # Numpy will happily use unsafe conversions (although it will actually warn)
+        if not all(
+            np.can_cast(fromty, toty, "unsafe")
+            for (fromty, toty) in zip(
+                ufunc_loop.numpy_outputs, explicit_outputs_np
+            )
+        ):
+            msg = "ufunc '{0}' can't cast result to explicit result type"
+            raise TypingError(msg=msg.format(ufunc.__name__))
+        # A valid loop was found that is compatible. The result of type inference should
+        # be based on the explicit output types, and when not available with the type given
+        # by the selected NumPy loop
+        out = list(explicit_outputs)
+        implicit_output_count = ufunc.nout - len(explicit_outputs)
+        if implicit_output_count > 0:
+            # XXX this is sometimes wrong for datetime64 and timedelta64,
+            # as ufunc_find_matching_loop() doesn't do any type inference
+            ret_tys = ufunc_loop.outputs[-implicit_output_count:]
+            if ndims > 0:
+                assert layout is not None
+                # If either of the types involved in the ufunc operation have a
+                # __array_ufunc__ method then invoke the first such one to
+                # determine the output type of the ufunc.
+                array_ufunc_type = None
+                for a in args:
+                    if hasattr(a, "__array_ufunc__"):
+                        array_ufunc_type = a
+                        break
+                output_type = types.Array
+                if array_ufunc_type is not None:
+                    output_type = array_ufunc_type.__array_ufunc__(
+                        ufunc, "__call__", *args, **kws
+                    )
+                    if output_type is NotImplemented:
+                        msg = (
+                            f"unsupported use of ufunc {ufunc} on "
+                            f"{array_ufunc_type}"
+                        )
+                        # raise TypeError here because
+                        # NumpyRulesArrayOperator.generic is capturing
+                        # TypingError
+                        raise NumbaTypeError(msg)
+                    elif not issubclass(output_type, types.Array):
+                        msg = (
+                            f"ufunc {ufunc} on {array_ufunc_type}"
+                            f"cannot return non-array {output_type}"
+                        )
+                        # raise TypeError here because
+                        # NumpyRulesArrayOperator.generic is capturing
+                        # TypingError
+                        raise NumbaTypeError(msg)
+                ret_tys = [
+                    output_type(dtype=ret_ty, ndim=ndims, layout=layout)
+                    for ret_ty in ret_tys
+                ]
+                ret_tys = [
+                    resolve_output_type(self.context, args, ret_ty)
+                    for ret_ty in ret_tys
+                ]
+            out.extend(ret_tys)
+        return _ufunc_loop_sig(out, args)
+class NumpyRulesArrayOperator(Numpy_rules_ufunc):
+    _op_map = {
+        operator.add: "add",
+        operator.sub: "subtract",
+        operator.mul: "multiply",
+        operator.truediv: "true_divide",
+        operator.floordiv: "floor_divide",
+        operator.mod: "remainder",
+        operator.pow: "power",
+        operator.lshift: "left_shift",
+        operator.rshift: "right_shift",
+        operator.and_: "bitwise_and",
+        operator.or_: "bitwise_or",
+        operator.xor: "bitwise_xor",
+        operator.eq: "equal",
+        operator.gt: "greater",
+        operator.ge: "greater_equal",
+        operator.lt: "less",
+        operator.le: "less_equal",
+        operator.ne: "not_equal",
+    }
+    @property
+    def ufunc(self):
+        return getattr(np, self._op_map[self.key])
+    @classmethod
+    def install_operations(cls):
+        for op, ufunc_name in cls._op_map.items():
+            infer_global(op)(
+                type(
+                    "NumpyRulesArrayOperator_" + ufunc_name,
+                    (cls,),
+                    dict(key=op),
+                )
+            )
+    def generic(self, args, kws):
+        """Overloads and calls base class generic() method, returning
+        None if a TypingError occurred.
+        Returning None for operators is important since operators are
+        heavily overloaded, and by suppressing type errors, we allow
+        type inference to check other possibilities before giving up
+        (particularly user-defined operators).
+        """
+        try:
+            sig = super(NumpyRulesArrayOperator, self).generic(args, kws)
+        except TypingError:
+            return None
+        if sig is None:
+            return None
+        args = sig.args
+        # Only accept at least one array argument, otherwise the operator
+        # doesn't involve Numpy's ufunc machinery.
+        if not any(isinstance(arg, types.ArrayCompatible) for arg in args):
+            return None
+        return sig
+_binop_map = NumpyRulesArrayOperator._op_map
+class NumpyRulesInplaceArrayOperator(NumpyRulesArrayOperator):
+    _op_map = {
+        operator.iadd: "add",
+        operator.isub: "subtract",
+        operator.imul: "multiply",
+        operator.itruediv: "true_divide",
+        operator.ifloordiv: "floor_divide",
+        operator.imod: "remainder",
+        operator.ipow: "power",
+        operator.ilshift: "left_shift",
+        operator.irshift: "right_shift",
+        operator.iand: "bitwise_and",
+        operator.ior: "bitwise_or",
+        operator.ixor: "bitwise_xor",
+    }
+    def generic(self, args, kws):
+        # Type the inplace operator as if an explicit output was passed,
+        # to handle type resolution correctly.
+        # (for example int8[:] += int16[:] should use an int8[:] output,
+        #  not int16[:])
+        lhs, rhs = args
+        if not isinstance(lhs, types.ArrayCompatible):
+            return
+        args = args + (lhs,)
+        sig = super(NumpyRulesInplaceArrayOperator, self).generic(args, kws)
+        # Strip off the fake explicit output
+        assert len(sig.args) == 3
+        real_sig = signature(sig.return_type, *sig.args[:2])
+        return real_sig
+class NumpyRulesUnaryArrayOperator(NumpyRulesArrayOperator):
+    _op_map = {
+        operator.pos: "positive",
+        operator.neg: "negative",
+        operator.invert: "invert",
+    }
+    def generic(self, args, kws):
+        assert not kws
+        if len(args) == 1 and isinstance(args[0], types.ArrayCompatible):
+            return super(NumpyRulesUnaryArrayOperator, self).generic(args, kws)
+# list of unary ufuncs to register
+math_operations = [
+    "add",
+    "subtract",
+    "multiply",
+    "logaddexp",
+    "logaddexp2",
+    "true_divide",
+    "floor_divide",
+    "negative",
+    "positive",
+    "power",
+    "float_power",
+    "remainder",
+    "fmod",
+    "absolute",
+    "rint",
+    "sign",
+    "conjugate",
+    "exp",
+    "exp2",
+    "log",
+    "log2",
+    "log10",
+    "expm1",
+    "log1p",
+    "sqrt",
+    "square",
+    "cbrt",
+    "reciprocal",
+    "divide",
+    "mod",
+    "divmod",
+    "abs",
+    "fabs",
+    "gcd",
+    "lcm",
+]
+trigonometric_functions = [
+    "sin",
+    "cos",
+    "tan",
+    "arcsin",
+    "arccos",
+    "arctan",
+    "arctan2",
+    "hypot",
+    "sinh",
+    "cosh",
+    "tanh",
+    "arcsinh",
+    "arccosh",
+    "arctanh",
+    "deg2rad",
+    "rad2deg",
+    "degrees",
+    "radians",
+]
+bit_twiddling_functions = [
+    "bitwise_and",
+    "bitwise_or",
+    "bitwise_xor",
+    "invert",
+    "left_shift",
+    "right_shift",
+    "bitwise_not",
+]
+comparison_functions = [
+    "greater",
+    "greater_equal",
+    "less",
+    "less_equal",
+    "not_equal",
+    "equal",
+    "logical_and",
+    "logical_or",
+    "logical_xor",
+    "logical_not",
+    "maximum",
+    "minimum",
+    "fmax",
+    "fmin",
+]
+floating_functions = [
+    "isfinite",
+    "isinf",
+    "isnan",
+    "signbit",
+    "copysign",
+    "nextafter",
+    "modf",
+    "ldexp",
+    "frexp",
+    "floor",
+    "ceil",
+    "trunc",
+    "spacing",
+]
+logic_functions = ["isnat"]
+# This is a set of the ufuncs that are not yet supported by Lowering. In order
+# to trigger no-python mode we must not register them until their Lowering is
+# implemented.
+#
+# It also works as a nice TODO list for ufunc support :)
+_unsupported = set(
+    [
+        "frexp",
+        "modf",
+    ]
+)
+def register_numpy_ufunc(name, register_global=infer_global):
+    func = getattr(np, name)
+    class typing_class(Numpy_rules_ufunc):
+        key = func
+    typing_class.__name__ = "resolve_{0}".format(name)
+    # A list of ufuncs that are in fact aliases of other ufuncs. They need to
+    # insert the resolve method, but not register the ufunc itself
+    aliases = ("abs", "bitwise_not", "divide", "abs")
+    if name not in aliases:
+        register_global(func, types.Function(typing_class))
+all_ufuncs = sum(
+    [
+        math_operations,
+        trigonometric_functions,
+        bit_twiddling_functions,
+        comparison_functions,
+        floating_functions,
+        logic_functions,
+    ],
+    [],
+)
+supported_ufuncs = [x for x in all_ufuncs if x not in _unsupported]
+for func in supported_ufuncs:
+    register_numpy_ufunc(func)
+all_ufuncs = [getattr(np, name) for name in all_ufuncs]
+supported_ufuncs = [getattr(np, name) for name in supported_ufuncs]
+NumpyRulesUnaryArrayOperator.install_operations()
+NumpyRulesArrayOperator.install_operations()
+NumpyRulesInplaceArrayOperator.install_operations()
+supported_array_operators = (
+    set(NumpyRulesUnaryArrayOperator._op_map.keys())
+    .union(NumpyRulesArrayOperator._op_map.keys())
+    .union(NumpyRulesInplaceArrayOperator._op_map.keys())
+)
+del _unsupported
+# -----------------------------------------------------------------------------
+# Install global helpers for array methods.
+class Numpy_method_redirection(AbstractTemplate):
+    """
+    A template redirecting a Numpy global function (e.g. np.sum) to an
+    array method of the same name (e.g. ndarray.sum).
+    """
+    # Arguments like *axis* can specialize on literals but also support
+    # non-literals
+    prefer_literal = True
+    def generic(self, args, kws):
+        pysig = None
+        if kws:
+            if self.method_name == "sum":
+                if "axis" in kws and "dtype" not in kws:
+                    def sum_stub(arr, axis):
+                        pass
+                    pysig = utils.pysignature(sum_stub)
+                elif "dtype" in kws and "axis" not in kws:
+                    def sum_stub(arr, dtype):
+                        pass
+                    pysig = utils.pysignature(sum_stub)
+                elif "dtype" in kws and "axis" in kws:
+                    def sum_stub(arr, axis, dtype):
+                        pass
+                    pysig = utils.pysignature(sum_stub)
+            elif self.method_name == "argsort":
+                def argsort_stub(arr, kind="quicksort"):
+                    pass
+                pysig = utils.pysignature(argsort_stub)
+            else:
+                fmt = "numba doesn't support kwarg for {}"
+                raise TypingError(fmt.format(self.method_name))
+        arr = args[0]
+        # This will return a BoundFunction
+        meth_ty = self.context.resolve_getattr(arr, self.method_name)
+        # Resolve arguments on the bound function
+        meth_sig = self.context.resolve_function_type(meth_ty, args[1:], kws)
+        if meth_sig is not None:
+            return meth_sig.as_function().replace(pysig=pysig)
+# Function to glue attributes onto the numpy-esque object
+def _numpy_redirect(fname):
+    numpy_function = getattr(np, fname)
+    cls = type(
+        "Numpy_redirect_{0}".format(fname),
+        (Numpy_method_redirection,),
+        dict(key=numpy_function, method_name=fname),
+    )
+    infer_global(numpy_function, types.Function(cls))
+for func in ["sum", "argsort", "nonzero", "ravel"]:
+    _numpy_redirect(func)
+# -----------------------------------------------------------------------------
+# Numpy scalar constructors
+# Register np.int8, etc. as converters to the equivalent Numba types
+np_types = set(getattr(np, str(nb_type)) for nb_type in types.number_domain)
+np_types.add(np.bool_)
+# Those may or may not be aliases (depending on the Numpy build / version)
+np_types.add(np.intc)
+np_types.add(np.intp)
+np_types.add(np.uintc)
+np_types.add(np.uintp)
+def register_number_classes(register_global):
+    for np_type in np_types:
+        nb_type = getattr(types, np_type.__name__)
+        register_global(np_type, types.NumberClass(nb_type))
+register_number_classes(infer_global)
+# -----------------------------------------------------------------------------
+# Numpy array constructors
+def parse_shape(shape):
+    """
+    Given a shape, return the number of dimensions.
+    """
+    ndim = None
+    if isinstance(shape, types.Integer):
+        ndim = 1
+    elif isinstance(shape, (types.Tuple, types.UniTuple)):
+        int_tys = (types.Integer, types.IntEnumMember)
+        if all(isinstance(s, int_tys) for s in shape):
+            ndim = len(shape)
+    return ndim
+def parse_dtype(dtype):
+    """
+    Return the dtype of a type, if it is either a DtypeSpec (used for most
+    dtypes) or a TypeRef (used for record types).
+    """
+    if isinstance(dtype, types.DTypeSpec):
+        return dtype.dtype
+    elif isinstance(dtype, types.TypeRef):
+        return dtype.instance_type
+    elif isinstance(dtype, types.StringLiteral):
+        dtstr = dtype.literal_value
+        try:
+            dt = np.dtype(dtstr)
+        except TypeError:
+            msg = f"Invalid NumPy dtype specified: '{dtstr}'"
+            raise TypingError(msg)
+        return from_dtype(dt)
+# -----------------------------------------------------------------------------
+# Miscellaneous functions
+@infer_global(np.ndenumerate)
+class NdEnumerate(AbstractTemplate):
+    def generic(self, args, kws):
+        assert not kws
+        (arr,) = args
+        if isinstance(arr, types.Array):
+            enumerate_type = types.NumpyNdEnumerateType(arr)
+            return signature(enumerate_type, *args)
+@infer_global(np.nditer)
+class NdIter(AbstractTemplate):
+    def generic(self, args, kws):
+        assert not kws
+        if len(args) != 1:
+            return
+        (arrays,) = args
+        if isinstance(arrays, types.BaseTuple):
+            if not arrays:
+                return
+            arrays = list(arrays)
+        else:
+            arrays = [arrays]
+        nditerty = types.NumpyNdIterType(arrays)
+        return signature(nditerty, *args)
+@infer_global(np.ndindex)
+class NdIndex(AbstractTemplate):
+    def generic(self, args, kws):
+        assert not kws
+        # Either ndindex(shape) or ndindex(*shape)
+        if len(args) == 1 and isinstance(args[0], types.BaseTuple):
+            tup = args[0]
+            if tup.count > 0 and not isinstance(tup, types.UniTuple):
+                # Heterogeneous tuple
+                return
+            shape = list(tup)
+        else:
+            shape = args
+        if all(isinstance(x, types.Integer) for x in shape):
+            iterator_type = types.NumpyNdIndexType(len(shape))
+            return signature(iterator_type, *args)
+@infer_global(operator.eq)
+class DtypeEq(AbstractTemplate):
+    def generic(self, args, kws):
+        [lhs, rhs] = args
+        if isinstance(lhs, types.DType) and isinstance(rhs, types.DType):
+            return signature(types.boolean, lhs, rhs)

numba-cuda 0.19.0__py3-none-any.whl → 0.20.0__py3-none-any.whl

Potentially problematic release.

numba-cuda 0.19.0py3-none-any.whl → 0.20.0py3-none-any.whl