PyPI - numba-cuda - Versions diffs - 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +463 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.0.dist-info/RECORD +0 -251
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py CHANGED Viewed

@@ -12,9 +12,11 @@ from numba.tests.support import override_config
 def _get_matmulcore_gufunc(dtype=float32):
-    @guvectorize([void(dtype[:, :], dtype[:, :], dtype[:, :])],
-                 '(m,n),(n,p)->(m,p)',
-                 target='cuda')
+    @guvectorize(
+        [void(dtype[:, :], dtype[:, :], dtype[:, :])],
+        "(m,n),(n,p)->(m,p)",
+        target="cuda",
+    )
     def matmulcore(A, B, C):
         m, n = A.shape
         n, p = B.shape
@@ -27,32 +29,33 @@ def _get_matmulcore_gufunc(dtype=float32):
     return matmulcore
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestCUDAGufunc(CUDATestCase):
     def test_gufunc_small(self):
         gufunc = _get_matmulcore_gufunc()
         matrix_ct = 2
-        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(matrix_ct, 2,
-                                                                   4)
-        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(matrix_ct, 4,
-                                                                   5)
+        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(
+            matrix_ct, 2, 4
+        )
+        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(
+            matrix_ct, 4, 5
+        )
         C = gufunc(A, B)
         Gold = np.matmul(A, B)
         self.assertTrue(np.allclose(C, Gold))
     def test_gufunc_auto_transfer(self):
         gufunc = _get_matmulcore_gufunc()
         matrix_ct = 2
-        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(matrix_ct, 2,
-                                                                   4)
-        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(matrix_ct, 4,
-                                                                   5)
+        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(
+            matrix_ct, 2, 4
+        )
+        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(
+            matrix_ct, 4, 5
+        )
         dB = cuda.to_device(B)
@@ -61,24 +64,24 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertTrue(np.allclose(C, Gold))
     def test_gufunc(self):
         gufunc = _get_matmulcore_gufunc()
-        matrix_ct = 1001 # an odd number to test thread/block division in CUDA
-        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(matrix_ct, 2,
-                                                                   4)
-        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(matrix_ct, 4,
-                                                                   5)
+        matrix_ct = 1001  # an odd number to test thread/block division in CUDA
+        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(
+            matrix_ct, 2, 4
+        )
+        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(
+            matrix_ct, 4, 5
+        )
         C = gufunc(A, B)
         Gold = np.matmul(A, B)
         self.assertTrue(np.allclose(C, Gold))
     def test_gufunc_hidim(self):
         gufunc = _get_matmulcore_gufunc()
-        matrix_ct = 100 # an odd number to test thread/block division in CUDA
+        matrix_ct = 100  # an odd number to test thread/block division in CUDA
         A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(4, 25, 2, 4)
         B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(4, 25, 4, 5)
@@ -87,7 +90,6 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertTrue(np.allclose(C, Gold))
     def test_gufunc_new_axis(self):
         gufunc = _get_matmulcore_gufunc(dtype=float64)
         X = np.random.randn(10, 3, 3)
@@ -102,15 +104,16 @@ class TestCUDAGufunc(CUDATestCase):
         np.testing.assert_allclose(gold, res2)
     def test_gufunc_stream(self):
         gufunc = _get_matmulcore_gufunc()
-        #cuda.driver.flush_pending_free()
-        matrix_ct = 1001 # an odd number to test thread/block division in CUDA
-        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(matrix_ct, 2,
-                                                                   4)
-        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(matrix_ct, 4,
-                                                                   5)
+        # cuda.driver.flush_pending_free()
+        matrix_ct = 1001  # an odd number to test thread/block division in CUDA
+        A = np.arange(matrix_ct * 2 * 4, dtype=np.float32).reshape(
+            matrix_ct, 2, 4
+        )
+        B = np.arange(matrix_ct * 4 * 5, dtype=np.float32).reshape(
+            matrix_ct, 4, 5
+        )
         stream = cuda.stream()
         dA = cuda.to_device(A, stream)
@@ -126,10 +129,7 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertTrue(np.allclose(C, Gold))
     def test_copy(self):
-        @guvectorize([void(float32[:], float32[:])],
-                     '(x)->(x)',
-                     target='cuda')
+        @guvectorize([void(float32[:], float32[:])], "(x)->(x)", target="cuda")
         def copy(A, B):
             for i in range(B.size):
                 B[i] = A[i]
@@ -142,9 +142,7 @@ class TestCUDAGufunc(CUDATestCase):
     def test_copy_unspecified_return(self):
         # Ensure that behaviour is correct when the return type is not
         # specified in the signature.
-        @guvectorize([(float32[:], float32[:])],
-                     '(x)->(x)',
-                     target='cuda')
+        @guvectorize([(float32[:], float32[:])], "(x)->(x)", target="cuda")
         def copy(A, B):
             for i in range(B.size):
                 B[i] = A[i]
@@ -155,10 +153,7 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertTrue(np.allclose(A, B))
     def test_copy_odd(self):
-        @guvectorize([void(float32[:], float32[:])],
-                     '(x)->(x)',
-                     target='cuda')
+        @guvectorize([void(float32[:], float32[:])], "(x)->(x)", target="cuda")
         def copy(A, B):
             for i in range(B.size):
                 B[i] = A[i]
@@ -169,10 +164,11 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertTrue(np.allclose(A, B))
     def test_copy2d(self):
-        @guvectorize([void(float32[:, :], float32[:, :])],
-                     '(x, y)->(x, y)',
-                     target='cuda')
+        @guvectorize(
+            [void(float32[:, :], float32[:, :])],
+            "(x, y)->(x, y)",
+            target="cuda",
+        )
         def copy2d(A, B):
             for x in range(B.shape[0]):
                 for y in range(B.shape[1]):
@@ -185,8 +181,7 @@ class TestCUDAGufunc(CUDATestCase):
     def test_not_supported_call_from_jit(self):
         # not supported
-        @guvectorize([void(int32[:], int32[:])],
-                     '(n)->(n)', target='cuda')
+        @guvectorize([void(int32[:], int32[:])], "(n)->(n)", target="cuda")
         def gufunc_copy(A, b):
             for i in range(A.shape[0]):
                 b[i] = A[i]
@@ -195,7 +190,7 @@ class TestCUDAGufunc(CUDATestCase):
         def cuda_jit(A, b):
             return gufunc_copy(A, b)
-        A = np.arange(1024 * 32).astype('int32')
+        A = np.arange(1024 * 32).astype("int32")
         b = np.zeros_like(A)
         msg = "Untyped global name 'gufunc_copy'.*"
         with self.assertRaisesRegex(TypingError, msg):
@@ -204,56 +199,68 @@ class TestCUDAGufunc(CUDATestCase):
     # Test inefficient use of the GPU where the inputs are all mapped onto a
     # single thread in a single block.
     def test_inefficient_launch_configuration(self):
-        @guvectorize(['void(float32[:], float32[:], float32[:])'],
-                     '(n),(n)->(n)', target='cuda')
+        @guvectorize(
+            ["void(float32[:], float32[:], float32[:])"],
+            "(n),(n)->(n)",
+            target="cuda",
+        )
         def numba_dist_cuda(a, b, dist):
             len = a.shape[0]
             for i in range(len):
                 dist[i] = a[i] * b[i]
-        a = np.random.rand(1024 * 32).astype('float32')
-        b = np.random.rand(1024 * 32).astype('float32')
-        dist = np.zeros(a.shape[0]).astype('float32')
+        a = np.random.rand(1024 * 32).astype("float32")
+        b = np.random.rand(1024 * 32).astype("float32")
+        dist = np.zeros(a.shape[0]).astype("float32")
-        with override_config('CUDA_LOW_OCCUPANCY_WARNINGS', 1):
+        with override_config("CUDA_LOW_OCCUPANCY_WARNINGS", 1):
             with warnings.catch_warnings(record=True) as w:
                 numba_dist_cuda(a, b, dist)
                 self.assertEqual(w[0].category, NumbaPerformanceWarning)
-                self.assertIn('Grid size', str(w[0].message))
-                self.assertIn('low occupancy', str(w[0].message))
+                self.assertIn("Grid size", str(w[0].message))
+                self.assertIn("low occupancy", str(w[0].message))
     def test_efficient_launch_configuration(self):
-        @guvectorize(['void(float32[:], float32[:], float32[:])'],
-                     '(n),(n)->(n)', nopython=True, target='cuda')
+        @guvectorize(
+            ["void(float32[:], float32[:], float32[:])"],
+            "(n),(n)->(n)",
+            nopython=True,
+            target="cuda",
+        )
         def numba_dist_cuda2(a, b, dist):
             len = a.shape[0]
             for i in range(len):
                 dist[i] = a[i] * b[i]
-        a = np.random.rand(524288 * 2).astype('float32').\
-            reshape((524288, 2))
-        b = np.random.rand(524288 * 2).astype('float32').\
-            reshape((524288, 2))
+        a = np.random.rand(524288 * 2).astype("float32").reshape((524288, 2))
+        b = np.random.rand(524288 * 2).astype("float32").reshape((524288, 2))
         dist = np.zeros_like(a)
-        with override_config('CUDA_LOW_OCCUPANCY_WARNINGS', 1):
+        with override_config("CUDA_LOW_OCCUPANCY_WARNINGS", 1):
             with warnings.catch_warnings(record=True) as w:
                 numba_dist_cuda2(a, b, dist)
                 self.assertEqual(len(w), 0)
     def test_nopython_flag(self):
         def foo(A, B):
             pass
         # nopython = True is fine
-        guvectorize([void(float32[:], float32[:])], '(x)->(x)', target='cuda',
-                    nopython=True)(foo)
+        guvectorize(
+            [void(float32[:], float32[:])],
+            "(x)->(x)",
+            target="cuda",
+            nopython=True,
+        )(foo)
         # nopython = False is bad
         with self.assertRaises(TypeError) as raises:
-            guvectorize([void(float32[:], float32[:])], '(x)->(x)',
-                        target='cuda', nopython=False)(foo)
+            guvectorize(
+                [void(float32[:], float32[:])],
+                "(x)->(x)",
+                target="cuda",
+                nopython=False,
+            )(foo)
         self.assertEqual("nopython flag must be True", str(raises.exception))
     def test_invalid_flags(self):
@@ -262,17 +269,22 @@ class TestCUDAGufunc(CUDATestCase):
             pass
         with self.assertRaises(TypeError) as raises:
-            guvectorize([void(float32[:], float32[:])], '(x)->(x)',
-                        target='cuda', what1=True, ever2=False)(foo)
+            guvectorize(
+                [void(float32[:], float32[:])],
+                "(x)->(x)",
+                target="cuda",
+                what1=True,
+                ever2=False,
+            )(foo)
         head = "The following target options are not supported:"
         msg = str(raises.exception)
-        self.assertEqual(msg[:len(head)], head)
-        items = msg[len(head):].strip().split(',')
+        self.assertEqual(msg[: len(head)], head)
+        items = msg[len(head) :].strip().split(",")
         items = [i.strip("'\" ") for i in items]
-        self.assertEqual(set(['what1', 'ever2']), set(items))
+        self.assertEqual(set(["what1", "ever2"]), set(items))
     def test_duplicated_output(self):
-        @guvectorize([void(float32[:], float32[:])], '(x)->(x)', target='cuda')
+        @guvectorize([void(float32[:], float32[:])], "(x)->(x)", target="cuda")
         def foo(inp, out):
             pass  # intentionally empty; never executed
@@ -284,8 +296,9 @@ class TestCUDAGufunc(CUDATestCase):
         self.assertEqual(str(raises.exception), msg)
     def check_tuple_arg(self, a, b):
-        @guvectorize([(float64[:], float64[:], float64[:])], '(n),(n)->()',
-                     target='cuda')
+        @guvectorize(
+            [(float64[:], float64[:], float64[:])], "(n),(n)->()", target="cuda"
+        )
         def gu_reduce(x, y, r):
             s = 0
             for i in range(len(x)):
@@ -297,44 +310,40 @@ class TestCUDAGufunc(CUDATestCase):
         np.testing.assert_equal(expected, r)
     def test_tuple_of_tuple_arg(self):
-        a = ((1.0, 2.0, 3.0),
-             (4.0, 5.0, 6.0))
-        b = ((1.5, 2.5, 3.5),
-             (4.5, 5.5, 6.5))
+        a = ((1.0, 2.0, 3.0), (4.0, 5.0, 6.0))
+        b = ((1.5, 2.5, 3.5), (4.5, 5.5, 6.5))
         self.check_tuple_arg(a, b)
     def test_tuple_of_namedtuple_arg(self):
-        Point = namedtuple('Point', ('x', 'y', 'z'))
-        a = (Point(x=1.0, y=2.0, z=3.0),
-             Point(x=4.0, y=5.0, z=6.0))
-        b = (Point(x=1.5, y=2.5, z=3.5),
-             Point(x=4.5, y=5.5, z=6.5))
+        Point = namedtuple("Point", ("x", "y", "z"))
+        a = (Point(x=1.0, y=2.0, z=3.0), Point(x=4.0, y=5.0, z=6.0))
+        b = (Point(x=1.5, y=2.5, z=3.5), Point(x=4.5, y=5.5, z=6.5))
         self.check_tuple_arg(a, b)
     def test_tuple_of_array_arg(self):
-        a = (np.asarray((1.0, 2.0, 3.0)),
-             np.asarray((4.0, 5.0, 6.0)))
-        b = (np.asarray((1.5, 2.5, 3.5)),
-             np.asarray((4.5, 5.5, 6.5)))
+        a = (np.asarray((1.0, 2.0, 3.0)), np.asarray((4.0, 5.0, 6.0)))
+        b = (np.asarray((1.5, 2.5, 3.5)), np.asarray((4.5, 5.5, 6.5)))
         self.check_tuple_arg(a, b)
     def test_gufunc_name(self):
         gufunc = _get_matmulcore_gufunc()
-        self.assertEqual(gufunc.__name__, 'matmulcore')
+        self.assertEqual(gufunc.__name__, "matmulcore")
     def test_bad_return_type(self):
         with self.assertRaises(TypeError) as te:
-            @guvectorize([int32(int32[:], int32[:])], '(m)->(m)', target='cuda')
+            @guvectorize([int32(int32[:], int32[:])], "(m)->(m)", target="cuda")
             def f(x, y):
                 pass
         msg = str(te.exception)
-        self.assertIn('guvectorized functions cannot return values', msg)
-        self.assertIn('specifies int32 return type', msg)
+        self.assertIn("guvectorized functions cannot return values", msg)
+        self.assertIn("specifies int32 return type", msg)
     def test_incorrect_number_of_pos_args(self):
-        @guvectorize([(int32[:], int32[:], int32[:])],
-                     '(m),(m)->(m)', target='cuda')
+        @guvectorize(
+            [(int32[:], int32[:], int32[:])], "(m),(m)->(m)", target="cuda"
+        )
         def f(x, y, z):
             pass
@@ -345,26 +354,28 @@ class TestCUDAGufunc(CUDATestCase):
             f(arr)
         msg = str(te.exception)
-        self.assertIn('gufunc accepts 2 positional arguments', msg)
-        self.assertIn('or 3 positional arguments', msg)
-        self.assertIn('Got 1 positional argument.', msg)
+        self.assertIn("gufunc accepts 2 positional arguments", msg)
+        self.assertIn("or 3 positional arguments", msg)
+        self.assertIn("Got 1 positional argument.", msg)
         # Inputs and outputs, too many
         with self.assertRaises(TypeError) as te:
             f(arr, arr, arr, arr)
         msg = str(te.exception)
-        self.assertIn('gufunc accepts 2 positional arguments', msg)
-        self.assertIn('or 3 positional arguments', msg)
-        self.assertIn('Got 4 positional arguments.', msg)
+        self.assertIn("gufunc accepts 2 positional arguments", msg)
+        self.assertIn("or 3 positional arguments", msg)
+        self.assertIn("Got 4 positional arguments.", msg)
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestMultipleOutputs(CUDATestCase):
     def test_multiple_outputs_same_type_passed_in(self):
-        @guvectorize([void(float32[:], float32[:], float32[:])],
-                     '(x)->(x),(x)',
-                     target='cuda')
+        @guvectorize(
+            [void(float32[:], float32[:], float32[:])],
+            "(x)->(x),(x)",
+            target="cuda",
+        )
         def copy(A, B, C):
             for i in range(B.size):
                 B[i] = A[i]
@@ -378,10 +389,11 @@ class TestMultipleOutputs(CUDATestCase):
         np.testing.assert_allclose(A, C)
     def test_multiple_outputs_distinct_values(self):
-        @guvectorize([void(float32[:], float32[:], float32[:])],
-                     '(x)->(x),(x)',
-                     target='cuda')
+        @guvectorize(
+            [void(float32[:], float32[:], float32[:])],
+            "(x)->(x),(x)",
+            target="cuda",
+        )
         def copy_and_double(A, B, C):
             for i in range(B.size):
                 B[i] = A[i]
@@ -395,9 +407,11 @@ class TestMultipleOutputs(CUDATestCase):
         np.testing.assert_allclose(A * 2, C)
     def test_multiple_output_allocation(self):
-        @guvectorize([void(float32[:], float32[:], float32[:])],
-                     '(x)->(x),(x)',
-                     target='cuda')
+        @guvectorize(
+            [void(float32[:], float32[:], float32[:])],
+            "(x)->(x),(x)",
+            target="cuda",
+        )
         def copy_and_double(A, B, C):
             for i in range(B.size):
                 B[i] = A[i]
@@ -409,10 +423,11 @@ class TestMultipleOutputs(CUDATestCase):
         np.testing.assert_allclose(A * 2, C)
     def test_multiple_output_dtypes(self):
-        @guvectorize([void(int32[:], int32[:], float64[:])],
-                     '(x)->(x),(x)',
-                     target='cuda')
+        @guvectorize(
+            [void(int32[:], int32[:], float64[:])],
+            "(x)->(x),(x)",
+            target="cuda",
+        )
         def copy_and_multiply(A, B, C):
             for i in range(B.size):
                 B[i] = A[i]
@@ -426,8 +441,11 @@ class TestMultipleOutputs(CUDATestCase):
         np.testing.assert_allclose(A * np.float64(1.5), C)
     def test_incorrect_number_of_pos_args(self):
-        @guvectorize([(int32[:], int32[:], int32[:], int32[:])],
-                     '(m),(m)->(m),(m)', target='cuda')
+        @guvectorize(
+            [(int32[:], int32[:], int32[:], int32[:])],
+            "(m),(m)->(m),(m)",
+            target="cuda",
+        )
         def f(x, y, z, w):
             pass
@@ -438,19 +456,19 @@ class TestMultipleOutputs(CUDATestCase):
             f(arr)
         msg = str(te.exception)
-        self.assertIn('gufunc accepts 2 positional arguments', msg)
-        self.assertIn('or 4 positional arguments', msg)
-        self.assertIn('Got 1 positional argument.', msg)
+        self.assertIn("gufunc accepts 2 positional arguments", msg)
+        self.assertIn("or 4 positional arguments", msg)
+        self.assertIn("Got 1 positional argument.", msg)
         # Inputs and outputs, too many
         with self.assertRaises(TypeError) as te:
             f(arr, arr, arr, arr, arr)
         msg = str(te.exception)
-        self.assertIn('gufunc accepts 2 positional arguments', msg)
-        self.assertIn('or 4 positional arguments', msg)
-        self.assertIn('Got 5 positional arguments.', msg)
+        self.assertIn("gufunc accepts 2 positional arguments", msg)
+        self.assertIn("or 4 positional arguments", msg)
+        self.assertIn("Got 5 positional arguments.", msg)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py CHANGED Viewed

@@ -3,13 +3,14 @@
 See Numpy documentation for detail about gufunc:
     http://docs.scipy.org/doc/numpy/reference/c-api.generalized-ufuncs.html
 """
 import numpy as np
 from numba import guvectorize, cuda
 from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestGUFuncScalar(CUDATestCase):
     def test_gufunc_scalar_output(self):
         #    function type:
@@ -20,9 +21,9 @@ class TestGUFuncScalar(CUDATestCase):
         #    signature: (n)->()
         #        - the function takes an array of n-element and output a scalar.
-        @guvectorize(['void(int32[:], int32[:])'], '(n)->()', target='cuda')
+        @guvectorize(["void(int32[:], int32[:])"], "(n)->()", target="cuda")
         def sum_row(inp, out):
-            tmp = 0.
+            tmp = 0.0
             for i in range(inp.shape[0]):
                 tmp += inp[i]
             out[0] = tmp
@@ -38,15 +39,14 @@ class TestGUFuncScalar(CUDATestCase):
         out1 = np.empty(100, dtype=inp.dtype)
         out2 = np.empty(100, dtype=inp.dtype)
-        dev_inp = cuda.to_device(
-            inp)                 # alloc and copy input data
-        dev_out1 = cuda.to_device(out1, copy=False)   # alloc only
+        dev_inp = cuda.to_device(inp)  # alloc and copy input data
+        dev_out1 = cuda.to_device(out1, copy=False)  # alloc only
-        sum_row(dev_inp, out=dev_out1)                # invoke the gufunc
-        dev_out2 = sum_row(dev_inp)                   # invoke the gufunc
+        sum_row(dev_inp, out=dev_out1)  # invoke the gufunc
+        dev_out2 = sum_row(dev_inp)  # invoke the gufunc
-        dev_out1.copy_to_host(out1)                 # retrieve the result
-        dev_out2.copy_to_host(out2)                 # retrieve the result
+        dev_out1.copy_to_host(out1)  # retrieve the result
+        dev_out2.copy_to_host(out2)  # retrieve the result
         # verify result
         for i in range(inp.shape[0]):
@@ -55,7 +55,7 @@ class TestGUFuncScalar(CUDATestCase):
     def test_gufunc_scalar_output_bug(self):
         # Issue 2812: Error due to using input argument types as output argument
-        @guvectorize(['void(int32, int32[:])'], '()->()', target='cuda')
+        @guvectorize(["void(int32, int32[:])"], "()->()", target="cuda")
         def twice(inp, out):
             out[0] = inp * 2
@@ -64,8 +64,11 @@ class TestGUFuncScalar(CUDATestCase):
         self.assertPreciseEqual(twice(arg), arg * 2)
     def test_gufunc_scalar_input_saxpy(self):
-        @guvectorize(['void(float32, float32[:], float32[:], float32[:])'],
-                     '(),(t),(t)->(t)', target='cuda')
+        @guvectorize(
+            ["void(float32, float32[:], float32[:], float32[:])"],
+            "(),(t),(t)->(t)",
+            target="cuda",
+        )
         def saxpy(a, x, y, out):
             for i in range(out.shape[0]):
                 out[i] = a * x[i] + y[i]
@@ -99,8 +102,9 @@ class TestGUFuncScalar(CUDATestCase):
                 self.assertTrue(exp == out[j, i], (exp, out[j, i]))
     def test_gufunc_scalar_cast(self):
-        @guvectorize(['void(int32, int32[:], int32[:])'], '(),(t)->(t)',
-                     target='cuda')
+        @guvectorize(
+            ["void(int32, int32[:], int32[:])"], "(),(t)->(t)", target="cuda"
+        )
         def foo(a, b, out):
             for i in range(b.size):
                 out[i] = a * b[i]
@@ -121,8 +125,9 @@ class TestGUFuncScalar(CUDATestCase):
     def test_gufunc_old_style_scalar_as_array(self):
         # Example from issue #2579
-        @guvectorize(['void(int32[:],int32[:],int32[:])'], '(n),()->(n)',
-                     target='cuda')
+        @guvectorize(
+            ["void(int32[:],int32[:],int32[:])"], "(n),()->(n)", target="cuda"
+        )
         def gufunc(x, y, res):
             for i in range(x.shape[0]):
                 res[i] = x[i] + y[0]
@@ -155,5 +160,5 @@ class TestGUFuncScalar(CUDATestCase):
         np.testing.assert_almost_equal(expected, res)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba-cuda 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl