PyPI - numba-cuda - Versions diffs - 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +463 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.0.dist-info/RECORD +0 -251
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py CHANGED Viewed

@@ -7,7 +7,7 @@ from numba.cuda.testing import unittest, ContextResettingTestCase
 from numba.cuda.testing import skip_on_cudasim
-@skip_on_cudasim('CUDA Memory API unsupported in the simulator')
+@skip_on_cudasim("CUDA Memory API unsupported in the simulator")
 class TestCudaMemory(ContextResettingTestCase):
     def setUp(self):
         super().setUp()
@@ -24,8 +24,7 @@ class TestCudaMemory(ContextResettingTestCase):
             expected_class = driver.binding.CUdeviceptr
         else:
             expected_class = drvapi.cu_device_ptr
-        self.assertTrue(isinstance(obj.device_ctypes_pointer,
-                                   expected_class))
+        self.assertTrue(isinstance(obj.device_ctypes_pointer, expected_class))
     def test_device_memory(self):
         devmem = self.context.memalloc(1024)
@@ -41,9 +40,9 @@ class TestCudaMemory(ContextResettingTestCase):
     def test_pinned_memory(self):
         ary = np.arange(10)
-        devmem = self.context.mempin(ary, ary.ctypes.data,
-                                     ary.size * ary.dtype.itemsize,
-                                     mapped=True)
+        devmem = self.context.mempin(
+            ary, ary.ctypes.data, ary.size * ary.dtype.itemsize, mapped=True
+        )
         self._template(devmem)
     def test_managed_memory(self):
@@ -69,8 +68,7 @@ class TestCudaMemory(ContextResettingTestCase):
             v2 = v1.view(offset)
             self.assertEqual(handle_val(v2.owner), handle_val(m))
             self.assertEqual(handle_val(v2.owner), handle_val(m))
-            self.assertEqual(handle_val(v2) - offset * 2,
-                             handle_val(v2.owner))
+            self.assertEqual(handle_val(v2) - offset * 2, handle_val(v2.owner))
             self.assertEqual(m.refct, 3)
             del v2
             self.assertEqual(m.refct, 2)
@@ -84,22 +82,24 @@ class TestCudaMemory(ContextResettingTestCase):
     def test_user_extension(self):
         # User can use MemoryPointer to wrap externally defined pointers.
         # This test checks if the finalizer is invokded at correct time
-        fake_ptr = ctypes.c_void_p(0xdeadbeef)
+        fake_ptr = ctypes.c_void_p(0xDEADBEEF)
         dtor_invoked = [0]
         def dtor():
             dtor_invoked[0] += 1
         # Ensure finalizer is called when pointer is deleted
-        ptr = driver.MemoryPointer(context=self.context, pointer=fake_ptr,
-                                   size=40, finalizer=dtor)
+        ptr = driver.MemoryPointer(
+            context=self.context, pointer=fake_ptr, size=40, finalizer=dtor
+        )
         self.assertEqual(dtor_invoked[0], 0)
         del ptr
         self.assertEqual(dtor_invoked[0], 1)
         # Ensure removing derived pointer doesn't call finalizer
-        ptr = driver.MemoryPointer(context=self.context, pointer=fake_ptr,
-                                   size=40, finalizer=dtor)
+        ptr = driver.MemoryPointer(
+            context=self.context, pointer=fake_ptr, size=40, finalizer=dtor
+        )
         owned = ptr.own()
         del owned
         self.assertEqual(dtor_invoked[0], 1)
@@ -128,16 +128,16 @@ class TestCudaMemoryFunctions(ContextResettingTestCase):
         self.assertTrue(np.all(hstary == hstary2))
     def test_memset(self):
-        dtype = np.dtype('uint32')
+        dtype = np.dtype("uint32")
         n = 10
         sz = dtype.itemsize * 10
         devary = self.context.memalloc(sz)
-        driver.device_memset(devary, 0xab, sz)
+        driver.device_memset(devary, 0xAB, sz)
         hstary = np.empty(n, dtype=dtype)
         driver.device_to_host(hstary, devary, sz)
-        hstary2 = np.array([0xabababab] * n, dtype=np.dtype('uint32'))
+        hstary2 = np.array([0xABABABAB] * n, dtype=np.dtype("uint32"))
         self.assertTrue(np.all(hstary == hstary2))
     def test_d2d(self):
@@ -152,7 +152,7 @@ class TestCudaMemoryFunctions(ContextResettingTestCase):
         self.assertTrue(np.all(hst == hst2))
-@skip_on_cudasim('CUDA Memory API unsupported in the simulator')
+@skip_on_cudasim("CUDA Memory API unsupported in the simulator")
 class TestMVExtent(ContextResettingTestCase):
     def test_c_contiguous_array(self):
         ary = np.arange(100)
@@ -177,7 +177,7 @@ class TestMVExtent(ContextResettingTestCase):
     def test_ctypes_struct(self):
         class mystruct(ctypes.Structure):
-            _fields_ = [('x', ctypes.c_int), ('y', ctypes.c_int)]
+            _fields_ = [("x", ctypes.c_int), ("y", ctypes.c_int)]
         data = mystruct(x=123, y=432)
         sz = driver.host_memory_size(data)
@@ -189,5 +189,5 @@ class TestMVExtent(ContextResettingTestCase):
         self.assertTrue(ctypes.sizeof(data) == sz)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py CHANGED Viewed

@@ -57,10 +57,7 @@ class TestCudaNDArray(CUDATestCase):
     def test_stream_bind(self):
         stream = cuda.stream()
         with stream.auto_synchronize():
-            arr = cuda.device_array(
-                (3, 3),
-                dtype=np.float64,
-                stream=stream)
+            arr = cuda.device_array((3, 3), dtype=np.float64, stream=stream)
             self.assertEqual(arr.bind(stream).stream, stream)
             self.assertEqual(arr.stream, stream)
@@ -90,8 +87,8 @@ class TestCudaNDArray(CUDATestCase):
         self.assertTrue(np.all(array == 0))
-        right.copy_to_host(array[N // 2:])
-        left.copy_to_host(array[:N // 2])
+        right.copy_to_host(array[N // 2 :])
+        left.copy_to_host(array[: N // 2])
         self.assertTrue(np.all(array == original))
@@ -104,7 +101,7 @@ class TestCudaNDArray(CUDATestCase):
         gpumem.copy_to_host(array)
         np.testing.assert_array_equal(array, original * 2)
-    @skip_on_cudasim('This works in the simulator')
+    @skip_on_cudasim("This works in the simulator")
     def test_devicearray_transpose_wrongdim(self):
         gpumem = cuda.to_device(np.array(np.arange(12)).reshape(3, 4, 1))
@@ -113,13 +110,15 @@ class TestCudaNDArray(CUDATestCase):
         self.assertEqual(
             "transposing a non-2D DeviceNDArray isn't supported",
-            str(e.exception))
+            str(e.exception),
+        )
     def test_devicearray_transpose_identity(self):
         # any-shape identities should work
         original = np.array(np.arange(24)).reshape(3, 4, 2)
-        array = np.transpose(cuda.to_device(original),
-                             axes=(0, 1, 2)).copy_to_host()
+        array = np.transpose(
+            cuda.to_device(original), axes=(0, 1, 2)
+        ).copy_to_host()
         self.assertTrue(np.all(array == original))
     def test_devicearray_transpose_duplicatedaxis(self):
@@ -131,9 +130,10 @@ class TestCudaNDArray(CUDATestCase):
         self.assertIn(
             str(e.exception),
             container=[
-                'invalid axes list (0, 0)',  # GPU
-                'repeated axis in transpose',  # sim
-            ])
+                "invalid axes list (0, 0)",  # GPU
+                "repeated axis in transpose",  # sim
+            ],
+        )
     def test_devicearray_transpose_wrongaxis(self):
         gpumem = cuda.to_device(np.array(np.arange(12)).reshape(3, 4))
@@ -144,10 +144,11 @@ class TestCudaNDArray(CUDATestCase):
         self.assertIn(
             str(e.exception),
             container=[
-                'invalid axes list (0, 2)',  # GPU
-                'invalid axis for this array',
-                'axis 2 is out of bounds for array of dimension 2',  # sim
-            ])
+                "invalid axes list (0, 2)",  # GPU
+                "invalid axis for this array",
+                "axis 2 is out of bounds for array of dimension 2",  # sim
+            ],
+        )
     def test_devicearray_view_ok(self):
         original = np.array(np.arange(12), dtype="i2").reshape(3, 4)
@@ -155,8 +156,7 @@ class TestCudaNDArray(CUDATestCase):
         for dtype in ("i4", "u4", "i8", "f8"):
             with self.subTest(dtype=dtype):
                 np.testing.assert_array_equal(
-                    array.view(dtype).copy_to_host(),
-                    original.view(dtype)
+                    array.view(dtype).copy_to_host(), original.view(dtype)
                 )
     def test_devicearray_view_ok_not_c_contig(self):
@@ -164,8 +164,7 @@ class TestCudaNDArray(CUDATestCase):
         array = cuda.to_device(original)[:, ::2]
         original = original[:, ::2]
         np.testing.assert_array_equal(
-            array.view("u2").copy_to_host(),
-            original.view("u2")
+            array.view("u2").copy_to_host(), original.view("u2")
         )
     def test_devicearray_view_bad_not_c_contig(self):
@@ -175,12 +174,14 @@ class TestCudaNDArray(CUDATestCase):
             array.view("i4")
         msg = str(e.exception)
-        self.assertIn('To change to a dtype of a different size,', msg)
+        self.assertIn("To change to a dtype of a different size,", msg)
-        contiguous_pre_np123 = 'the array must be C-contiguous' in msg
-        contiguous_post_np123 = 'the last axis must be contiguous' in msg
-        self.assertTrue(contiguous_pre_np123 or contiguous_post_np123,
-                        'Expected message to mention contiguity')
+        contiguous_pre_np123 = "the array must be C-contiguous" in msg
+        contiguous_post_np123 = "the last axis must be contiguous" in msg
+        self.assertTrue(
+            contiguous_pre_np123 or contiguous_post_np123,
+            "Expected message to mention contiguity",
+        )
     def test_devicearray_view_bad_itemsize(self):
         original = np.array(np.arange(12), dtype="i2").reshape(4, 3)
@@ -191,7 +192,8 @@ class TestCudaNDArray(CUDATestCase):
             "When changing to a larger dtype,"
             " its size must be a divisor of the total size in bytes"
             " of the last axis of the array.",
-            str(e.exception))
+            str(e.exception),
+        )
     def test_devicearray_transpose_ok(self):
         original = np.array(np.arange(12)).reshape(3, 4)
@@ -206,7 +208,7 @@ class TestCudaNDArray(CUDATestCase):
     def test_devicearray_contiguous_slice(self):
         # memcpys are dumb ranges of bytes, so trying to
         # copy to a non-contiguous range shouldn't work!
-        a = np.arange(25).reshape(5, 5, order='F')
+        a = np.arange(25).reshape(5, 5, order="F")
         s = np.full(fill_value=5, shape=(5,))
         d = cuda.to_device(a)
@@ -216,9 +218,7 @@ class TestCudaNDArray(CUDATestCase):
         # (40-byte strides). This means we can't memcpy to it!
         with self.assertRaises(ValueError) as e:
             d[2].copy_to_device(s)
-        self.assertEqual(
-            devicearray.errmsg_contiguous_buffer,
-            str(e.exception))
+        self.assertEqual(devicearray.errmsg_contiguous_buffer, str(e.exception))
         # if d[2].copy_to_device(s), then this would pass:
         # self.assertTrue((a == d.copy_to_host()).all())
@@ -236,9 +236,9 @@ class TestCudaNDArray(CUDATestCase):
             (a_c, a_f),
             (a_c, a_c),
         ]:
-            msg = '%s => %s' % (
-                'C' if original.flags.c_contiguous else 'F',
-                'C' if copy.flags.c_contiguous else 'F',
+            msg = "%s => %s" % (
+                "C" if original.flags.c_contiguous else "F",
+                "C" if copy.flags.c_contiguous else "F",
             )
             d = cuda.to_device(original)
@@ -248,17 +248,17 @@ class TestCudaNDArray(CUDATestCase):
     def test_devicearray_contiguous_copy_host_3d(self):
         a_c = np.arange(5 * 5 * 5).reshape(5, 5, 5)
-        a_f = np.array(a_c, order='F')
+        a_f = np.array(a_c, order="F")
         self._test_devicearray_contiguous_host_copy(a_c, a_f)
     def test_devicearray_contiguous_copy_host_1d(self):
         a_c = np.arange(5)
-        a_f = np.array(a_c, order='F')
+        a_f = np.array(a_c, order="F")
         self._test_devicearray_contiguous_host_copy(a_c, a_f)
     def test_devicearray_contiguous_copy_device(self):
         a_c = np.arange(5 * 5 * 5).reshape(5, 5, 5)
-        a_f = np.array(a_c, order='F')
+        a_f = np.array(a_c, order="F")
         self.assertTrue(a_c.flags.c_contiguous)
         self.assertTrue(a_f.flags.f_contiguous)
@@ -268,7 +268,8 @@ class TestCudaNDArray(CUDATestCase):
             d.copy_to_device(cuda.to_device(a_f))
         self.assertEqual(
             "incompatible strides: {} vs. {}".format(a_c.strides, a_f.strides),
-            str(e.exception))
+            str(e.exception),
+        )
         d.copy_to_device(cuda.to_device(a_c))
         self.assertTrue(np.all(d.copy_to_host() == a_c))
@@ -279,7 +280,8 @@ class TestCudaNDArray(CUDATestCase):
             d.copy_to_device(cuda.to_device(a_c))
         self.assertEqual(
             "incompatible strides: {} vs. {}".format(a_f.strides, a_c.strides),
-            str(e.exception))
+            str(e.exception),
+        )
         d.copy_to_device(cuda.to_device(a_f))
         self.assertTrue(np.all(d.copy_to_host() == a_f))
@@ -288,8 +290,8 @@ class TestCudaNDArray(CUDATestCase):
         broadsize = 4
         coreshape = (2, 3)
         coresize = np.prod(coreshape)
-        core_c = np.arange(coresize).reshape(coreshape, order='C')
-        core_f = np.arange(coresize).reshape(coreshape, order='F')
+        core_c = np.arange(coresize).reshape(coreshape, order="C")
+        core_f = np.arange(coresize).reshape(coreshape, order="F")
         for dim in range(len(coreshape)):
             newindex = (slice(None),) * dim + (np.newaxis,)
             broadshape = coreshape[:dim] + (broadsize,) + coreshape[dim:]
@@ -318,11 +320,9 @@ class TestCudaNDArray(CUDATestCase):
         with self.assertRaises(ValueError) as e:
             d.copy_to_device(cuda.to_device(arr)[::2])
-        self.assertEqual(
-            devicearray.errmsg_contiguous_buffer,
-            str(e.exception))
+        self.assertEqual(devicearray.errmsg_contiguous_buffer, str(e.exception))
-    @skip_on_cudasim('DeviceNDArray class not present in simulator')
+    @skip_on_cudasim("DeviceNDArray class not present in simulator")
     def test_devicearray_relaxed_strides(self):
         # From the reproducer in Issue #6824.
@@ -334,86 +334,88 @@ class TestCudaNDArray(CUDATestCase):
         # Ensure we still believe the array to be contiguous because
         # strides checking is relaxed.
-        self.assertTrue(arr.flags['C_CONTIGUOUS'])
-        self.assertTrue(arr.flags['F_CONTIGUOUS'])
+        self.assertTrue(arr.flags["C_CONTIGUOUS"])
+        self.assertTrue(arr.flags["F_CONTIGUOUS"])
     def test_c_f_contiguity_matches_numpy(self):
         # From the reproducer in Issue #4943.
         shapes = ((1, 4), (4, 1))
-        orders = ('C', 'F')
+        orders = ("C", "F")
         for shape, order in itertools.product(shapes, orders):
             arr = np.ndarray(shape, order=order)
             d_arr = cuda.to_device(arr)
-            self.assertEqual(arr.flags['C_CONTIGUOUS'],
-                             d_arr.flags['C_CONTIGUOUS'])
-            self.assertEqual(arr.flags['F_CONTIGUOUS'],
-                             d_arr.flags['F_CONTIGUOUS'])
+            self.assertEqual(
+                arr.flags["C_CONTIGUOUS"], d_arr.flags["C_CONTIGUOUS"]
+            )
+            self.assertEqual(
+                arr.flags["F_CONTIGUOUS"], d_arr.flags["F_CONTIGUOUS"]
+            )
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_simple_c(self):
         # C-order 1D array
-        a = np.zeros(10, order='C')
+        a = np.zeros(10, order="C")
         d = cuda.to_device(a)
-        self.assertEqual(d._numba_type_.layout, 'C')
+        self.assertEqual(d._numba_type_.layout, "C")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_simple_f(self):
         # F-order array that is also C layout.
-        a = np.zeros(10, order='F')
+        a = np.zeros(10, order="F")
         d = cuda.to_device(a)
-        self.assertEqual(d._numba_type_.layout, 'C')
+        self.assertEqual(d._numba_type_.layout, "C")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_2d_c(self):
         # C-order 2D array
-        a = np.zeros((2, 10), order='C')
+        a = np.zeros((2, 10), order="C")
         d = cuda.to_device(a)
-        self.assertEqual(d._numba_type_.layout, 'C')
+        self.assertEqual(d._numba_type_.layout, "C")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_2d_f(self):
         # F-order array that can only be F layout
-        a = np.zeros((2, 10), order='F')
+        a = np.zeros((2, 10), order="F")
         d = cuda.to_device(a)
-        self.assertEqual(d._numba_type_.layout, 'F')
+        self.assertEqual(d._numba_type_.layout, "F")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_noncontig_slice_c(self):
         # Non-contiguous slice of C-order array
-        a = np.zeros((5, 5), order='C')
-        d = cuda.to_device(a)[:,2]
-        self.assertEqual(d._numba_type_.layout, 'A')
+        a = np.zeros((5, 5), order="C")
+        d = cuda.to_device(a)[:, 2]
+        self.assertEqual(d._numba_type_.layout, "A")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_noncontig_slice_f(self):
         # Non-contiguous slice of F-order array
-        a = np.zeros((5, 5), order='F')
-        d = cuda.to_device(a)[2,:]
-        self.assertEqual(d._numba_type_.layout, 'A')
+        a = np.zeros((5, 5), order="F")
+        d = cuda.to_device(a)[2, :]
+        self.assertEqual(d._numba_type_.layout, "A")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_contig_slice_c(self):
         # Contiguous slice of C-order array
-        a = np.zeros((5, 5), order='C')
-        d = cuda.to_device(a)[2,:]
-        self.assertEqual(d._numba_type_.layout, 'C')
+        a = np.zeros((5, 5), order="C")
+        d = cuda.to_device(a)[2, :]
+        self.assertEqual(d._numba_type_.layout, "C")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_contig_slice_f(self):
         # Contiguous slice of F-order array - is both C- and F-contiguous, so
         # types as 'C' layout
-        a = np.zeros((5, 5), order='F')
-        d = cuda.to_device(a)[:,2]
-        self.assertEqual(d._numba_type_.layout, 'C')
+        a = np.zeros((5, 5), order="F")
+        d = cuda.to_device(a)[:, 2]
+        self.assertEqual(d._numba_type_.layout, "C")
-    @skip_on_cudasim('Typing not done in the simulator')
+    @skip_on_cudasim("Typing not done in the simulator")
     def test_devicearray_typing_order_broadcasted(self):
         # Broadcasted array, similar to that used for passing scalars to ufuncs
         a = np.broadcast_to(np.array([1]), (10,))
         d = cuda.to_device(a)
-        self.assertEqual(d._numba_type_.layout, 'A')
+        self.assertEqual(d._numba_type_.layout, "A")
     def test_bug6697(self):
         ary = np.arange(10, dtype=np.int16)
@@ -421,7 +423,7 @@ class TestCudaNDArray(CUDATestCase):
         got = np.asarray(dary)
         self.assertEqual(got.dtype, dary.dtype)
-    @skip_on_cudasim('DeviceNDArray class not present in simulator')
+    @skip_on_cudasim("DeviceNDArray class not present in simulator")
     def test_issue_8477(self):
         # Ensure that we can copy a zero-length device array to a zero-length
         # host array when the strides of the device and host arrays differ -
@@ -430,8 +432,9 @@ class TestCudaNDArray(CUDATestCase):
         # https://github.com/numba/numba/issues/8477.
         # Create a device array with shape (0,) and strides (8,)
-        dev_array = devicearray.DeviceNDArray(shape=(0,), strides=(8,),
-                                              dtype=np.int8)
+        dev_array = devicearray.DeviceNDArray(
+            shape=(0,), strides=(8,), dtype=np.int8
+        )
         # Create a host array with shape (0,) and strides (0,)
         host_array = np.ndarray(shape=(0,), strides=(0,), dtype=np.int8)
@@ -470,8 +473,7 @@ class TestArrayMethod(CUDATestCase):
         dev_array = cuda.to_device(np.asarray([1.0, 2.0, 3.0]))
         host_array = np.array(dev_array, dtype=dtype)
         np.testing.assert_equal(
-            host_array,
-            dev_array.copy_to_host().astype(dtype)
+            host_array, dev_array.copy_to_host().astype(dtype)
         )
     @unittest.skipUnless(IS_NUMPY_2, "NumPy 1.x does not pass copy kwarg")
@@ -490,10 +492,13 @@ class TestArrayMethod(CUDATestCase):
 class TestRecarray(CUDATestCase):
     def test_recarray(self):
         # From issue #4111
-        a = np.recarray((16,), dtype=[
-            ("value1", np.int64),
-            ("value2", np.float64),
-        ])
+        a = np.recarray(
+            (16,),
+            dtype=[
+                ("value1", np.int64),
+                ("value2", np.float64),
+            ],
+        )
         a.value1 = np.arange(a.size, dtype=np.int64)
         a.value2 = np.arange(a.size, dtype=np.float64) / 100
@@ -518,39 +523,39 @@ class TestCoreContiguous(CUDATestCase):
     def _test_against_array_core(self, view):
         self.assertEqual(
             devicearray.is_contiguous(view),
-            devicearray.array_core(view).flags['C_CONTIGUOUS']
+            devicearray.array_core(view).flags["C_CONTIGUOUS"],
         )
     def test_device_array_like_1d(self):
-        d_a = cuda.device_array(10, order='C')
+        d_a = cuda.device_array(10, order="C")
         self._test_against_array_core(d_a)
     def test_device_array_like_2d(self):
-        d_a = cuda.device_array((10, 12), order='C')
+        d_a = cuda.device_array((10, 12), order="C")
         self._test_against_array_core(d_a)
     def test_device_array_like_2d_transpose(self):
-        d_a = cuda.device_array((10, 12), order='C')
+        d_a = cuda.device_array((10, 12), order="C")
         self._test_against_array_core(d_a.T)
     def test_device_array_like_3d(self):
-        d_a = cuda.device_array((10, 12, 14), order='C')
+        d_a = cuda.device_array((10, 12, 14), order="C")
         self._test_against_array_core(d_a)
     def test_device_array_like_1d_f(self):
-        d_a = cuda.device_array(10, order='F')
+        d_a = cuda.device_array(10, order="F")
         self._test_against_array_core(d_a)
     def test_device_array_like_2d_f(self):
-        d_a = cuda.device_array((10, 12), order='F')
+        d_a = cuda.device_array((10, 12), order="F")
         self._test_against_array_core(d_a)
     def test_device_array_like_2d_f_transpose(self):
-        d_a = cuda.device_array((10, 12), order='F')
+        d_a = cuda.device_array((10, 12), order="F")
         self._test_against_array_core(d_a.T)
     def test_device_array_like_3d_f(self):
-        d_a = cuda.device_array((10, 12, 14), order='F')
+        d_a = cuda.device_array((10, 12, 14), order="F")
         self._test_against_array_core(d_a)
     def test_1d_view(self):
@@ -560,7 +565,7 @@ class TestCoreContiguous(CUDATestCase):
     def test_1d_view_f(self):
         shape = 10
-        view = np.zeros(shape, order='F')[::2]
+        view = np.zeros(shape, order="F")[::2]
         self._test_against_array_core(view)
     def test_2d_view(self):
@@ -570,9 +575,9 @@ class TestCoreContiguous(CUDATestCase):
     def test_2d_view_f(self):
         shape = (10, 12)
-        view = np.zeros(shape, order='F')[::2, ::2]
+        view = np.zeros(shape, order="F")[::2, ::2]
         self._test_against_array_core(view)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py CHANGED Viewed

@@ -3,14 +3,18 @@ from contextlib import contextmanager
 import numpy as np
 from numba import cuda
-from numba.cuda.testing import (unittest, skip_on_cudasim,
-                                skip_if_external_memmgr, CUDATestCase)
+from numba.cuda.testing import (
+    unittest,
+    skip_on_cudasim,
+    skip_if_external_memmgr,
+    CUDATestCase,
+)
 from numba.tests.support import captured_stderr
 from numba.core import config
-@skip_on_cudasim('not supported on CUDASIM')
-@skip_if_external_memmgr('Deallocation specific to Numba memory management')
+@skip_on_cudasim("not supported on CUDASIM")
+@skip_if_external_memmgr("Deallocation specific to Numba memory management")
 class TestDeallocation(CUDATestCase):
     def test_max_pending_count(self):
         # get deallocation manager and flush it
@@ -41,8 +45,9 @@ class TestDeallocation(CUDATestCase):
             config.CUDA_DEALLOCS_RATIO = max_pending / mi.total
             # due to round off error (floor is used in calculating
             # _max_pending_bytes) it can be off by 1.
-            self.assertAlmostEqual(deallocs._max_pending_bytes, max_pending,
-                                   delta=1)
+            self.assertAlmostEqual(
+                deallocs._max_pending_bytes, max_pending, delta=1
+            )
             # allocate half the max size
             # this will not trigger deallocation
@@ -51,8 +56,11 @@ class TestDeallocation(CUDATestCase):
             # allocate another remaining
             # this will not trigger deallocation
-            cuda.to_device(np.ones(deallocs._max_pending_bytes -
-                                   deallocs._size, dtype=np.int8))
+            cuda.to_device(
+                np.ones(
+                    deallocs._max_pending_bytes - deallocs._size, dtype=np.int8
+                )
+            )
             self.assertEqual(len(deallocs), 2)
             # another byte to trigger .clear()
@@ -64,7 +72,7 @@ class TestDeallocation(CUDATestCase):
 @skip_on_cudasim("defer_cleanup has no effect in CUDASIM")
-@skip_if_external_memmgr('Deallocation specific to Numba memory management')
+@skip_if_external_memmgr("Deallocation specific to Numba memory management")
 class TestDeferCleanup(CUDATestCase):
     def test_basic(self):
         harr = np.arange(5)
@@ -138,11 +146,12 @@ class TestDeferCleanupAvail(CUDATestCase):
             pass
-@skip_on_cudasim('not supported on CUDASIM')
+@skip_on_cudasim("not supported on CUDASIM")
 class TestDel(CUDATestCase):
     """
     Ensure resources are deleted properly without ignored exception.
     """
     @contextmanager
     def check_ignored_exception(self, ctx):
         with captured_stderr() as cap:
@@ -245,5 +254,5 @@ class TestDel(CUDATestCase):
                     pass
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba-cuda 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl