PyPI - numba-cuda - Versions diffs - 0.8.1__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.1py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +460 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.1.dist-info/RECORD +0 -251
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py CHANGED Viewed

@@ -9,12 +9,13 @@ from numba.tests.support import linux_only, override_config
 from unittest.mock import call, patch
-@skip_on_cudasim('CUDA Array Interface is not supported in the simulator')
+@skip_on_cudasim("CUDA Array Interface is not supported in the simulator")
 class TestCudaArrayInterface(ContextResettingTestCase):
     def assertPointersEqual(self, a, b):
         if driver.USE_NV_BINDING:
-            self.assertEqual(int(a.device_ctypes_pointer),
-                             int(b.device_ctypes_pointer))
+            self.assertEqual(
+                int(a.device_ctypes_pointer), int(b.device_ctypes_pointer)
+            )
     def test_as_cuda_array(self):
         h_arr = np.arange(10)
@@ -37,7 +38,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         else:
             return stream.handle.value
-    @skip_if_external_memmgr('Ownership not relevant with external memmgr')
+    @skip_if_external_memmgr("Ownership not relevant with external memmgr")
     def test_ownership(self):
         # Get the deallocation queue
         ctx = cuda.current_context()
@@ -82,7 +83,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         np.testing.assert_array_equal(d_arr.copy_to_host(), h_arr + val)
     def test_ufunc_arg(self):
-        @vectorize(['f8(f8, f8)'], target='cuda')
+        @vectorize(["f8(f8, f8)"], target="cuda")
         def vadd(a, b):
             return a + b
@@ -99,7 +100,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         np.testing.assert_array_equal(returned.copy_to_host(), h_arr + val)
     def test_gufunc_arg(self):
-        @guvectorize(['(f8, f8, f8[:])'], '(),()->()', target='cuda')
+        @guvectorize(["(f8, f8, f8[:])"], "(),()->()", target="cuda")
         def vadd(inp, val, out):
             out[0] = inp + val
@@ -118,8 +119,8 @@ class TestCudaArrayInterface(ContextResettingTestCase):
     def test_array_views(self):
         """Views created via array interface support:
-            - Strided slices
-            - Strided slices
+        - Strided slices
+        - Strided slices
         """
         h_arr = np.random.random(10)
         c_arr = cuda.to_device(h_arr)
@@ -148,23 +149,22 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         self.assertEqual(arr[::2].strides, arr_strided.strides)
         self.assertEqual(arr[::2].dtype.itemsize, arr_strided.dtype.itemsize)
         self.assertEqual(arr[::2].alloc_size, arr_strided.alloc_size)
-        self.assertEqual(arr[::2].nbytes,
-                         arr_strided.size * arr_strided.dtype.itemsize)
+        self.assertEqual(
+            arr[::2].nbytes, arr_strided.size * arr_strided.dtype.itemsize
+        )
         # __setitem__ interface propagates into external array
         # Writes to a slice
         arr[:5] = np.pi
         np.testing.assert_array_equal(
-            c_arr.copy_to_host(),
-            np.concatenate((np.full(5, np.pi), h_arr[5:]))
+            c_arr.copy_to_host(), np.concatenate((np.full(5, np.pi), h_arr[5:]))
         )
         # Writes to a slice from a view
         arr[:5] = arr[5:]
         np.testing.assert_array_equal(
-            c_arr.copy_to_host(),
-            np.concatenate((h_arr[5:], h_arr[5:]))
+            c_arr.copy_to_host(), np.concatenate((h_arr[5:], h_arr[5:]))
         )
         # Writes through a view
@@ -177,10 +177,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
             c_arr.copy_to_host()[::2],
             np.full(5, np.pi),
         )
-        np.testing.assert_array_equal(
-            c_arr.copy_to_host()[1::2],
-            h_arr[1::2]
-        )
+        np.testing.assert_array_equal(c_arr.copy_to_host()[1::2], h_arr[1::2])
     def test_negative_strided_issue(self):
         # issue #3705
@@ -188,7 +185,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         c_arr = cuda.to_device(h_arr)
         def base_offset(orig, sliced):
-            return sliced['data'][0] - orig['data'][0]
+            return sliced["data"][0] - orig["data"][0]
         h_ai = h_arr.__array_interface__
         c_ai = c_arr.__cuda_array_interface__
@@ -202,8 +199,8 @@ class TestCudaArrayInterface(ContextResettingTestCase):
             base_offset(c_ai, c_ai_sliced),
         )
         # Check shape and strides are correct
-        self.assertEqual(h_ai_sliced['shape'], c_ai_sliced['shape'])
-        self.assertEqual(h_ai_sliced['strides'], c_ai_sliced['strides'])
+        self.assertEqual(h_ai_sliced["shape"], c_ai_sliced["shape"])
+        self.assertEqual(h_ai_sliced["strides"], c_ai_sliced["strides"])
     def test_negative_strided_copy_to_host(self):
         # issue #3705
@@ -212,28 +209,28 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         sliced = c_arr[::-1]
         with self.assertRaises(NotImplementedError) as raises:
             sliced.copy_to_host()
-        expected_msg = 'D->H copy not implemented for negative strides'
+        expected_msg = "D->H copy not implemented for negative strides"
         self.assertIn(expected_msg, str(raises.exception))
     def test_masked_array(self):
         h_arr = np.random.random(10)
-        h_mask = np.random.randint(2, size=10, dtype='bool')
+        h_mask = np.random.randint(2, size=10, dtype="bool")
         c_arr = cuda.to_device(h_arr)
         c_mask = cuda.to_device(h_mask)
         # Manually create a masked CUDA Array Interface dictionary
         masked_cuda_array_interface = c_arr.__cuda_array_interface__.copy()
-        masked_cuda_array_interface['mask'] = c_mask
+        masked_cuda_array_interface["mask"] = c_mask
         with self.assertRaises(NotImplementedError) as raises:
             cuda.from_cuda_array_interface(masked_cuda_array_interface)
-        expected_msg = 'Masked arrays are not supported'
+        expected_msg = "Masked arrays are not supported"
         self.assertIn(expected_msg, str(raises.exception))
     def test_zero_size_array(self):
         # for #4175
         c_arr = cuda.device_array(0)
-        self.assertEqual(c_arr.__cuda_array_interface__['data'][0], 0)
+        self.assertEqual(c_arr.__cuda_array_interface__["data"][0], 0)
         @cuda.jit
         def add_one(arr):
@@ -249,49 +246,49 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         # for #4175
         # First, test C-contiguous array
         c_arr = cuda.device_array((2, 3, 4))
-        self.assertEqual(c_arr.__cuda_array_interface__['strides'], None)
+        self.assertEqual(c_arr.__cuda_array_interface__["strides"], None)
         # Second, test non C-contiguous array
         c_arr = c_arr[:, 1, :]
-        self.assertNotEqual(c_arr.__cuda_array_interface__['strides'], None)
+        self.assertNotEqual(c_arr.__cuda_array_interface__["strides"], None)
     def test_consuming_strides(self):
         hostarray = np.arange(10).reshape(2, 5)
         devarray = cuda.to_device(hostarray)
         face = devarray.__cuda_array_interface__
-        self.assertIsNone(face['strides'])
+        self.assertIsNone(face["strides"])
         got = cuda.from_cuda_array_interface(face).copy_to_host()
         np.testing.assert_array_equal(got, hostarray)
-        self.assertTrue(got.flags['C_CONTIGUOUS'])
+        self.assertTrue(got.flags["C_CONTIGUOUS"])
         # Try non-NULL strides
-        face['strides'] = hostarray.strides
-        self.assertIsNotNone(face['strides'])
+        face["strides"] = hostarray.strides
+        self.assertIsNotNone(face["strides"])
         got = cuda.from_cuda_array_interface(face).copy_to_host()
         np.testing.assert_array_equal(got, hostarray)
-        self.assertTrue(got.flags['C_CONTIGUOUS'])
+        self.assertTrue(got.flags["C_CONTIGUOUS"])
     def test_produce_no_stream(self):
         c_arr = cuda.device_array(10)
-        self.assertIsNone(c_arr.__cuda_array_interface__['stream'])
+        self.assertIsNone(c_arr.__cuda_array_interface__["stream"])
         mapped_arr = cuda.mapped_array(10)
-        self.assertIsNone(mapped_arr.__cuda_array_interface__['stream'])
+        self.assertIsNone(mapped_arr.__cuda_array_interface__["stream"])
     @linux_only
     def test_produce_managed_no_stream(self):
         managed_arr = cuda.managed_array(10)
-        self.assertIsNone(managed_arr.__cuda_array_interface__['stream'])
+        self.assertIsNone(managed_arr.__cuda_array_interface__["stream"])
     def test_produce_stream(self):
         s = cuda.stream()
         c_arr = cuda.device_array(10, stream=s)
-        cai_stream = c_arr.__cuda_array_interface__['stream']
+        cai_stream = c_arr.__cuda_array_interface__["stream"]
         stream_value = self.get_stream_value(s)
         self.assertEqual(stream_value, cai_stream)
         s = cuda.stream()
         mapped_arr = cuda.mapped_array(10, stream=s)
-        cai_stream = mapped_arr.__cuda_array_interface__['stream']
+        cai_stream = mapped_arr.__cuda_array_interface__["stream"]
         stream_value = self.get_stream_value(s)
         self.assertEqual(stream_value, cai_stream)
@@ -299,7 +296,7 @@ class TestCudaArrayInterface(ContextResettingTestCase):
     def test_produce_managed_stream(self):
         s = cuda.stream()
         managed_arr = cuda.managed_array(10, stream=s)
-        cai_stream = managed_arr.__cuda_array_interface__['stream']
+        cai_stream = managed_arr.__cuda_array_interface__["stream"]
         stream_value = self.get_stream_value(s)
         self.assertEqual(stream_value, cai_stream)
@@ -327,8 +324,9 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         # Create a foreign array with no stream
         f_arr = ForeignArray(cuda.device_array(10))
-        with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                          return_value=None) as mock_sync:
+        with patch.object(
+            cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+        ) as mock_sync:
             cuda.as_cuda_array(f_arr)
         # Ensure the synchronize method of a stream was not called
@@ -339,8 +337,9 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         s = cuda.stream()
         f_arr = ForeignArray(cuda.device_array(10, stream=s))
-        with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                          return_value=None) as mock_sync:
+        with patch.object(
+            cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+        ) as mock_sync:
             cuda.as_cuda_array(f_arr)
         # Ensure the synchronize method of a stream was called
@@ -354,9 +353,10 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         # Set sync to false before testing. The test suite should generally be
         # run with sync enabled, but stash the old value just in case it is
         # not.
-        with override_config('CUDA_ARRAY_INTERFACE_SYNC', False):
-            with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                              return_value=None) as mock_sync:
+        with override_config("CUDA_ARRAY_INTERFACE_SYNC", False):
+            with patch.object(
+                cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+            ) as mock_sync:
                 cuda.as_cuda_array(f_arr)
             # Ensure the synchronize method of a stream was not called
@@ -370,8 +370,9 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         def f(x):
             pass
-        with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                          return_value=None) as mock_sync:
+        with patch.object(
+            cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+        ) as mock_sync:
             f[1, 1](f_arr)
         # Ensure the synchronize method of a stream was not called
@@ -386,8 +387,9 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         def f(x):
             pass
-        with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                          return_value=None) as mock_sync:
+        with patch.object(
+            cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+        ) as mock_sync:
             f[1, 1](f_arr)
         # Ensure the synchronize method of a stream was called
@@ -404,8 +406,9 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         def f(x, y):
             pass
-        with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                          return_value=None) as mock_sync:
+        with patch.object(
+            cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+        ) as mock_sync:
             f[1, 1](f_arr1, f_arr2)
         # Ensure that synchronize was called twice
@@ -418,13 +421,15 @@ class TestCudaArrayInterface(ContextResettingTestCase):
         f_arr1 = ForeignArray(cuda.device_array(10, stream=s1))
         f_arr2 = ForeignArray(cuda.device_array(10, stream=s2))
-        with override_config('CUDA_ARRAY_INTERFACE_SYNC', False):
+        with override_config("CUDA_ARRAY_INTERFACE_SYNC", False):
             @cuda.jit
             def f(x, y):
                 pass
-            with patch.object(cuda.cudadrv.driver.Stream, 'synchronize',
-                              return_value=None) as mock_sync:
+            with patch.object(
+                cuda.cudadrv.driver.Stream, "synchronize", return_value=None
+            ) as mock_sync:
                 f[1, 1](f_arr1, f_arr2)
             # Ensure that synchronize was not called

numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py CHANGED Viewed

@@ -80,11 +80,12 @@ class TestCudaJitNoTypes(CUDATestCase):
     def test_jit_debug_simulator(self):
         # Ensure that the jit decorator accepts the debug kwarg when the
         # simulator is in use - see Issue #6615.
-        with override_config('ENABLE_CUDASIM', 1):
+        with override_config("ENABLE_CUDASIM", 1):
             @cuda.jit(debug=True, opt=False)
             def f(x):
                 pass
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_datetime.py CHANGED Viewed

@@ -13,9 +13,9 @@ class TestCudaDateTime(CUDATestCase):
             for i in range(cuda.grid(1), delta.size, cuda.gridsize(1)):
                 delta[i] = end[i] - start[i]
-        arr1 = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
+        arr1 = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
         arr2 = arr1 + np.random.randint(0, 10000, arr1.size)
-        delta = np.zeros_like(arr1, dtype='timedelta64[D]')
+        delta = np.zeros_like(arr1, dtype="timedelta64[D]")
         foo[1, 32](arr1, arr2, delta)
@@ -27,11 +27,12 @@ class TestCudaDateTime(CUDATestCase):
             for i in range(cuda.grid(1), matches.size, cuda.gridsize(1)):
                 matches[i] = dates[i] == target
                 outdelta[i] = dates[i] - delta
-        arr1 = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
-        target = arr1[5]           # datetime
+        arr1 = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
+        target = arr1[5]  # datetime
         delta = arr1[6] - arr1[5]  # timedelta
         matches = np.zeros_like(arr1, dtype=np.bool_)
-        outdelta = np.zeros_like(arr1, dtype='datetime64[D]')
+        outdelta = np.zeros_like(arr1, dtype="datetime64[D]")
         foo[1, 32](arr1, target, delta, matches, outdelta)
         where = matches.nonzero()
@@ -39,56 +40,59 @@ class TestCudaDateTime(CUDATestCase):
         self.assertEqual(list(where), [5])
         self.assertPreciseEqual(outdelta, arr1 - delta)
-    @skip_on_cudasim('ufunc API unsupported in the simulator')
+    @skip_on_cudasim("ufunc API unsupported in the simulator")
     def test_ufunc(self):
-        datetime_t = from_dtype(np.dtype('datetime64[D]'))
+        datetime_t = from_dtype(np.dtype("datetime64[D]"))
-        @vectorize([(datetime_t, datetime_t)], target='cuda')
+        @vectorize([(datetime_t, datetime_t)], target="cuda")
         def timediff(start, end):
             return end - start
-        arr1 = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
+        arr1 = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
         arr2 = arr1 + np.random.randint(0, 10000, arr1.size)
         delta = timediff(arr1, arr2)
         self.assertPreciseEqual(delta, arr2 - arr1)
-    @skip_on_cudasim('ufunc API unsupported in the simulator')
+    @skip_on_cudasim("ufunc API unsupported in the simulator")
     def test_gufunc(self):
-        datetime_t = from_dtype(np.dtype('datetime64[D]'))
-        timedelta_t = from_dtype(np.dtype('timedelta64[D]'))
-        @guvectorize([(datetime_t, datetime_t, timedelta_t[:])], '(),()->()',
-                     target='cuda')
+        datetime_t = from_dtype(np.dtype("datetime64[D]"))
+        timedelta_t = from_dtype(np.dtype("timedelta64[D]"))
+        @guvectorize(
+            [(datetime_t, datetime_t, timedelta_t[:])],
+            "(),()->()",
+            target="cuda",
+        )
         def timediff(start, end, out):
             out[0] = end - start
-        arr1 = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
+        arr1 = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
         arr2 = arr1 + np.random.randint(0, 10000, arr1.size)
         delta = timediff(arr1, arr2)
         self.assertPreciseEqual(delta, arr2 - arr1)
-    @skip_on_cudasim('no .copy_to_host() in the simulator')
+    @skip_on_cudasim("no .copy_to_host() in the simulator")
     def test_datetime_view_as_int64(self):
-        arr = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
+        arr = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
         darr = cuda.to_device(arr)
         viewed = darr.view(np.int64)
         self.assertPreciseEqual(arr.view(np.int64), viewed.copy_to_host())
         self.assertEqual(viewed.gpu_data, darr.gpu_data)
-    @skip_on_cudasim('no .copy_to_host() in the simulator')
+    @skip_on_cudasim("no .copy_to_host() in the simulator")
     def test_timedelta_view_as_int64(self):
-        arr = np.arange('2005-02', '2006-02', dtype='datetime64[D]')
+        arr = np.arange("2005-02", "2006-02", dtype="datetime64[D]")
         arr = arr - (arr - 1)
-        self.assertEqual(arr.dtype, np.dtype('timedelta64[D]'))
+        self.assertEqual(arr.dtype, np.dtype("timedelta64[D]"))
         darr = cuda.to_device(arr)
         viewed = darr.view(np.int64)
         self.assertPreciseEqual(arr.view(np.int64), viewed.copy_to_host())
         self.assertEqual(viewed.gpu_data, darr.gpu_data)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_debug.py CHANGED Viewed

@@ -2,8 +2,11 @@ import numpy as np
 from numba.core.utils import PYVERSION
 from numba.cuda.testing import skip_on_cudasim, CUDATestCase
-from numba.tests.support import (override_config, captured_stderr,
-                                 captured_stdout)
+from numba.tests.support import (
+    override_config,
+    captured_stderr,
+    captured_stdout,
+)
 from numba import cuda, float64
 import unittest
@@ -13,9 +16,8 @@ def simple_cuda(A, B):
     B[i] = A[i] + 1.5
-@skip_on_cudasim('Simulator does not produce debug dumps')
+@skip_on_cudasim("Simulator does not produce debug dumps")
 class TestDebugOutput(CUDATestCase):
     def compile_simple_cuda(self):
         with captured_stderr() as err:
             with captured_stdout() as out:
@@ -34,14 +36,14 @@ class TestDebugOutput(CUDATestCase):
         self.assertRaises(AssertionError, *args, **kwargs)
     def check_debug_output(self, out, enabled_dumps):
-        all_dumps = dict.fromkeys(['bytecode', 'cfg', 'ir', 'llvm',
-                                   'assembly'],
-                                  False)
+        all_dumps = dict.fromkeys(
+            ["bytecode", "cfg", "ir", "llvm", "assembly"], False
+        )
         for name in enabled_dumps:
             assert name in all_dumps
             all_dumps[name] = True
         for name, enabled in sorted(all_dumps.items()):
-            check_meth = getattr(self, '_check_dump_%s' % name)
+            check_meth = getattr(self, "_check_dump_%s" % name)
             if enabled:
                 check_meth(out)
             else:
@@ -50,50 +52,50 @@ class TestDebugOutput(CUDATestCase):
     def _check_dump_bytecode(self, out):
         if PYVERSION > (3, 10):
             # binop with arg=0 is binary add, see CPython dis.py and opcode.py
-            self.assertIn('BINARY_OP(arg=0', out)
+            self.assertIn("BINARY_OP(arg=0", out)
         else:
-            self.assertIn('BINARY_ADD', out)
+            self.assertIn("BINARY_ADD", out)
     def _check_dump_cfg(self, out):
-        self.assertIn('CFG dominators', out)
+        self.assertIn("CFG dominators", out)
     def _check_dump_ir(self, out):
-        self.assertIn('--IR DUMP: simple_cuda--', out)
-        self.assertIn('const(float, 1.5)', out)
+        self.assertIn("--IR DUMP: simple_cuda--", out)
+        self.assertIn("const(float, 1.5)", out)
     def _check_dump_llvm(self, out):
-        self.assertIn('--LLVM DUMP', out)
+        self.assertIn("--LLVM DUMP", out)
         self.assertIn('!"kernel", i32 1', out)
     def _check_dump_assembly(self, out):
-        self.assertIn('--ASSEMBLY simple_cuda', out)
-        self.assertIn('Generated by NVIDIA NVVM Compiler', out)
+        self.assertIn("--ASSEMBLY simple_cuda", out)
+        self.assertIn("Generated by NVIDIA NVVM Compiler", out)
     def test_dump_bytecode(self):
-        with override_config('DUMP_BYTECODE', True):
+        with override_config("DUMP_BYTECODE", True):
             out = self.compile_simple_cuda()
-        self.check_debug_output(out, ['bytecode'])
+        self.check_debug_output(out, ["bytecode"])
     def test_dump_ir(self):
-        with override_config('DUMP_IR', True):
+        with override_config("DUMP_IR", True):
             out = self.compile_simple_cuda()
-        self.check_debug_output(out, ['ir'])
+        self.check_debug_output(out, ["ir"])
     def test_dump_cfg(self):
-        with override_config('DUMP_CFG', True):
+        with override_config("DUMP_CFG", True):
             out = self.compile_simple_cuda()
-        self.check_debug_output(out, ['cfg'])
+        self.check_debug_output(out, ["cfg"])
     def test_dump_llvm(self):
-        with override_config('DUMP_LLVM', True):
+        with override_config("DUMP_LLVM", True):
             out = self.compile_simple_cuda()
-        self.check_debug_output(out, ['llvm'])
+        self.check_debug_output(out, ["llvm"])
     def test_dump_assembly(self):
-        with override_config('DUMP_ASSEMBLY', True):
+        with override_config("DUMP_ASSEMBLY", True):
             out = self.compile_simple_cuda()
-        self.check_debug_output(out, ['assembly'])
+        self.check_debug_output(out, ["assembly"])
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba-cuda 0.8.1__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.1py3-none-any.whl → 0.9.0py3-none-any.whl