PyPI - numba-cuda - Versions diffs - 0.8.1__py3-none-any.whl → 0.10.0__py3-none-any.whl - Mend

numba-cuda 0.8.1py3-none-any.whl → 0.10.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (237) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +246 -114
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_bf16.py +5155 -0
numba_cuda/numba/cuda/cuda_paths.py +293 -99
numba_cuda/numba/cuda/cudadecl.py +93 -79
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +460 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +27 -3
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +146 -30
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +296 -275
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +99 -7
numba_cuda/numba/cuda/decorators.py +87 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +68 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +55 -1
numba_cuda/numba/cuda/include/11/cuda_bf16.h +3749 -0
numba_cuda/numba/cuda/include/11/cuda_bf16.hpp +2683 -0
numba_cuda/numba/cuda/{cuda_fp16.h → include/11/cuda_fp16.h} +1090 -927
numba_cuda/numba/cuda/{cuda_fp16.hpp → include/11/cuda_fp16.hpp} +468 -319
numba_cuda/numba/cuda/include/12/cuda_bf16.h +5118 -0
numba_cuda/numba/cuda/include/12/cuda_bf16.hpp +3865 -0
numba_cuda/numba/cuda/include/12/cuda_fp16.h +5363 -0
numba_cuda/numba/cuda/include/12/cuda_fp16.hpp +3483 -0
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +0 -39
numba_cuda/numba/cuda/intrinsics.py +203 -28
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/lowering.py +43 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +134 -108
numba_cuda/numba/cuda/target.py +92 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +10 -7
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_bfloat16_bindings.py +257 -0
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +59 -23
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +77 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +24 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +21 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inline.py +59 -0
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +81 -30
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +5 -3
numba_cuda/numba/cuda/vectorizers.py +38 -33
{numba_cuda-0.8.1.dist-info → numba_cuda-0.10.0.dist-info}/METADATA +1 -1
numba_cuda-0.10.0.dist-info/RECORD +263 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.10.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.1.dist-info/RECORD +0 -251
{numba_cuda-0.8.1.dist-info → numba_cuda-0.10.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.10.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py CHANGED Viewed

@@ -13,9 +13,11 @@ import unittest
 # Signatures to test with - these are all homogeneous in dtype, so the output
 # dtype should match the input dtype - the output should not have been cast
 # upwards, as reported in #8400: https://github.com/numba/numba/issues/8400
-signatures = [int32(int32, int32),
-              float32(float32, float32),
-              float64(float64, float64)]
+signatures = [
+    int32(int32, int32),
+    float32(float32, float32),
+    float64(float64, float64),
+]
 # The order here is chosen such that each subsequent dtype might have been
 # casted to a previously-used dtype. This is unlikely to be an issue for CUDA,
@@ -25,16 +27,16 @@ signatures = [int32(int32, int32),
 dtypes = (np.float64, np.float32, np.int32)
 # NumPy ndarray orders
-orders = ('C', 'F')
+orders = ("C", "F")
 # Input sizes corresponding to operations:
 # - Less than one warp,
 # - Less than one block,
 # - Greater than one block (i.e. many blocks)
-input_sizes = (8, 100, 2 ** 10 + 1)
+input_sizes = (8, 100, 2**10 + 1)
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestCUDAVectorize(CUDATestCase):
     # Presumably chosen as an odd number unlikely to coincide with the total
     # thread count, and large enough to ensure a significant number of blocks
@@ -42,8 +44,7 @@ class TestCUDAVectorize(CUDATestCase):
     N = 1000001
     def test_scalar(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -53,8 +54,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.assertEqual(c, a + b)
     def test_1d(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -66,8 +66,7 @@ class TestCUDAVectorize(CUDATestCase):
             self.assertEqual(actual.dtype, ty)
     def test_1d_async(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -86,8 +85,7 @@ class TestCUDAVectorize(CUDATestCase):
             self.assertEqual(actual.dtype, ty)
     def test_nd(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -102,7 +100,7 @@ class TestCUDAVectorize(CUDATestCase):
             self.assertEqual(actual.dtype, dtype)
     def test_output_arg(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -117,7 +115,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.assertEqual(expected.dtype, actual.dtype)
     def test_reduce(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -135,8 +133,7 @@ class TestCUDAVectorize(CUDATestCase):
             self.assertEqual(dtype, actual.dtype)
     def test_reduce_async(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -153,7 +150,7 @@ class TestCUDAVectorize(CUDATestCase):
             self.assertEqual(dtype, actual.dtype)
     def test_manual_transfer(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -166,7 +163,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.assertEqual(expected.dtype, actual.dtype)
     def test_ufunc_output_2d(self):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -181,7 +178,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.assertEqual(expected.dtype, actual.dtype)
     def check_tuple_arg(self, a, b):
-        @vectorize(signatures, target='cuda')
+        @vectorize(signatures, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -194,7 +191,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.check_tuple_arg(a, b)
     def test_namedtuple_arg(self):
-        Point = namedtuple('Point', ('x', 'y', 'z'))
+        Point = namedtuple("Point", ("x", "y", "z"))
         a = Point(x=1.0, y=2.0, z=3.0)
         b = Point(x=4.0, y=5.0, z=6.0)
         self.check_tuple_arg(a, b)
@@ -206,7 +203,7 @@ class TestCUDAVectorize(CUDATestCase):
         self.check_tuple_arg(a, b)
     def test_tuple_of_namedtuple_arg(self):
-        Point = namedtuple('Point', ('x', 'y', 'z'))
+        Point = namedtuple("Point", ("x", "y", "z"))
         a = (Point(x=1.0, y=2.0, z=3.0), Point(x=1.5, y=2.5, z=3.5))
         b = (Point(x=4.0, y=5.0, z=6.0), Point(x=4.5, y=5.5, z=6.5))
         self.check_tuple_arg(a, b)
@@ -216,17 +213,17 @@ class TestCUDAVectorize(CUDATestCase):
         ys1 = xs1 + 2
         xs2 = np.arange(10, dtype=np.int32) * 2
         ys2 = xs2 + 1
-        Points = namedtuple('Points', ('xs', 'ys'))
+        Points = namedtuple("Points", ("xs", "ys"))
         a = Points(xs=xs1, ys=ys1)
         b = Points(xs=xs2, ys=ys2)
         self.check_tuple_arg(a, b)
     def test_name_attribute(self):
-        @vectorize('f8(f8)', target='cuda')
+        @vectorize("f8(f8)", target="cuda")
         def bar(x):
-            return x ** 2
+            return x**2
-        self.assertEqual(bar.__name__, 'bar')
+        self.assertEqual(bar.__name__, "bar")
     def test_no_transfer_for_device_data(self):
         # Initialize test data on the device prior to banning host <-> device
@@ -238,15 +235,15 @@ class TestCUDAVectorize(CUDATestCase):
         # A mock of a CUDA function that always raises a CudaAPIError
         def raising_transfer(*args, **kwargs):
-            raise CudaAPIError(999, 'Transfer not allowed')
+            raise CudaAPIError(999, "Transfer not allowed")
         # Use the mock for transfers between the host and device
-        old_HtoD = getattr(driver, 'cuMemcpyHtoD', None)
-        old_DtoH = getattr(driver, 'cuMemcpyDtoH', None)
+        old_HtoD = getattr(driver, "cuMemcpyHtoD", None)
+        old_DtoH = getattr(driver, "cuMemcpyDtoH", None)
-        setattr(driver, 'cuMemcpyHtoD', raising_transfer)
-        setattr(driver, 'cuMemcpyDtoH', raising_transfer)
+        setattr(driver, "cuMemcpyHtoD", raising_transfer)
+        setattr(driver, "cuMemcpyDtoH", raising_transfer)
         # Ensure that the mock functions are working as expected
@@ -260,7 +257,7 @@ class TestCUDAVectorize(CUDATestCase):
             # Check that defining and calling a ufunc with data on the device
             # induces no transfers
-            @vectorize(['float32(float32)'], target='cuda')
+            @vectorize(["float32(float32)"], target="cuda")
             def func(noise):
                 return noise + 1.0
@@ -270,14 +267,14 @@ class TestCUDAVectorize(CUDATestCase):
             # no original implementation, simply remove ours.
             if old_HtoD is not None:
-                setattr(driver, 'cuMemcpyHtoD', old_HtoD)
+                setattr(driver, "cuMemcpyHtoD", old_HtoD)
             else:
                 del driver.cuMemcpyHtoD
             if old_DtoH is not None:
-                setattr(driver, 'cuMemcpyDtoH', old_DtoH)
+                setattr(driver, "cuMemcpyDtoH", old_DtoH)
             else:
                 del driver.cuMemcpyDtoH
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py CHANGED Viewed

@@ -4,17 +4,17 @@ from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestVectorizeComplex(CUDATestCase):
     def test_vectorize_complex(self):
-        @vectorize(['complex128(complex128)'], target='cuda')
+        @vectorize(["complex128(complex128)"], target="cuda")
         def vcomp(a):
-            return a * a + 1.
+            return a * a + 1.0
         A = np.arange(5, dtype=np.complex128)
         B = vcomp(A)
-        self.assertTrue(np.allclose(A * A + 1., B))
+        self.assertTrue(np.allclose(A * A + 1.0, B))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py CHANGED Viewed

@@ -1,21 +1,25 @@
 import numpy as np
 from numba import vectorize, cuda
-from numba.tests.npyufunc.test_vectorize_decor import BaseVectorizeDecor, \
-    BaseVectorizeNopythonArg, BaseVectorizeUnrecognizedArg
+from numba.tests.npyufunc.test_vectorize_decor import (
+    BaseVectorizeDecor,
+    BaseVectorizeNopythonArg,
+    BaseVectorizeUnrecognizedArg,
+)
 from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestVectorizeDecor(CUDATestCase, BaseVectorizeDecor):
     """
     Runs the tests from BaseVectorizeDecor with the CUDA target.
     """
-    target = 'cuda'
+    target = "cuda"
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestGPUVectorizeBroadcast(CUDATestCase):
     def test_broadcast(self):
         a = np.random.randn(100, 3, 1)
@@ -24,7 +28,7 @@ class TestGPUVectorizeBroadcast(CUDATestCase):
         def fn(a, b):
             return a - b
-        @vectorize(['float64(float64,float64)'], target='cuda')
+        @vectorize(["float64(float64,float64)"], target="cuda")
         def fngpu(a, b):
             return a - b
@@ -43,7 +47,7 @@ class TestGPUVectorizeBroadcast(CUDATestCase):
         def fn(a, b):
             return a - b
-        @vectorize(['float64(float64,float64)'], target='cuda')
+        @vectorize(["float64(float64,float64)"], target="cuda")
         def fngpu(a, b):
             return a - b
@@ -52,18 +56,18 @@ class TestGPUVectorizeBroadcast(CUDATestCase):
         np.testing.assert_almost_equal(expect, got.copy_to_host())
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestVectorizeNopythonArg(BaseVectorizeNopythonArg, CUDATestCase):
     def test_target_cuda_nopython(self):
         warnings = ["nopython kwarg for cuda target is redundant"]
-        self._test_target_nopython('cuda', warnings)
+        self._test_target_nopython("cuda", warnings)
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestVectorizeUnrecognizedArg(BaseVectorizeUnrecognizedArg, CUDATestCase):
     def test_target_cuda_unrecognized_arg(self):
-        self._test_target_unrecognized_arg('cuda')
+        self._test_target_unrecognized_arg("cuda")
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py CHANGED Viewed

@@ -5,19 +5,19 @@ from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestCudaVectorizeDeviceCall(CUDATestCase):
     def test_cuda_vectorize_device_call(self):
         @cuda.jit(float32(float32, float32, float32), device=True)
         def cu_device_fn(x, y, z):
-            return x ** y / z
+            return x**y / z
         def cu_ufunc(x, y, z):
             return cu_device_fn(x, y, z)
-        ufunc = vectorize([float32(float32, float32, float32)], target='cuda')(
-            cu_ufunc)
+        ufunc = vectorize([float32(float32, float32, float32)], target="cuda")(
+            cu_ufunc
+        )
         N = 100
@@ -27,10 +27,10 @@ class TestCudaVectorizeDeviceCall(CUDATestCase):
         out = ufunc(X, Y, Z)
-        gold = (X ** Y) / Z
+        gold = (X**Y) / Z
         self.assertTrue(np.allclose(out, gold))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py CHANGED Viewed

@@ -7,11 +7,10 @@ import unittest
 sig = [float64(float64, float64)]
-@skip_on_cudasim('ufunc API unsupported in the simulator')
+@skip_on_cudasim("ufunc API unsupported in the simulator")
 class TestCUDAVectorizeScalarArg(CUDATestCase):
     def test_vectorize_scalar_arg(self):
-        @vectorize(sig, target='cuda')
+        @vectorize(sig, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -20,11 +19,11 @@ class TestCUDAVectorizeScalarArg(CUDATestCase):
         v = vector_add(1.0, dA)
         np.testing.assert_array_almost_equal(
-            v.copy_to_host(),
-            np.arange(1, 11, dtype=np.float64))
+            v.copy_to_host(), np.arange(1, 11, dtype=np.float64)
+        )
     def test_vectorize_all_scalars(self):
-        @vectorize(sig, target='cuda')
+        @vectorize(sig, target="cuda")
         def vector_add(a, b):
             return a + b
@@ -33,5 +32,5 @@ class TestCUDAVectorizeScalarArg(CUDATestCase):
         np.testing.assert_almost_equal(2.0, v)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_warning.py CHANGED Viewed

@@ -7,27 +7,27 @@ from numba.core import config
 import warnings
-@skip_on_cudasim('cudasim does not raise performance warnings')
+@skip_on_cudasim("cudasim does not raise performance warnings")
 class TestWarnings(CUDATestCase):
     def test_inefficient_launch_configuration(self):
         @cuda.jit
         def kernel():
             pass
-        with override_config('CUDA_LOW_OCCUPANCY_WARNINGS', 1):
+        with override_config("CUDA_LOW_OCCUPANCY_WARNINGS", 1):
             with warnings.catch_warnings(record=True) as w:
                 kernel[1, 1]()
         self.assertEqual(w[0].category, NumbaPerformanceWarning)
-        self.assertIn('Grid size', str(w[0].message))
-        self.assertIn('low occupancy', str(w[0].message))
+        self.assertIn("Grid size", str(w[0].message))
+        self.assertIn("low occupancy", str(w[0].message))
     def test_efficient_launch_configuration(self):
         @cuda.jit
         def kernel():
             pass
-        with override_config('CUDA_LOW_OCCUPANCY_WARNINGS', 1):
+        with override_config("CUDA_LOW_OCCUPANCY_WARNINGS", 1):
             with warnings.catch_warnings(record=True) as w:
                 kernel[256, 256]()
@@ -40,14 +40,15 @@ class TestWarnings(CUDATestCase):
         N = 10
         arr_f32 = np.zeros(N, dtype=np.float32)
-        with override_config('CUDA_WARN_ON_IMPLICIT_COPY', 1):
+        with override_config("CUDA_WARN_ON_IMPLICIT_COPY", 1):
             with warnings.catch_warnings(record=True) as w:
                 foo[1, N](arr_f32, N)
         self.assertEqual(w[0].category, NumbaPerformanceWarning)
-        self.assertIn('Host array used in CUDA kernel will incur',
-                      str(w[0].message))
-        self.assertIn('copy overhead', str(w[0].message))
+        self.assertIn(
+            "Host array used in CUDA kernel will incur", str(w[0].message)
+        )
+        self.assertIn("copy overhead", str(w[0].message))
     def test_pinned_warn_on_host_array(self):
         @cuda.jit
@@ -57,14 +58,15 @@ class TestWarnings(CUDATestCase):
         N = 10
         ary = cuda.pinned_array(N, dtype=np.float32)
-        with override_config('CUDA_WARN_ON_IMPLICIT_COPY', 1):
+        with override_config("CUDA_WARN_ON_IMPLICIT_COPY", 1):
             with warnings.catch_warnings(record=True) as w:
                 foo[1, N](ary, N)
         self.assertEqual(w[0].category, NumbaPerformanceWarning)
-        self.assertIn('Host array used in CUDA kernel will incur',
-                      str(w[0].message))
-        self.assertIn('copy overhead', str(w[0].message))
+        self.assertIn(
+            "Host array used in CUDA kernel will incur", str(w[0].message)
+        )
+        self.assertIn("copy overhead", str(w[0].message))
     def test_nowarn_on_mapped_array(self):
         @cuda.jit
@@ -74,7 +76,7 @@ class TestWarnings(CUDATestCase):
         N = 10
         ary = cuda.mapped_array(N, dtype=np.float32)
-        with override_config('CUDA_WARN_ON_IMPLICIT_COPY', 1):
+        with override_config("CUDA_WARN_ON_IMPLICIT_COPY", 1):
             with warnings.catch_warnings(record=True) as w:
                 foo[1, N](ary, N)
@@ -89,7 +91,7 @@ class TestWarnings(CUDATestCase):
         N = 10
         ary = cuda.managed_array(N, dtype=np.float32)
-        with override_config('CUDA_WARN_ON_IMPLICIT_COPY', 1):
+        with override_config("CUDA_WARN_ON_IMPLICIT_COPY", 1):
             with warnings.catch_warnings(record=True) as w:
                 foo[1, N](ary, N)
@@ -103,7 +105,7 @@ class TestWarnings(CUDATestCase):
         N = 10
         ary = cuda.device_array(N, dtype=np.float32)
-        with override_config('CUDA_WARN_ON_IMPLICIT_COPY', 1):
+        with override_config("CUDA_WARN_ON_IMPLICIT_COPY", 1):
             with warnings.catch_warnings(record=True) as w:
                 foo[1, N](ary, N)
@@ -114,14 +116,14 @@ class TestWarnings(CUDATestCase):
             cuda.jit(debug=True, opt=True)
         self.assertEqual(len(w), 1)
-        self.assertIn('not supported by CUDA', str(w[0].message))
+        self.assertIn("not supported by CUDA", str(w[0].message))
     def test_warn_on_debug_and_opt_default(self):
         with warnings.catch_warnings(record=True) as w:
             cuda.jit(debug=True)
         self.assertEqual(len(w), 1)
-        self.assertIn('not supported by CUDA', str(w[0].message))
+        self.assertIn("not supported by CUDA", str(w[0].message))
     def test_no_warn_on_debug_and_no_opt(self):
         with warnings.catch_warnings(record=True) as w:
@@ -136,8 +138,8 @@ class TestWarnings(CUDATestCase):
         self.assertEqual(len(w), 0)
     def test_no_warn_on_debug_and_opt_with_config(self):
-        with override_config('CUDA_DEBUGINFO_DEFAULT', 1):
-            with override_config('OPT', config._OptLevel(0)):
+        with override_config("CUDA_DEBUGINFO_DEFAULT", 1):
+            with override_config("OPT", config._OptLevel(0)):
                 with warnings.catch_warnings(record=True) as w:
                     cuda.jit()
@@ -148,30 +150,30 @@ class TestWarnings(CUDATestCase):
             self.assertEqual(len(w), 0)
-        with override_config('OPT', config._OptLevel(0)):
+        with override_config("OPT", config._OptLevel(0)):
             with warnings.catch_warnings(record=True) as w:
                 cuda.jit(debug=True)
             self.assertEqual(len(w), 0)
     def test_warn_on_debug_and_opt_with_config(self):
-        with override_config('CUDA_DEBUGINFO_DEFAULT', 1):
-            for opt in (1, 2, 3, 'max'):
-                with override_config('OPT', config._OptLevel(opt)):
+        with override_config("CUDA_DEBUGINFO_DEFAULT", 1):
+            for opt in (1, 2, 3, "max"):
+                with override_config("OPT", config._OptLevel(opt)):
                     with warnings.catch_warnings(record=True) as w:
                         cuda.jit()
                 self.assertEqual(len(w), 1)
-                self.assertIn('not supported by CUDA', str(w[0].message))
+                self.assertIn("not supported by CUDA", str(w[0].message))
-        for opt in (1, 2, 3, 'max'):
-            with override_config('OPT', config._OptLevel(opt)):
+        for opt in (1, 2, 3, "max"):
+            with override_config("OPT", config._OptLevel(opt)):
                 with warnings.catch_warnings(record=True) as w:
                     cuda.jit(debug=True)
                 self.assertEqual(len(w), 1)
-                self.assertIn('not supported by CUDA', str(w[0].message))
+                self.assertIn("not supported by CUDA", str(w[0].message))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba-cuda 0.8.1__py3-none-any.whl → 0.10.0__py3-none-any.whl

numba-cuda 0.8.1py3-none-any.whl → 0.10.0py3-none-any.whl