PyPI - numba-cuda - Versions diffs - 0.8.1__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.1py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +460 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.1.dist-info/RECORD +0 -251
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.1.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudapy/test_enums.py CHANGED Viewed

@@ -12,18 +12,17 @@ from numba.tests.enum_usecases import (
     Shape,
     Planet,
     RequestError,
-    IntEnumWithNegatives
+    IntEnumWithNegatives,
 )
 class EnumTest(CUDATestCase):
     pairs = [
         (Color.red, Color.red),
         (Color.red, Color.green),
         (Planet.EARTH, Planet.EARTH),
         (Planet.VENUS, Planet.MARS),
-        (Shape.circle, IntEnumWithNegatives.two) # IntEnum, same value
+        (Shape.circle, IntEnumWithNegatives.two),  # IntEnum, same value
     ]
     def test_compare(self):
@@ -45,7 +44,7 @@ class EnumTest(CUDATestCase):
         def f(out):
             # Lookup of an enum member on its class
             out[0] = Color.red == Color.green
-            out[1] = Color['red'] == Color['green']
+            out[1] = Color["red"] == Color["green"]
         cuda_f = cuda.jit(f)
         got = np.zeros((2,), dtype=np.bool_)
@@ -106,16 +105,16 @@ class EnumTest(CUDATestCase):
     def test_vectorize(self):
         def f(x):
             if x != RequestError.not_found:
-                return RequestError['internal_error']
+                return RequestError["internal_error"]
             else:
                 return RequestError.dummy
-        cuda_func = vectorize("int64(int64)", target='cuda')(f)
+        cuda_func = vectorize("int64(int64)", target="cuda")(f)
         arr = np.array([2, 404, 500, 404], dtype=np.int64)
         expected = np.array([f(x) for x in arr], dtype=np.int64)
         got = cuda_func(arr)
         self.assertPreciseEqual(expected, got)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_errors.py CHANGED Viewed

@@ -17,34 +17,49 @@ class TestJitErrors(CUDATestCase):
         with self.assertRaises(ValueError) as raises:
             kernfunc[(1, 2, 3, 4), (5, 6)]
-        self.assertIn("griddim must be a sequence of 1, 2 or 3 integers, "
-                      "got [1, 2, 3, 4]",
-                      str(raises.exception))
+        self.assertIn(
+            "griddim must be a sequence of 1, 2 or 3 integers, "
+            "got [1, 2, 3, 4]",
+            str(raises.exception),
+        )
         with self.assertRaises(ValueError) as raises:
-            kernfunc[(1, 2,), (3, 4, 5, 6)]
-        self.assertIn("blockdim must be a sequence of 1, 2 or 3 integers, "
-                      "got [3, 4, 5, 6]",
-                      str(raises.exception))
+            kernfunc[
+                (
+                    1,
+                    2,
+                ),
+                (3, 4, 5, 6),
+            ]
+        self.assertIn(
+            "blockdim must be a sequence of 1, 2 or 3 integers, "
+            "got [3, 4, 5, 6]",
+            str(raises.exception),
+        )
     def test_non_integral_dims(self):
         kernfunc = cuda.jit(noop)
         with self.assertRaises(TypeError) as raises:
             kernfunc[2.0, 3]
-        self.assertIn("griddim must be a sequence of integers, got [2.0]",
-                      str(raises.exception))
+        self.assertIn(
+            "griddim must be a sequence of integers, got [2.0]",
+            str(raises.exception),
+        )
         with self.assertRaises(TypeError) as raises:
             kernfunc[2, 3.0]
-        self.assertIn("blockdim must be a sequence of integers, got [3.0]",
-                      str(raises.exception))
+        self.assertIn(
+            "blockdim must be a sequence of integers, got [3.0]",
+            str(raises.exception),
+        )
     def _test_unconfigured(self, kernfunc):
         with self.assertRaises(ValueError) as raises:
             kernfunc(0)
-        self.assertIn("launch configuration was not specified",
-                      str(raises.exception))
+        self.assertIn(
+            "launch configuration was not specified", str(raises.exception)
+        )
     def test_unconfigured_typed_cudakernel(self):
         kernfunc = cuda.jit("void(int32)")(noop)
@@ -54,7 +69,7 @@ class TestJitErrors(CUDATestCase):
         kernfunc = cuda.jit(noop)
         self._test_unconfigured(kernfunc)
-    @skip_on_cudasim('TypingError does not occur on simulator')
+    @skip_on_cudasim("TypingError does not occur on simulator")
     def test_typing_error(self):
         # see #5860, this is present to catch changes to error reporting
         # accidentally breaking the CUDA target
@@ -75,5 +90,5 @@ class TestJitErrors(CUDATestCase):
         self.assertIn("NameError: name 'floor' is not defined", excstr)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_exception.py CHANGED Viewed

@@ -83,20 +83,19 @@ class TestException(CUDATestCase):
                         x[i] += x[i] // y[i]
         n = 32
-        got_x = 1. / (np.arange(n) + 0.01)
-        got_y = 1. / (np.arange(n) + 0.01)
+        got_x = 1.0 / (np.arange(n) + 0.01)
+        got_y = 1.0 / (np.arange(n) + 0.01)
         problematic[1, n](got_x, got_y)
-        expect_x = 1. / (np.arange(n) + 0.01)
-        expect_y = 1. / (np.arange(n) + 0.01)
+        expect_x = 1.0 / (np.arange(n) + 0.01)
+        expect_y = 1.0 / (np.arange(n) + 0.01)
         oracle[1, n](expect_x, expect_y)
         np.testing.assert_almost_equal(expect_x, got_x)
         np.testing.assert_almost_equal(expect_y, got_y)
     def test_raise_causing_warp_diverge(self):
-        """Test case for issue #2655.
-        """
+        """Test case for issue #2655."""
         self.case_raise_causing_warp_diverge(with_debug_mode=False)
     # The following two cases relate to Issue #7806: Division by zero stops the
@@ -117,8 +116,8 @@ class TestException(CUDATestCase):
         f[1, 1](r, x, y)
-        self.assertTrue(np.isinf(r[0]), 'Expected inf from div by zero')
-        self.assertEqual(r[1], y[0], 'Expected execution to continue')
+        self.assertTrue(np.isinf(r[0]), "Expected inf from div by zero")
+        self.assertEqual(r[1], y[0], "Expected execution to continue")
     def test_zero_division_error_in_debug(self):
         # When debug is True:
@@ -146,15 +145,15 @@ class TestException(CUDATestCase):
         with self.assertRaises(exc):
             f[1, 1](r, x, y)
-        self.assertEqual(r[0], 0, 'Expected result to be left unset')
-        self.assertEqual(r[1], 0, 'Expected execution to stop')
+        self.assertEqual(r[0], 0, "Expected result to be left unset")
+        self.assertEqual(r[1], 0, "Expected execution to stop")
     @xfail_unless_cudasim
     def test_raise_in_device_function(self):
         # This is an expected failure because reporting of exceptions raised in
         # device functions does not work correctly - see Issue #8036:
         # https://github.com/numba/numba/issues/8036
-        msg = 'Device Function Error'
+        msg = "Device Function Error"
         @cuda.jit(device=True)
         def f():
@@ -170,5 +169,5 @@ class TestException(CUDATestCase):
         self.assertIn(msg, str(raises.exception))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_extending.py CHANGED Viewed

@@ -8,12 +8,13 @@ class Interval:
     """
     A half-open interval on the real number line.
     """
     def __init__(self, lo, hi):
         self.lo = lo
         self.hi = hi
     def __repr__(self):
-        return 'Interval(%f, %f)' % (self.lo, self.hi)
+        return "Interval(%f, %f)" % (self.lo, self.hi)
     @property
     def width(self):
@@ -32,16 +33,21 @@ def sum_intervals(i, j):
 if not config.ENABLE_CUDASIM:
     from numba.core import cgutils
-    from numba.core.extending import (lower_builtin, make_attribute_wrapper,
-                                      models, register_model, type_callable,
-                                      typeof_impl)
+    from numba.core.extending import (
+        lower_builtin,
+        make_attribute_wrapper,
+        models,
+        register_model,
+        type_callable,
+        typeof_impl,
+    )
     from numba.core.typing.templates import AttributeTemplate
     from numba.cuda.cudadecl import registry as cuda_registry
     from numba.cuda.cudaimpl import lower_attr as cuda_lower_attr
     class IntervalType(types.Type):
         def __init__(self):
-            super().__init__(name='Interval')
+            super().__init__(name="Interval")
     interval_type = IntervalType()
@@ -54,19 +60,20 @@ if not config.ENABLE_CUDASIM:
         def typer(lo, hi):
             if isinstance(lo, types.Float) and isinstance(hi, types.Float):
                 return interval_type
         return typer
     @register_model(IntervalType)
     class IntervalModel(models.StructModel):
         def __init__(self, dmm, fe_type):
             members = [
-                ('lo', types.float64),
-                ('hi', types.float64),
+                ("lo", types.float64),
+                ("hi", types.float64),
             ]
             models.StructModel.__init__(self, dmm, fe_type, members)
-    make_attribute_wrapper(IntervalType, 'lo', 'lo')
-    make_attribute_wrapper(IntervalType, 'hi', 'hi')
+    make_attribute_wrapper(IntervalType, "lo", "lo")
+    make_attribute_wrapper(IntervalType, "hi", "hi")
     @lower_builtin(Interval, types.Float, types.Float)
     def impl_interval(context, builder, sig, args):
@@ -84,14 +91,14 @@ if not config.ENABLE_CUDASIM:
         def resolve_width(self, mod):
             return types.float64
-    @cuda_lower_attr(IntervalType, 'width')
+    @cuda_lower_attr(IntervalType, "width")
     def cuda_Interval_width(context, builder, sig, arg):
         lo = builder.extract_value(arg, 0)
         hi = builder.extract_value(arg, 1)
         return builder.fsub(hi, lo)
-@skip_on_cudasim('Extensions not supported in the simulator')
+@skip_on_cudasim("Extensions not supported in the simulator")
 class TestExtending(CUDATestCase):
     def test_attributes(self):
         @cuda.jit
@@ -151,5 +158,5 @@ class TestExtending(CUDATestCase):
         np.testing.assert_allclose(r, expected)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py CHANGED Viewed

@@ -5,8 +5,7 @@ from numba.cuda.compiler import compile_ptx_for_current_device, compile_ptx
 from math import cos, sin, tan, exp, log, log10, log2, pow, tanh
 from operator import truediv
 import numpy as np
-from numba.cuda.testing import (CUDATestCase, skip_on_cudasim,
-                                skip_unless_cc_75)
+from numba.cuda.testing import CUDATestCase, skip_on_cudasim, skip_unless_cc_75
 import unittest
@@ -24,10 +23,9 @@ class FastMathCriterion:
         test.assertTrue(all(i not in prec for i in self.prec_unexpected))
-@skip_on_cudasim('Fastmath and PTX inspection not available on cudasim')
+@skip_on_cudasim("Fastmath and PTX inspection not available on cudasim")
 class TestFastMathOption(CUDATestCase):
     def _test_fast_math_common(self, pyfunc, sig, device, criterion):
         # Test jit code path
         fastver = cuda.jit(sig, device=device, fastmath=True)(pyfunc)
         precver = cuda.jit(sig, device=device)(pyfunc)
@@ -40,9 +38,7 @@ class TestFastMathOption(CUDATestCase):
         fastptx, _ = compile_ptx_for_current_device(
             pyfunc, sig, device=device, fastmath=True
         )
-        precptx, _ = compile_ptx_for_current_device(
-            pyfunc, sig, device=device
-        )
+        precptx, _ = compile_ptx_for_current_device(pyfunc, sig, device=device)
         criterion.check(self, fastptx, precptx)
@@ -69,7 +65,9 @@ class TestFastMathOption(CUDATestCase):
         self._test_fast_math_common(
             kernel,
-            (float32[::1], float32, float32), device=False, criterion=criterion
+            (float32[::1], float32, float32),
+            device=False,
+            criterion=criterion,
         )
         self._test_fast_math_common(
             device, (float32, float32), device=True, criterion=criterion
@@ -79,39 +77,41 @@ class TestFastMathOption(CUDATestCase):
         self._test_fast_math_unary(
             cos,
             FastMathCriterion(
-                fast_expected=['cos.approx.ftz.f32 '],
-                prec_unexpected=['cos.approx.ftz.f32 ']
-            )
+                fast_expected=["cos.approx.ftz.f32 "],
+                prec_unexpected=["cos.approx.ftz.f32 "],
+            ),
         )
     def test_sinf(self):
         self._test_fast_math_unary(
             sin,
             FastMathCriterion(
-                fast_expected=['sin.approx.ftz.f32 '],
-                prec_unexpected=['sin.approx.ftz.f32 ']
-            )
+                fast_expected=["sin.approx.ftz.f32 "],
+                prec_unexpected=["sin.approx.ftz.f32 "],
+            ),
         )
     def test_tanf(self):
         self._test_fast_math_unary(
             tan,
-            FastMathCriterion(fast_expected=[
-                'sin.approx.ftz.f32 ',
-                'cos.approx.ftz.f32 ',
-                'div.approx.ftz.f32 '
-            ], prec_unexpected=['sin.approx.ftz.f32 '])
+            FastMathCriterion(
+                fast_expected=[
+                    "sin.approx.ftz.f32 ",
+                    "cos.approx.ftz.f32 ",
+                    "div.approx.ftz.f32 ",
+                ],
+                prec_unexpected=["sin.approx.ftz.f32 "],
+            ),
         )
     @skip_unless_cc_75
     def test_tanhf(self):
         self._test_fast_math_unary(
             tanh,
             FastMathCriterion(
-                fast_expected=['tanh.approx.f32 '],
-                prec_unexpected=['tanh.approx.f32 ']
-            )
+                fast_expected=["tanh.approx.f32 "],
+                prec_unexpected=["tanh.approx.f32 "],
+            ),
         )
     def test_tanhf_compile_ptx(self):
@@ -119,74 +119,85 @@ class TestFastMathOption(CUDATestCase):
             r[0] = tanh(x)
         def tanh_common_test(cc, criterion):
-            fastptx, _ = compile_ptx(tanh_kernel, (float32[::1], float32),
-                                     fastmath=True, cc=cc)
-            precptx, _ = compile_ptx(tanh_kernel, (float32[::1], float32),
-                                     cc=cc)
+            fastptx, _ = compile_ptx(
+                tanh_kernel, (float32[::1], float32), fastmath=True, cc=cc
+            )
+            precptx, _ = compile_ptx(
+                tanh_kernel, (float32[::1], float32), cc=cc
+            )
             criterion.check(self, fastptx, precptx)
-        tanh_common_test(cc=(7, 5), criterion=FastMathCriterion(
-            fast_expected=['tanh.approx.f32 '],
-            prec_unexpected=['tanh.approx.f32 ']
-        ))
+        tanh_common_test(
+            cc=(7, 5),
+            criterion=FastMathCriterion(
+                fast_expected=["tanh.approx.f32 "],
+                prec_unexpected=["tanh.approx.f32 "],
+            ),
+        )
-        tanh_common_test(cc=(7, 0),
-                         criterion=FastMathCriterion(
-            fast_expected=['ex2.approx.ftz.f32 ',
-                           'rcp.approx.ftz.f32 '],
-            prec_unexpected=['tanh.approx.f32 ']))
+        tanh_common_test(
+            cc=(7, 0),
+            criterion=FastMathCriterion(
+                fast_expected=["ex2.approx.ftz.f32 ", "rcp.approx.ftz.f32 "],
+                prec_unexpected=["tanh.approx.f32 "],
+            ),
+        )
     def test_expf(self):
         self._test_fast_math_unary(
             exp,
             FastMathCriterion(
-                fast_unexpected=['fma.rn.f32 '],
-                prec_expected=['fma.rn.f32 ']
-            )
+                fast_unexpected=["fma.rn.f32 "], prec_expected=["fma.rn.f32 "]
+            ),
         )
     def test_logf(self):
         # Look for constant used to convert from log base 2 to log base e
         self._test_fast_math_unary(
-            log, FastMathCriterion(
-                fast_expected=['lg2.approx.ftz.f32 ', '0f3F317218'],
-                prec_unexpected=['lg2.approx.ftz.f32 '],
-            )
+            log,
+            FastMathCriterion(
+                fast_expected=["lg2.approx.ftz.f32 ", "0f3F317218"],
+                prec_unexpected=["lg2.approx.ftz.f32 "],
+            ),
         )
     def test_log10f(self):
         # Look for constant used to convert from log base 2 to log base 10
         self._test_fast_math_unary(
-            log10, FastMathCriterion(
-                fast_expected=['lg2.approx.ftz.f32 ', '0f3E9A209B'],
-                prec_unexpected=['lg2.approx.ftz.f32 ']
-            )
+            log10,
+            FastMathCriterion(
+                fast_expected=["lg2.approx.ftz.f32 ", "0f3E9A209B"],
+                prec_unexpected=["lg2.approx.ftz.f32 "],
+            ),
         )
     def test_log2f(self):
         self._test_fast_math_unary(
-            log2, FastMathCriterion(
-                fast_expected=['lg2.approx.ftz.f32 '],
-                prec_unexpected=['lg2.approx.ftz.f32 ']
-            )
+            log2,
+            FastMathCriterion(
+                fast_expected=["lg2.approx.ftz.f32 "],
+                prec_unexpected=["lg2.approx.ftz.f32 "],
+            ),
         )
     def test_powf(self):
         self._test_fast_math_binary(
-            pow, FastMathCriterion(
-                fast_expected=['lg2.approx.ftz.f32 '],
-                prec_unexpected=['lg2.approx.ftz.f32 '],
-            )
+            pow,
+            FastMathCriterion(
+                fast_expected=["lg2.approx.ftz.f32 "],
+                prec_unexpected=["lg2.approx.ftz.f32 "],
+            ),
         )
     def test_divf(self):
         self._test_fast_math_binary(
-            truediv, FastMathCriterion(
-                fast_expected=['div.approx.ftz.f32 '],
-                fast_unexpected=['div.rn.f32'],
-                prec_expected=['div.rn.f32'],
-                prec_unexpected=['div.approx.ftz.f32 '],
-            )
+            truediv,
+            FastMathCriterion(
+                fast_expected=["div.approx.ftz.f32 "],
+                fast_unexpected=["div.rn.f32"],
+                prec_expected=["div.rn.f32"],
+                prec_unexpected=["div.approx.ftz.f32 "],
+            ),
         )
     def test_divf_exception(self):
@@ -232,13 +243,13 @@ class TestFastMathOption(CUDATestCase):
         # https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#floating-point-instructions-div
         # The fast version should use the "fast, approximate divide" variant
-        self.assertIn('div.approx.f32', fastver.inspect_asm(sig))
+        self.assertIn("div.approx.f32", fastver.inspect_asm(sig))
         # The precise version should use the "IEEE 754 compliant rounding"
         # variant, and neither of the "approximate divide" variants.
-        self.assertIn('div.rn.f32', precver.inspect_asm(sig))
-        self.assertNotIn('div.approx.f32', precver.inspect_asm(sig))
-        self.assertNotIn('div.full.f32', precver.inspect_asm(sig))
+        self.assertIn("div.rn.f32", precver.inspect_asm(sig))
+        self.assertNotIn("div.approx.f32", precver.inspect_asm(sig))
+        self.assertNotIn("div.full.f32", precver.inspect_asm(sig))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_forall.py CHANGED Viewed

@@ -44,9 +44,11 @@ class TestForAll(CUDATestCase):
         # negative element count.
         with self.assertRaises(ValueError) as raises:
             foo.forall(-1)
-        self.assertIn("Can't create ForAll with negative task count",
-                      str(raises.exception))
+        self.assertIn(
+            "Can't create ForAll with negative task count",
+            str(raises.exception),
+        )
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_freevar.py CHANGED Viewed

@@ -17,13 +17,15 @@ class TestFreeVar(CUDATestCase):
         @cuda.jit("(float32[::1], intp)")
         def foo(A, i):
             "Dummy function"
-            sdata = cuda.shared.array(size,   # size is freevar
-                                      dtype=nbtype)  # nbtype is freevar
+            sdata = cuda.shared.array(
+                size,  # size is freevar
+                dtype=nbtype,
+            )  # nbtype is freevar
             A[i] = sdata[i]
         A = np.arange(2, dtype="float32")
         foo[1, 1](A, 0)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py CHANGED Viewed

@@ -62,5 +62,5 @@ class TestCudaFrexpLdexp(CUDATestCase):
         self.template_test_ldexp(np.float64, float64)
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba_cuda/numba/cuda/tests/cudapy/test_globals.py CHANGED Viewed

@@ -29,8 +29,7 @@ def coop_smem2d(ary):
 class TestCudaTestGlobal(CUDATestCase):
     def test_global_int_const(self):
-        """Test simple_smem
-        """
+        """Test simple_smem"""
         compiled = cuda.jit("void(int32[:])")(simple_smem)
         nelem = 100
@@ -41,8 +40,7 @@ class TestCudaTestGlobal(CUDATestCase):
     @unittest.SkipTest
     def test_global_tuple_const(self):
-        """Test coop_smem2d
-        """
+        """Test coop_smem2d"""
         compiled = cuda.jit("void(float32[:,:])")(coop_smem2d)
         shape = 10, 20
@@ -56,5 +54,5 @@ class TestCudaTestGlobal(CUDATestCase):
         self.assertTrue(np.allclose(ary, exp))
-if __name__ == '__main__':
+if __name__ == "__main__":
     unittest.main()

numba-cuda 0.8.1__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.1py3-none-any.whl → 0.9.0py3-none-any.whl