PyPI - numba-cuda - Versions diffs - 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +463 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.0.dist-info/RECORD +0 -251
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/simulator/kernel.py CHANGED Viewed

@@ -41,9 +41,10 @@ def _get_kernel_context():
 class FakeOverload:
-    '''
+    """
     Used only to provide the max_cooperative_grid_blocks method
-    '''
+    """
     def max_cooperative_grid_blocks(self, blockdim):
         # We can only run one block in a cooperative grid because we have no
         # mechanism for synchronization between different blocks
@@ -58,16 +59,16 @@ class FakeOverloadDict(dict):
 class FakeCUDAKernel(object):
-    '''
+    """
     Wraps a @cuda.jit-ed function.
-    '''
+    """
     def __init__(self, fn, device, fastmath=False, extensions=[], debug=False):
         self.fn = fn
         self._device = device
         self._fastmath = fastmath
         self._debug = debug
-        self.extensions = list(extensions) # defensive copy
+        self.extensions = list(extensions)  # defensive copy
         # Initial configuration: grid unconfigured, stream 0, no dynamic shared
         # memory.
         self.grid_dim = None
@@ -82,11 +83,13 @@ class FakeCUDAKernel(object):
                 return self.fn(*args)
         # Ensure we've been given a valid grid configuration
-        grid_dim, block_dim = normalize_kernel_dimensions(self.grid_dim,
-                                                          self.block_dim)
+        grid_dim, block_dim = normalize_kernel_dimensions(
+            self.grid_dim, self.block_dim
+        )
-        fake_cuda_module = FakeCUDAModule(grid_dim, block_dim,
-                                          self.dynshared_size)
+        fake_cuda_module = FakeCUDAModule(
+            grid_dim, block_dim, self.dynshared_size
+        )
         with _push_kernel_context(fake_cuda_module):
             # fake_args substitutes all numpy arrays for FakeCUDAArrays
             # because they implement some semantics differently
@@ -96,11 +99,10 @@ class FakeCUDAKernel(object):
                 # map the arguments using any extension you've registered
                 _, arg = functools.reduce(
                     lambda ty_val, extension: extension.prepare_args(
-                        *ty_val,
-                        stream=0,
-                        retr=retr),
+                        *ty_val, stream=0, retr=retr
+                    ),
                     self.extensions,
-                    (None, arg)
+                    (None, arg),
                 )
                 if isinstance(arg, np.ndarray) and arg.ndim > 0:
@@ -126,8 +128,9 @@ class FakeCUDAKernel(object):
                 wb()
     def __getitem__(self, configuration):
-        self.grid_dim, self.block_dim = \
-            normalize_kernel_dimensions(*configuration[:2])
+        self.grid_dim, self.block_dim = normalize_kernel_dimensions(
+            *configuration[:2]
+        )
         if len(configuration) == 4:
             self.dynshared_size = configuration[3]
@@ -142,8 +145,9 @@ class FakeCUDAKernel(object):
     def forall(self, ntasks, tpb=0, stream=0, sharedmem=0):
         if ntasks < 0:
-            raise ValueError("Can't create ForAll with negative task count: %s"
-                             % ntasks)
+            raise ValueError(
+                "Can't create ForAll with negative task count: %s" % ntasks
+            )
         return self[ntasks, 1, stream, sharedmem]
     @property
@@ -157,15 +161,19 @@ class FakeCUDAKernel(object):
 # Thread emulation
 class BlockThread(threading.Thread):
-    '''
+    """
     Manages the execution of a function for a single CUDA thread.
-    '''
+    """
     def __init__(self, f, manager, blockIdx, threadIdx, debug):
         if debug:
             def debug_wrapper(*args, **kwargs):
-                np.seterr(divide='raise')
+                np.seterr(divide="raise")
                 f(*args, **kwargs)
             target = debug_wrapper
         else:
             target = f
@@ -181,27 +189,26 @@ class BlockThread(threading.Thread):
         self.abort = False
         self.debug = debug
         blockDim = Dim3(*self._manager._block_dim)
-        self.thread_id = self.threadIdx.x + (blockDim.x * (self.threadIdx.y +
-                                                           blockDim.y *
-                                                           self.threadIdx.z))
+        self.thread_id = self.threadIdx.x + (
+            blockDim.x * (self.threadIdx.y + blockDim.y * self.threadIdx.z)
+        )
     def run(self):
         try:
             super(BlockThread, self).run()
         except Exception as e:
-            tid = 'tid=%s' % list(self.threadIdx)
-            ctaid = 'ctaid=%s' % list(self.blockIdx)
-            if str(e) == '':
-                msg = '%s %s' % (tid, ctaid)
+            tid = "tid=%s" % list(self.threadIdx)
+            ctaid = "ctaid=%s" % list(self.blockIdx)
+            if str(e) == "":
+                msg = "%s %s" % (tid, ctaid)
             else:
-                msg = '%s %s: %s' % (tid, ctaid, e)
+                msg = "%s %s: %s" % (tid, ctaid, e)
             tb = sys.exc_info()[2]
             # Using `with_traceback` here would cause it to be mutated by
             # future raise statements, which may or may not matter.
             self.exception = (type(e)(msg), tb)
     def syncthreads(self):
         if self.abort:
             raise RuntimeError("abort flag set on syncthreads call")
@@ -237,11 +244,11 @@ class BlockThread(threading.Thread):
         return 1 if test else 0
     def __str__(self):
-        return 'Thread <<<%s, %s>>>' % (self.blockIdx, self.threadIdx)
+        return "Thread <<<%s, %s>>>" % (self.blockIdx, self.threadIdx)
 class BlockManager(object):
-    '''
+    """
     Manages the execution of a thread block.
     When run() is called, all threads are started. Each thread executes until it
@@ -257,7 +264,8 @@ class BlockManager(object):
     The polling continues until no threads are alive, when execution is
     complete.
-    '''
+    """
     def __init__(self, f, grid_dim, block_dim, debug):
         self._grid_dim = grid_dim
         self._block_dim = block_dim
@@ -271,8 +279,10 @@ class BlockManager(object):
         livethreads = set()
         blockedthreads = set()
         for block_point in np.ndindex(*self._block_dim):
             def target():
                 self._f(*args)
             t = BlockThread(target, self, grid_point, block_point, self._debug)
             t.start()
             threads.add(t)
@@ -286,7 +296,6 @@ class BlockManager(object):
                 if t.syncthreads_blocked:
                     blockedthreads.add(t)
                 elif t.exception:
                     # Abort all other simulator threads on exception,
                     # do *not* join immediately to facilitate debugging.
                     for t_other in threads:
@@ -300,7 +309,7 @@ class BlockManager(object):
                     t.syncthreads_blocked = False
                     t.syncthreads_event.set()
                 blockedthreads = set()
-            livethreads = set([ t for t in livethreads if t.is_alive() ])
+            livethreads = set([t for t in livethreads if t.is_alive()])
         # Final check for exceptions in case any were set prior to thread
         # finishing, before we could check it
         for t in threads:

numba_cuda/numba/cuda/simulator/kernelapi.py CHANGED Viewed

@@ -1,7 +1,7 @@
-'''
+"""
 Implements the cuda module as called from within an executing kernel
 (@cuda.jit-decorated function).
-'''
+"""
 from contextlib import contextmanager
 import sys
@@ -16,19 +16,20 @@ from .vector_types import vector_types
 class Dim3(object):
-    '''
+    """
     Used to implement thread/block indices/dimensions
-    '''
+    """
     def __init__(self, x, y, z):
         self.x = x
         self.y = y
         self.z = z
     def __str__(self):
-        return '(%s, %s, %s)' % (self.x, self.y, self.z)
+        return "(%s, %s, %s)" % (self.x, self.y, self.z)
     def __repr__(self):
-        return 'Dim3(%s, %s, %s)' % (self.x, self.y, self.z)
+        return "Dim3(%s, %s, %s)" % (self.x, self.y, self.z)
     def __iter__(self):
         yield self.x
@@ -37,9 +38,9 @@ class Dim3(object):
 class GridGroup:
-    '''
+    """
     Used to implement the grid group.
-    '''
+    """
     def sync(self):
         # Synchronization of the grid group is equivalent to synchronization of
@@ -49,17 +50,19 @@ class GridGroup:
 class FakeCUDACg:
-    '''
+    """
     CUDA Cooperative Groups
-    '''
+    """
     def this_grid(self):
         return GridGroup()
 class FakeCUDALocal(object):
-    '''
+    """
     CUDA Local arrays
-    '''
+    """
     def array(self, shape, dtype):
         if isinstance(dtype, types.Type):
             dtype = numpy_support.as_dtype(dtype)
@@ -67,21 +70,23 @@ class FakeCUDALocal(object):
 class FakeCUDAConst(object):
-    '''
+    """
     CUDA Const arrays
-    '''
+    """
     def array_like(self, ary):
         return ary
 class FakeCUDAShared(object):
-    '''
+    """
     CUDA Shared arrays.
     Limitations: assumes that only one call to cuda.shared.array is on a line,
     and that that line is only executed once per thread. i.e.::
-        a = cuda.shared.array(...); b = cuda.shared.array(...)
+        a = cuda.shared.array(...)
+        b = cuda.shared.array(...)
     will erroneously alias a and b, and::
@@ -90,7 +95,7 @@ class FakeCUDAShared(object):
     will alias all arrays created at that point (though it is not certain that
     this would be supported by Numba anyway).
-    '''
+    """
     def __init__(self, dynshared_size):
         self._allocations = {}
@@ -274,13 +279,13 @@ class FakeCUDAFp16(object):
         return np.exp2(x, dtype=np.float16)
     def hexp10(self, x):
-        return np.float16(10 ** x)
+        return np.float16(10**x)
     def hsqrt(self, x):
         return np.sqrt(x, dtype=np.float16)
     def hrsqrt(self, x):
-        return np.float16(x ** -0.5)
+        return np.float16(x**-0.5)
     def hceil(self, x):
         return np.ceil(x, dtype=np.float16)
@@ -323,7 +328,7 @@ class FakeCUDAFp16(object):
 class FakeCUDAModule(object):
-    '''
+    """
     An instance of this class will be injected into the __globals__ for an
     executing function in order to implement calls to cuda.*. This will fail to
     work correctly if the user code does::
@@ -331,7 +336,7 @@ class FakeCUDAModule(object):
         from numba import cuda as something_else
     In other words, the CUDA module must be called cuda.
-    '''
+    """
     def __init__(self, grid_dim, block_dim, dynshared_size):
         self.gridDim = Dim3(*grid_dim)
@@ -426,11 +431,11 @@ class FakeCUDAModule(object):
         return a ** (1 / 3)
     def brev(self, val):
-        return int('{:032b}'.format(val)[::-1], 2)
+        return int("{:032b}".format(val)[::-1], 2)
     def clz(self, val):
-        s = '{:032b}'.format(val)
-        return len(s) - len(s.lstrip('0'))
+        s = "{:032b}".format(val)
+        return len(s) - len(s.lstrip("0"))
     def ffs(self, val):
         # The algorithm is:
@@ -438,8 +443,8 @@ class FakeCUDAModule(object):
         # 2. Add 1, because the LSB is numbered 1 rather than 0, and so on.
         # 3. If we've counted 32 zeros (resulting in 33), there were no bits
         #    set so we need to return zero.
-        s = '{:032b}'.format(val)
-        r = (len(s) - len(s.rstrip('0')) + 1) % 33
+        s = "{:032b}".format(val)
+        r = (len(s) - len(s.rstrip("0")) + 1) % 33
         return r
     def selp(self, a, b, c):

numba_cuda/numba/cuda/simulator/reduction.py CHANGED Viewed

@@ -9,6 +9,7 @@ def Reduce(func):
             return None
         else:
             return r
     return reduce_wrapper

numba_cuda/numba/cuda/simulator/vector_types.py CHANGED Viewed

@@ -3,7 +3,7 @@ from numba.cuda.stubs import _vector_type_stubs
 class SimulatedVectorType:
-    attributes = ['x', 'y', 'z', 'w']
+    attributes = ["x", "y", "z", "w"]
     def __init__(self, *args):
         args_flattened = []
@@ -12,7 +12,7 @@ class SimulatedVectorType:
                 args_flattened += arg.as_list()
             else:
                 args_flattened.append(arg)
-        self._attrs = self.attributes[:len(args_flattened)]
+        self._attrs = self.attributes[: len(args_flattened)]
         if not self.num_elements == len(args_flattened):
             raise TypeError(
                 f"{self.name} expects {self.num_elements}"
@@ -35,11 +35,15 @@ class SimulatedVectorType:
 def make_simulated_vector_type(num_elements, name):
-    obj = type(name, (SimulatedVectorType,), {
-        "num_elements": num_elements,
-        "base_type": types.float32,
-        "name": name
-    })
+    obj = type(
+        name,
+        (SimulatedVectorType,),
+        {
+            "num_elements": num_elements,
+            "base_type": types.float32,
+            "name": name,
+        },
+    )
     obj.user_facing_object = obj
     return obj
@@ -48,8 +52,8 @@ def _initialize():
     _simulated_vector_types = {}
     for stub in _vector_type_stubs:
         num_elements = int(stub.__name__[-1])
-        _simulated_vector_types[stub.__name__] = (
-            make_simulated_vector_type(num_elements, stub.__name__)
+        _simulated_vector_types[stub.__name__] = make_simulated_vector_type(
+            num_elements, stub.__name__
         )
         _simulated_vector_types[stub.__name__].aliases = stub.aliases
     return _simulated_vector_types

numba_cuda/numba/cuda/simulator_init.py CHANGED Viewed

@@ -4,14 +4,12 @@ from .simulator import *  # noqa: F403, F401
 def is_available():
-    """Returns a boolean to indicate the availability of a CUDA GPU.
-    """
+    """Returns a boolean to indicate the availability of a CUDA GPU."""
     # Simulator is always available
     return True
 def cuda_error():
-    """Returns None or an exception if the CUDA driver fails to initialize.
-    """
+    """Returns None or an exception if the CUDA driver fails to initialize."""
     # Simulator never fails to initialize
     return None

numba-cuda 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl