PyPI - numba-cuda - Versions diffs - 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +463 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.0.dist-info/RECORD +0 -251
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/simulator/api.py CHANGED Viewed

@@ -1,6 +1,6 @@
-'''
+"""
 Contains CUDA API functions
-'''
+"""
 # Imports here bring together parts of the API from other modules, so some of
 # them appear unused.
@@ -15,7 +15,7 @@ from ..args import In, Out, InOut  # noqa: F401
 def select_device(dev=0):
-    assert dev == 0, 'Only a single device supported by the simulator'
+    assert dev == 0, "Only a single device supported by the simulator"
 def is_float16_supported():
@@ -23,10 +23,11 @@ def is_float16_supported():
 class stream(object):
-    '''
+    """
     The stream API is supported in the simulator - however, all execution
     occurs synchronously, so synchronization requires no operation.
-    '''
+    """
     @contextmanager
     def auto_synchronize(self):
         yield
@@ -62,9 +63,9 @@ def declare_device(*args, **kwargs):
 def detect():
-    print('Found 1 CUDA devices')
-    print('id %d    %20s %40s' % (0, 'SIMULATOR', '[SUPPORTED]'))
-    print('%40s: 5.0' % 'compute capability')
+    print("Found 1 CUDA devices")
+    print("id %d    %20s %40s" % (0, "SIMULATOR", "[SUPPORTED]"))
+    print("%40s: 5.0" % "compute capability")
 def list_devices():
@@ -73,11 +74,13 @@ def list_devices():
 # Events
 class Event(object):
-    '''
+    """
     The simulator supports the event API, but they do not record timing info,
     and all simulation is synchronous. Execution time is not recorded.
-    '''
+    """
     def record(self, stream=0):
         pass
@@ -88,35 +91,48 @@ class Event(object):
         pass
     def elapsed_time(self, event):
-        warn('Simulator timings are bogus')
+        warn("Simulator timings are bogus")
         return 0.0
 event = Event
-def jit(func_or_sig=None, device=False, debug=None, argtypes=None,
-        inline=False, restype=None, fastmath=False, link=None,
-        boundscheck=None, opt=None, cache=None
-        ):
+def jit(
+    func_or_sig=None,
+    device=False,
+    debug=None,
+    argtypes=None,
+    inline=False,
+    restype=None,
+    fastmath=False,
+    link=None,
+    boundscheck=None,
+    opt=None,
+    cache=None,
+):
     # Here for API compatibility
     if boundscheck:
         raise NotImplementedError("bounds checking is not supported for CUDA")
     if link is not None:
-        raise NotImplementedError('Cannot link PTX in the simulator')
+        raise NotImplementedError("Cannot link PTX in the simulator")
     debug = config.CUDA_DEBUGINFO_DEFAULT if debug is None else debug
     # Check for first argument specifying types - in that case the
     # decorator is not being passed a function
-    if (func_or_sig is None or is_signature(func_or_sig)
-            or isinstance(func_or_sig, list)):
+    if (
+        func_or_sig is None
+        or is_signature(func_or_sig)
+        or isinstance(func_or_sig, list)
+    ):
         def jitwrapper(fn):
-            return FakeCUDAKernel(fn,
-                                  device=device,
-                                  fastmath=fastmath,
-                                  debug=debug)
+            return FakeCUDAKernel(
+                fn, device=device, fastmath=fastmath, debug=debug
+            )
         return jitwrapper
     return FakeCUDAKernel(func_or_sig, device=device, debug=debug)

numba_cuda/numba/cuda/simulator/compiler.py CHANGED Viewed

@@ -1,7 +1,7 @@
-'''
+"""
 The compiler is not implemented in the simulator. This module provides a stub
 to allow tests to import successfully.
-'''
+"""
 compile = None
 compile_for_current_device = None

numba_cuda/numba/cuda/simulator/cudadrv/__init__.py CHANGED Viewed

@@ -1,2 +1,8 @@
-from numba.cuda.simulator.cudadrv import (devicearray, devices, driver, drvapi,
-                                          error, nvvm)
+from numba.cuda.simulator.cudadrv import (
+    devicearray,
+    devices,
+    driver,
+    drvapi,
+    error,
+    nvvm,
+)

numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py CHANGED Viewed

@@ -1,7 +1,8 @@
-'''
+"""
 The Device Array API is not implemented in the simulator. This module provides
 stubs to allow tests to import correctly.
-'''
+"""
 from contextlib import contextmanager
 from numba.np.numpy_support import numpy_version
@@ -12,37 +13,39 @@ DeviceRecord = None
 from_record_like = None
-errmsg_contiguous_buffer = ("Array contains non-contiguous buffer and cannot "
-                            "be transferred as a single memory region. Please "
-                            "ensure contiguous buffer with numpy "
-                            ".ascontiguousarray()")
+errmsg_contiguous_buffer = (
+    "Array contains non-contiguous buffer and cannot "
+    "be transferred as a single memory region. Please "
+    "ensure contiguous buffer with numpy "
+    ".ascontiguousarray()"
+)
 class FakeShape(tuple):
-    '''
+    """
     The FakeShape class is used to provide a shape which does not allow negative
     indexing, similar to the shape in CUDA Python. (Numpy shape arrays allow
     negative indexing)
-    '''
+    """
     def __getitem__(self, k):
         if isinstance(k, int) and k < 0:
-            raise IndexError('tuple index out of range')
+            raise IndexError("tuple index out of range")
         return super(FakeShape, self).__getitem__(k)
 class FakeWithinKernelCUDAArray(object):
-    '''
+    """
     Created to emulate the behavior of arrays within kernels, where either
     array.item or array['item'] is valid (that is, give all structured
     arrays `numpy.recarray`-like semantics). This behaviour does not follow
     the semantics of Python and NumPy with non-jitted code, and will be
     deprecated and removed.
-    '''
+    """
     def __init__(self, item):
         assert isinstance(item, FakeCUDAArray)
-        self.__dict__['_item'] = item
+        self.__dict__["_item"] = item
     def __wrap_if_fake(self, item):
         if isinstance(item, FakeCUDAArray):
@@ -84,18 +87,18 @@ class FakeWithinKernelCUDAArray(object):
             return obj
-        out = kwargs.get('out')
+        out = kwargs.get("out")
         if out:
-            kwargs['out'] = tuple(convert_fakes(o) for o in out)
+            kwargs["out"] = tuple(convert_fakes(o) for o in out)
         args = tuple(convert_fakes(a) for a in args)
         return call(*args, **kwargs)
 class FakeCUDAArray(object):
-    '''
+    """
     Implements the interface of a DeviceArray/DeviceRecord, but mostly just
     wraps a NumPy array.
-    '''
+    """
     __cuda_ndarray__ = True  # There must be gpu_data attribute
@@ -149,13 +152,13 @@ class FakeCUDAArray(object):
         return ary
     def copy_to_device(self, ary, stream=0):
-        '''
+        """
         Copy from the provided array into this array.
         This may be less forgiving than the CUDA Python implementation, which
         will copy data up to the length of the smallest of the two arrays,
         whereas this expects the size of the arrays to be equal.
-        '''
+        """
         sentry_contiguous(self)
         self_core, ary_core = array_core(self), array_core(ary)
         if isinstance(ary, FakeCUDAArray):
@@ -164,9 +167,10 @@ class FakeCUDAArray(object):
         else:
             ary_core = np.array(
                 ary_core,
-                order='C' if self_core.flags['C_CONTIGUOUS'] else 'F',
+                order="C" if self_core.flags["C_CONTIGUOUS"] else "F",
                 subok=True,
-                copy=False if numpy_version < (2, 0) else None)
+                copy=False if numpy_version < (2, 0) else None,
+            )
             check_array_compatibility(self_core, ary_core)
         np.copyto(self_core._ary, ary_core)
@@ -237,7 +241,7 @@ class FakeCUDAArray(object):
         return FakeCUDAArray(self._ary % other)
     def __pow__(self, other):
-        return FakeCUDAArray(self._ary ** other)
+        return FakeCUDAArray(self._ary**other)
     def split(self, section, stream=0):
         return [
@@ -282,30 +286,33 @@ def is_contiguous(ary):
 def sentry_contiguous(ary):
     core = array_core(ary)
-    if not core.flags['C_CONTIGUOUS'] and not core.flags['F_CONTIGUOUS']:
+    if not core.flags["C_CONTIGUOUS"] and not core.flags["F_CONTIGUOUS"]:
         raise ValueError(errmsg_contiguous_buffer)
 def check_array_compatibility(ary1, ary2):
     ary1sq, ary2sq = ary1.squeeze(), ary2.squeeze()
     if ary1.dtype != ary2.dtype:
-        raise TypeError('incompatible dtype: %s vs. %s' %
-                        (ary1.dtype, ary2.dtype))
+        raise TypeError(
+            "incompatible dtype: %s vs. %s" % (ary1.dtype, ary2.dtype)
+        )
     if ary1sq.shape != ary2sq.shape:
-        raise ValueError('incompatible shape: %s vs. %s' %
-                         (ary1.shape, ary2.shape))
+        raise ValueError(
+            "incompatible shape: %s vs. %s" % (ary1.shape, ary2.shape)
+        )
     if ary1sq.strides != ary2sq.strides:
-        raise ValueError('incompatible strides: %s vs. %s' %
-                         (ary1.strides, ary2.strides))
+        raise ValueError(
+            "incompatible strides: %s vs. %s" % (ary1.strides, ary2.strides)
+        )
 def to_device(ary, stream=0, copy=True, to=None):
-    ary = np.array(ary,
-                   copy=False if numpy_version < (2, 0) else None,
-                   subok=True)
+    ary = np.array(
+        ary, copy=False if numpy_version < (2, 0) else None, subok=True
+    )
     sentry_contiguous(ary)
     if to is None:
-        buffer_dtype = np.int64 if ary.dtype.char in 'Mm' else ary.dtype
+        buffer_dtype = np.int64 if ary.dtype.char in "Mm" else ary.dtype
         return FakeCUDAArray(
             np.ndarray(
                 buffer=np.copy(array_core(ary)).view(buffer_dtype),
@@ -324,22 +331,22 @@ def pinned(arg):
 def mapped_array(*args, **kwargs):
-    for unused_arg in ('portable', 'wc'):
+    for unused_arg in ("portable", "wc"):
         if unused_arg in kwargs:
             kwargs.pop(unused_arg)
     return device_array(*args, **kwargs)
-def pinned_array(shape, dtype=np.float64, strides=None, order='C'):
+def pinned_array(shape, dtype=np.float64, strides=None, order="C"):
     return np.ndarray(shape=shape, strides=strides, dtype=dtype, order=order)
-def managed_array(shape, dtype=np.float64, strides=None, order='C'):
+def managed_array(shape, dtype=np.float64, strides=None, order="C"):
     return np.ndarray(shape=shape, strides=strides, dtype=dtype, order=order)
 def device_array(*args, **kwargs):
-    stream = kwargs.pop('stream') if 'stream' in kwargs else 0
+    stream = kwargs.pop("stream") if "stream" in kwargs else 0
     return FakeCUDAArray(np.ndarray(*args, **kwargs), stream=stream)
@@ -350,7 +357,7 @@ def _contiguous_strides_like_array(ary):
     """
     # Don't recompute strides if the default strides will be sufficient to
     # create a contiguous array.
-    if ary.flags['C_CONTIGUOUS'] or ary.flags['F_CONTIGUOUS'] or ary.ndim <= 1:
+    if ary.flags["C_CONTIGUOUS"] or ary.flags["F_CONTIGUOUS"] or ary.ndim <= 1:
         return None
     # Otherwise, we need to compute new strides using an algorithm adapted from
@@ -360,7 +367,7 @@ def _contiguous_strides_like_array(ary):
     # Stride permutation. E.g. a stride array (4, -2, 12) becomes
     # [(1, -2), (0, 4), (2, 12)]
-    strideperm = [ x for x in enumerate(ary.strides) ]
+    strideperm = [x for x in enumerate(ary.strides)]
     strideperm.sort(key=lambda x: x[1])
     # Compute new strides using permutation
@@ -373,24 +380,26 @@ def _contiguous_strides_like_array(ary):
 def _order_like_array(ary):
-    if ary.flags['F_CONTIGUOUS'] and not ary.flags['C_CONTIGUOUS']:
-        return 'F'
+    if ary.flags["F_CONTIGUOUS"] and not ary.flags["C_CONTIGUOUS"]:
+        return "F"
     else:
-        return 'C'
+        return "C"
 def device_array_like(ary, stream=0):
     strides = _contiguous_strides_like_array(ary)
     order = _order_like_array(ary)
-    return device_array(shape=ary.shape, dtype=ary.dtype, strides=strides,
-                        order=order)
+    return device_array(
+        shape=ary.shape, dtype=ary.dtype, strides=strides, order=order
+    )
 def pinned_array_like(ary):
     strides = _contiguous_strides_like_array(ary)
     order = _order_like_array(ary)
-    return pinned_array(shape=ary.shape, dtype=ary.dtype, strides=strides,
-                        order=order)
+    return pinned_array(
+        shape=ary.shape, dtype=ary.dtype, strides=strides, order=order
+    )
 def auto_device(ary, stream=0, copy=True):
@@ -399,15 +408,14 @@ def auto_device(ary, stream=0, copy=True):
     if not isinstance(ary, np.void):
         ary = np.array(
-            ary,
-            copy=False if numpy_version < (2, 0) else None,
-            subok=True)
+            ary, copy=False if numpy_version < (2, 0) else None, subok=True
+        )
     return to_device(ary, stream, copy), True
 def is_cuda_ndarray(obj):
     "Check if an object is a CUDA ndarray"
-    return getattr(obj, '__cuda_ndarray__', False)
+    return getattr(obj, "__cuda_ndarray__", False)
 def verify_cuda_ndarray_interface(obj):
@@ -418,15 +426,15 @@ def verify_cuda_ndarray_interface(obj):
         if not hasattr(obj, attr):
             raise AttributeError(attr)
         if not isinstance(getattr(obj, attr), typ):
-            raise AttributeError('%s must be of type %s' % (attr, typ))
+            raise AttributeError("%s must be of type %s" % (attr, typ))
-    requires_attr('shape', tuple)
-    requires_attr('strides', tuple)
-    requires_attr('dtype', np.dtype)
-    requires_attr('size', int)
+    requires_attr("shape", tuple)
+    requires_attr("strides", tuple)
+    requires_attr("dtype", np.dtype)
+    requires_attr("size", int)
 def require_cuda_ndarray(obj):
     "Raises ValueError is is_cuda_ndarray(obj) evaluates False"
     if not is_cuda_ndarray(obj):
-        raise ValueError('require an cuda ndarray object')
+        raise ValueError("require an cuda ndarray object")

numba_cuda/numba/cuda/simulator/cudadrv/devices.py CHANGED Viewed

@@ -8,7 +8,7 @@ _SIMULATOR_CC = (5, 2)
 class FakeCUDADevice:
     def __init__(self):
-        self.uuid = 'GPU-00000000-0000-0000-0000-000000000000'
+        self.uuid = "GPU-00000000-0000-0000-0000-000000000000"
     @property
     def compute_capability(self):
@@ -16,10 +16,11 @@ class FakeCUDADevice:
 class FakeCUDAContext:
-    '''
+    """
     This stub implements functionality only for simulating a single GPU
     at the moment.
-    '''
+    """
     def __init__(self, device_id):
         self._device_id = device_id
         self._device = FakeCUDADevice()
@@ -54,7 +55,7 @@ class FakeCUDAContext:
         dependencies, e.g. `psutil` - so return infinite memory to maintain API
         type compatibility
         """
-        return _MemoryInfo(float('inf'), float('inf'))
+        return _MemoryInfo(float("inf"), float("inf"))
     def memalloc(self, sz):
         """
@@ -62,19 +63,20 @@ class FakeCUDAContext:
         At present, there is no division between simulated
         host memory and simulated device memory.
         """
-        return np.ndarray(sz, dtype='u1')
+        return np.ndarray(sz, dtype="u1")
     def memhostalloc(self, sz, mapped=False, portable=False, wc=False):
-        '''Allocates memory on the host'''
+        """Allocates memory on the host"""
         return self.memalloc(sz)
 class FakeDeviceList:
-    '''
+    """
     This stub implements a device list containing a single GPU. It also
     keeps track of the GPU status, i.e. whether the context is closed or not,
     which may have been set by the user calling reset()
-    '''
+    """
     def __init__(self):
         self.lst = (FakeCUDAContext(0),)
         self.closed = False
@@ -84,7 +86,7 @@ class FakeDeviceList:
         return self.lst[devnum]
     def __str__(self):
-        return ', '.join([str(d) for d in self.lst])
+        return ", ".join([str(d) for d in self.lst])
     def __iter__(self):
         return iter(self.lst)
@@ -111,7 +113,7 @@ def get_context(devnum=0):
 def require_context(func):
-    '''
+    """
     In the simulator, a context is always "available", so this is a no-op.
-    '''
+    """
     return func

numba_cuda/numba/cuda/simulator/cudadrv/driver.py CHANGED Viewed

@@ -1,15 +1,15 @@
-'''
+"""
 Most of the driver API is unsupported in the simulator, but some stubs are
 provided to allow tests to import correctly.
-'''
+"""
 def device_memset(dst, val, size, stream=0):
-    dst.view('u1')[:size].fill(bytes([val])[0])
+    dst.view("u1")[:size].fill(bytes([val])[0])
 def host_to_device(dst, src, size, stream=0):
-    dst.view('u1')[:size] = src.view('u1')[:size]
+    dst.view("u1")[:size] = src.view("u1")[:size]
 def device_to_host(dst, src, size, stream=0):
@@ -55,7 +55,7 @@ class CudaAPIError(RuntimeError):
 def launch_kernel(*args, **kwargs):
-    msg = 'Launching kernels directly is not supported in the simulator'
+    msg = "Launching kernels directly is not supported in the simulator"
     raise RuntimeError(msg)

numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py CHANGED Viewed

@@ -1,4 +1,4 @@
-'''
+"""
 drvapi is not implemented in the simulator, but this module exists to allow
 tests to import correctly.
-'''
+"""

numba_cuda/numba/cuda/simulator/cudadrv/libs.py CHANGED Viewed

@@ -1,2 +1,2 @@
 def check_static_lib(lib):
-    raise FileNotFoundError('Linking libraries not supported by cudasim')
+    raise FileNotFoundError("Linking libraries not supported by cudasim")

numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py CHANGED Viewed

@@ -1,7 +1,7 @@
-'''
+"""
 NVVM is not supported in the simulator, but stubs are provided to allow tests
 to import correctly.
-'''
+"""
 class NvvmSupportError(ImportError):
@@ -10,7 +10,7 @@ class NvvmSupportError(ImportError):
 class NVVM(object):
     def __init__(self):
-        raise NvvmSupportError('NVVM not supported in the simulator')
+        raise NvvmSupportError("NVVM not supported in the simulator")
 CompilationUnit = None

numba_cuda/numba/cuda/simulator/cudadrv/runtime.py CHANGED Viewed

@@ -1,7 +1,7 @@
-'''
+"""
 The runtime API is unsupported in the simulator, but some stubs are
 provided to allow tests to import correctly.
-'''
+"""
 class FakeRuntime(object):
@@ -13,7 +13,7 @@ class FakeRuntime(object):
     @property
     def supported_versions(self):
-        return (-1, -1),
+        return ((-1, -1),)
 runtime = FakeRuntime()

numba-cuda 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl