PyPI - numba-cuda - Versions diffs - 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl - Mend

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

_numba_cuda_redirector.py +17 -13
numba_cuda/VERSION +1 -1
numba_cuda/_version.py +4 -1
numba_cuda/numba/cuda/__init__.py +6 -2
numba_cuda/numba/cuda/api.py +129 -86
numba_cuda/numba/cuda/api_util.py +3 -3
numba_cuda/numba/cuda/args.py +12 -16
numba_cuda/numba/cuda/cg.py +6 -6
numba_cuda/numba/cuda/codegen.py +74 -43
numba_cuda/numba/cuda/compiler.py +232 -113
numba_cuda/numba/cuda/cpp_function_wrappers.cu +1 -2
numba_cuda/numba/cuda/cuda_fp16.h +661 -661
numba_cuda/numba/cuda/cuda_fp16.hpp +3 -3
numba_cuda/numba/cuda/cuda_paths.py +291 -99
numba_cuda/numba/cuda/cudadecl.py +125 -69
numba_cuda/numba/cuda/cudadrv/__init__.py +3 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +185 -135
numba_cuda/numba/cuda/cudadrv/devices.py +16 -11
numba_cuda/numba/cuda/cudadrv/driver.py +463 -297
numba_cuda/numba/cuda/cudadrv/drvapi.py +241 -207
numba_cuda/numba/cuda/cudadrv/dummyarray.py +66 -54
numba_cuda/numba/cuda/cudadrv/enums.py +1 -1
numba_cuda/numba/cuda/cudadrv/error.py +6 -2
numba_cuda/numba/cuda/cudadrv/libs.py +67 -63
numba_cuda/numba/cuda/cudadrv/linkable_code.py +16 -1
numba_cuda/numba/cuda/cudadrv/mappings.py +16 -14
numba_cuda/numba/cuda/cudadrv/nvrtc.py +138 -29
numba_cuda/numba/cuda/cudadrv/nvvm.py +296 -161
numba_cuda/numba/cuda/cudadrv/rtapi.py +1 -1
numba_cuda/numba/cuda/cudadrv/runtime.py +20 -8
numba_cuda/numba/cuda/cudaimpl.py +317 -233
numba_cuda/numba/cuda/cudamath.py +1 -1
numba_cuda/numba/cuda/debuginfo.py +8 -6
numba_cuda/numba/cuda/decorators.py +75 -45
numba_cuda/numba/cuda/descriptor.py +1 -1
numba_cuda/numba/cuda/device_init.py +69 -18
numba_cuda/numba/cuda/deviceufunc.py +143 -98
numba_cuda/numba/cuda/dispatcher.py +300 -213
numba_cuda/numba/cuda/errors.py +13 -10
numba_cuda/numba/cuda/extending.py +1 -1
numba_cuda/numba/cuda/initialize.py +5 -3
numba_cuda/numba/cuda/intrinsic_wrapper.py +3 -3
numba_cuda/numba/cuda/intrinsics.py +31 -27
numba_cuda/numba/cuda/kernels/reduction.py +13 -13
numba_cuda/numba/cuda/kernels/transpose.py +3 -6
numba_cuda/numba/cuda/libdevice.py +317 -317
numba_cuda/numba/cuda/libdeviceimpl.py +3 -2
numba_cuda/numba/cuda/locks.py +16 -0
numba_cuda/numba/cuda/mathimpl.py +62 -57
numba_cuda/numba/cuda/models.py +1 -5
numba_cuda/numba/cuda/nvvmutils.py +103 -88
numba_cuda/numba/cuda/printimpl.py +9 -5
numba_cuda/numba/cuda/random.py +46 -36
numba_cuda/numba/cuda/reshape_funcs.cu +1 -1
numba_cuda/numba/cuda/runtime/__init__.py +1 -1
numba_cuda/numba/cuda/runtime/memsys.cu +1 -1
numba_cuda/numba/cuda/runtime/memsys.cuh +1 -1
numba_cuda/numba/cuda/runtime/nrt.cu +3 -3
numba_cuda/numba/cuda/runtime/nrt.py +48 -43
numba_cuda/numba/cuda/simulator/__init__.py +22 -12
numba_cuda/numba/cuda/simulator/api.py +38 -22
numba_cuda/numba/cuda/simulator/compiler.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/__init__.py +8 -2
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +63 -55
numba_cuda/numba/cuda/simulator/cudadrv/devices.py +13 -11
numba_cuda/numba/cuda/simulator/cudadrv/driver.py +5 -5
numba_cuda/numba/cuda/simulator/cudadrv/drvapi.py +2 -2
numba_cuda/numba/cuda/simulator/cudadrv/libs.py +1 -1
numba_cuda/numba/cuda/simulator/cudadrv/nvvm.py +3 -3
numba_cuda/numba/cuda/simulator/cudadrv/runtime.py +3 -3
numba_cuda/numba/cuda/simulator/kernel.py +43 -34
numba_cuda/numba/cuda/simulator/kernelapi.py +31 -26
numba_cuda/numba/cuda/simulator/reduction.py +1 -0
numba_cuda/numba/cuda/simulator/vector_types.py +13 -9
numba_cuda/numba/cuda/simulator_init.py +2 -4
numba_cuda/numba/cuda/stubs.py +139 -102
numba_cuda/numba/cuda/target.py +64 -47
numba_cuda/numba/cuda/testing.py +24 -19
numba_cuda/numba/cuda/tests/__init__.py +14 -12
numba_cuda/numba/cuda/tests/cudadrv/test_array_attr.py +16 -17
numba_cuda/numba/cuda/tests/cudadrv/test_context_stack.py +7 -7
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_array_slicing.py +73 -54
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_auto_context.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +48 -50
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_driver.py +47 -29
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +3 -3
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_memory.py +19 -19
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_ndarray.py +108 -103
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +20 -11
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +20 -17
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +8 -6
numba_cuda/numba/cuda/tests/cudadrv/test_events.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_host_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_init.py +13 -13
numba_cuda/numba/cuda/tests/cudadrv/test_inline_ptx.py +12 -9
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +36 -31
numba_cuda/numba/cuda/tests/cudadrv/test_managed_alloc.py +8 -7
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +294 -0
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +10 -7
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +24 -15
numba_cuda/numba/cuda/tests/cudadrv/test_nvvm_driver.py +43 -41
numba_cuda/numba/cuda/tests/cudadrv/test_pinned.py +4 -5
numba_cuda/numba/cuda/tests/cudadrv/test_profiler.py +2 -2
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +28 -17
numba_cuda/numba/cuda/tests/cudadrv/test_reset_device.py +1 -2
numba_cuda/numba/cuda/tests/cudadrv/test_runtime.py +22 -14
numba_cuda/numba/cuda/tests/cudadrv/test_select_device.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_streams.py +4 -3
numba_cuda/numba/cuda/tests/cudapy/cache_usecases.py +10 -4
numba_cuda/numba/cuda/tests/cudapy/cache_with_cpu_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +7 -6
numba_cuda/numba/cuda/tests/cudapy/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/cudapy/recursion_usecases.py +1 -0
numba_cuda/numba/cuda/tests/cudapy/test_alignment.py +6 -5
numba_cuda/numba/cuda/tests/cudapy/test_array.py +52 -42
numba_cuda/numba/cuda/tests/cudapy/test_array_args.py +5 -6
numba_cuda/numba/cuda/tests/cudapy/test_array_methods.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +501 -304
numba_cuda/numba/cuda/tests/cudapy/test_blackscholes.py +57 -21
numba_cuda/numba/cuda/tests/cudapy/test_boolean.py +3 -3
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +50 -37
numba_cuda/numba/cuda/tests/cudapy/test_casting.py +29 -24
numba_cuda/numba/cuda/tests/cudapy/test_cffi.py +11 -6
numba_cuda/numba/cuda/tests/cudapy/test_compiler.py +84 -50
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +144 -73
numba_cuda/numba/cuda/tests/cudapy/test_complex_kernel.py +2 -2
numba_cuda/numba/cuda/tests/cudapy/test_const_string.py +37 -27
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +43 -45
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +21 -14
numba_cuda/numba/cuda/tests/cudapy/test_cuda_array_interface.py +60 -55
numba_cuda/numba/cuda/tests/cudapy/test_cuda_jit_no_types.py +3 -2
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +26 -22
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +29 -27
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +31 -28
numba_cuda/numba/cuda/tests/cudapy/test_device_func.py +52 -45
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +55 -43
numba_cuda/numba/cuda/tests/cudapy/test_enums.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +30 -15
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +11 -12
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +19 -12
numba_cuda/numba/cuda/tests/cudapy/test_fastmath.py +77 -66
numba_cuda/numba/cuda/tests/cudapy/test_forall.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_freevar.py +5 -3
numba_cuda/numba/cuda/tests/cudapy/test_frexp_ldexp.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_globals.py +3 -5
numba_cuda/numba/cuda/tests/cudapy/test_gufunc.py +144 -126
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scalar.py +23 -18
numba_cuda/numba/cuda/tests/cudapy/test_gufunc_scheduling.py +16 -22
numba_cuda/numba/cuda/tests/cudapy/test_idiv.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_inspect.py +29 -20
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +147 -99
numba_cuda/numba/cuda/tests/cudapy/test_ipc.py +50 -36
numba_cuda/numba/cuda/tests/cudapy/test_iterators.py +1 -2
numba_cuda/numba/cuda/tests/cudapy/test_lang.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +6 -6
numba_cuda/numba/cuda/tests/cudapy/test_libdevice.py +24 -20
numba_cuda/numba/cuda/tests/cudapy/test_lineinfo.py +36 -31
numba_cuda/numba/cuda/tests/cudapy/test_localmem.py +13 -13
numba_cuda/numba/cuda/tests/cudapy/test_mandel.py +13 -6
numba_cuda/numba/cuda/tests/cudapy/test_math.py +83 -66
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_minmax.py +19 -58
numba_cuda/numba/cuda/tests/cudapy/test_montecarlo.py +4 -4
numba_cuda/numba/cuda/tests/cudapy/test_multigpu.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_multiprocessing.py +9 -8
numba_cuda/numba/cuda/tests/cudapy/test_multithreads.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_nondet.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +180 -96
numba_cuda/numba/cuda/tests/cudapy/test_optimization.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_overload.py +37 -18
numba_cuda/numba/cuda/tests/cudapy/test_powi.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_print.py +9 -7
numba_cuda/numba/cuda/tests/cudapy/test_py2_div_issue.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_random.py +15 -10
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +88 -87
numba_cuda/numba/cuda/tests/cudapy/test_recursion.py +12 -10
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +26 -11
numba_cuda/numba/cuda/tests/cudapy/test_retrieve_autoconverted_arrays.py +7 -10
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +4 -6
numba_cuda/numba/cuda/tests/cudapy/test_slicing.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +10 -9
numba_cuda/numba/cuda/tests/cudapy/test_sm_creation.py +62 -43
numba_cuda/numba/cuda/tests/cudapy/test_stream_api.py +7 -3
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +7 -5
numba_cuda/numba/cuda/tests/cudapy/test_transpose.py +18 -11
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +111 -88
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +305 -130
numba_cuda/numba/cuda/tests/cudapy/test_vectorize.py +33 -36
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_complex.py +5 -5
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +16 -12
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_device.py +7 -7
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_scalar_arg.py +6 -7
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +31 -29
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +31 -25
numba_cuda/numba/cuda/tests/cudasim/test_cudasim_issues.py +19 -13
numba_cuda/numba/cuda/tests/data/jitlink.cu +1 -1
numba_cuda/numba/cuda/tests/data/jitlink.ptx +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +15 -8
numba_cuda/numba/cuda/tests/doc_examples/test_cpu_gpu_compat.py +4 -7
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +14 -9
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +22 -18
numba_cuda/numba/cuda/tests/doc_examples/test_matmul.py +7 -4
numba_cuda/numba/cuda/tests/doc_examples/test_montecarlo.py +2 -0
numba_cuda/numba/cuda/tests/doc_examples/test_random.py +8 -4
numba_cuda/numba/cuda/tests/doc_examples/test_reduction.py +2 -1
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +94 -19
numba_cuda/numba/cuda/tests/doc_examples/test_vecadd.py +2 -2
numba_cuda/numba/cuda/tests/nocuda/test_dummyarray.py +91 -62
numba_cuda/numba/cuda/tests/nocuda/test_function_resolution.py +14 -5
numba_cuda/numba/cuda/tests/nocuda/test_import.py +25 -25
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +40 -40
numba_cuda/numba/cuda/tests/nocuda/test_nvvm.py +12 -10
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +16 -20
numba_cuda/numba/cuda/tests/nrt/test_nrt_refct.py +12 -10
numba_cuda/numba/cuda/tests/test_binary_generation/generate_raw_ltoir.py +2 -2
numba_cuda/numba/cuda/types.py +5 -2
numba_cuda/numba/cuda/ufuncs.py +382 -362
numba_cuda/numba/cuda/utils.py +2 -2
numba_cuda/numba/cuda/vector_types.py +2 -2
numba_cuda/numba/cuda/vectorizers.py +37 -32
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/METADATA +1 -1
numba_cuda-0.9.0.dist-info/RECORD +253 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/WHEEL +1 -1
numba_cuda-0.8.0.dist-info/RECORD +0 -251
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.8.0.dist-info → numba_cuda-0.9.0.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/libdeviceimpl.py CHANGED Viewed

@@ -49,8 +49,9 @@ def libdevice_implement_multiple_returns(func, retty, prototype_args):
         for arg in prototype_args:
             if arg.is_ptr:
                 # Allocate space for return value and add to args
-                tmp_arg = cgutils.alloca_once(builder,
-                                              context.get_value_type(arg.ty))
+                tmp_arg = cgutils.alloca_once(
+                    builder, context.get_value_type(arg.ty)
+                )
                 actual_args.append(tmp_arg)
                 virtual_args.append(tmp_arg)
             else:

numba_cuda/numba/cuda/locks.py ADDED Viewed

@@ -0,0 +1,16 @@
+from threading import Lock
+from functools import wraps
+# Thread safety guard for module initialization.
+_module_init_lock = Lock()
+def module_init_lock(func):
+    """Decorator to make sure initialization is invoked once for all threads."""
+    @wraps(func)
+    def wrapper(*args, **kwargs):
+        with _module_init_lock:
+            return func(*args, **kwargs)
+    return wrapper

numba_cuda/numba/cuda/mathimpl.py CHANGED Viewed

@@ -12,57 +12,57 @@ lower = registry.lower
 booleans = []
-booleans += [('isnand', 'isnanf', math.isnan)]
-booleans += [('isinfd', 'isinff', math.isinf)]
-booleans += [('isfinited', 'finitef', math.isfinite)]
+booleans += [("isnand", "isnanf", math.isnan)]
+booleans += [("isinfd", "isinff", math.isinf)]
+booleans += [("isfinited", "finitef", math.isfinite)]
 unarys = []
-unarys += [('ceil', 'ceilf', math.ceil)]
-unarys += [('floor', 'floorf', math.floor)]
-unarys += [('fabs', 'fabsf', math.fabs)]
-unarys += [('exp', 'expf', math.exp)]
-unarys += [('expm1', 'expm1f', math.expm1)]
-unarys += [('erf', 'erff', math.erf)]
-unarys += [('erfc', 'erfcf', math.erfc)]
-unarys += [('tgamma', 'tgammaf', math.gamma)]
-unarys += [('lgamma', 'lgammaf', math.lgamma)]
-unarys += [('sqrt', 'sqrtf', math.sqrt)]
-unarys += [('log', 'logf', math.log)]
-unarys += [('log2', 'log2f', math.log2)]
-unarys += [('log10', 'log10f', math.log10)]
-unarys += [('log1p', 'log1pf', math.log1p)]
-unarys += [('acosh', 'acoshf', math.acosh)]
-unarys += [('acos', 'acosf', math.acos)]
-unarys += [('cos', 'cosf', math.cos)]
-unarys += [('cosh', 'coshf', math.cosh)]
-unarys += [('asinh', 'asinhf', math.asinh)]
-unarys += [('asin', 'asinf', math.asin)]
-unarys += [('sin', 'sinf', math.sin)]
-unarys += [('sinh', 'sinhf', math.sinh)]
-unarys += [('atan', 'atanf', math.atan)]
-unarys += [('atanh', 'atanhf', math.atanh)]
-unarys += [('tan', 'tanf', math.tan)]
-unarys += [('trunc', 'truncf', math.trunc)]
+unarys += [("ceil", "ceilf", math.ceil)]
+unarys += [("floor", "floorf", math.floor)]
+unarys += [("fabs", "fabsf", math.fabs)]
+unarys += [("exp", "expf", math.exp)]
+unarys += [("expm1", "expm1f", math.expm1)]
+unarys += [("erf", "erff", math.erf)]
+unarys += [("erfc", "erfcf", math.erfc)]
+unarys += [("tgamma", "tgammaf", math.gamma)]
+unarys += [("lgamma", "lgammaf", math.lgamma)]
+unarys += [("sqrt", "sqrtf", math.sqrt)]
+unarys += [("log", "logf", math.log)]
+unarys += [("log2", "log2f", math.log2)]
+unarys += [("log10", "log10f", math.log10)]
+unarys += [("log1p", "log1pf", math.log1p)]
+unarys += [("acosh", "acoshf", math.acosh)]
+unarys += [("acos", "acosf", math.acos)]
+unarys += [("cos", "cosf", math.cos)]
+unarys += [("cosh", "coshf", math.cosh)]
+unarys += [("asinh", "asinhf", math.asinh)]
+unarys += [("asin", "asinf", math.asin)]
+unarys += [("sin", "sinf", math.sin)]
+unarys += [("sinh", "sinhf", math.sinh)]
+unarys += [("atan", "atanf", math.atan)]
+unarys += [("atanh", "atanhf", math.atanh)]
+unarys += [("tan", "tanf", math.tan)]
+unarys += [("trunc", "truncf", math.trunc)]
 unarys_fastmath = {}
-unarys_fastmath['cosf'] = 'fast_cosf'
-unarys_fastmath['sinf'] = 'fast_sinf'
-unarys_fastmath['tanf'] = 'fast_tanf'
-unarys_fastmath['expf'] = 'fast_expf'
-unarys_fastmath['log2f'] = 'fast_log2f'
-unarys_fastmath['log10f'] = 'fast_log10f'
-unarys_fastmath['logf'] = 'fast_logf'
+unarys_fastmath["cosf"] = "fast_cosf"
+unarys_fastmath["sinf"] = "fast_sinf"
+unarys_fastmath["tanf"] = "fast_tanf"
+unarys_fastmath["expf"] = "fast_expf"
+unarys_fastmath["log2f"] = "fast_log2f"
+unarys_fastmath["log10f"] = "fast_log10f"
+unarys_fastmath["logf"] = "fast_logf"
 binarys = []
-binarys += [('copysign', 'copysignf', math.copysign)]
-binarys += [('atan2', 'atan2f', math.atan2)]
-binarys += [('pow', 'powf', math.pow)]
-binarys += [('fmod', 'fmodf', math.fmod)]
-binarys += [('hypot', 'hypotf', math.hypot)]
-binarys += [('remainder', 'remainderf', math.remainder)]
+binarys += [("copysign", "copysignf", math.copysign)]
+binarys += [("atan2", "atan2f", math.atan2)]
+binarys += [("pow", "powf", math.pow)]
+binarys += [("fmod", "fmodf", math.fmod)]
+binarys += [("hypot", "hypotf", math.hypot)]
+binarys += [("remainder", "remainderf", math.remainder)]
 binarys_fastmath = {}
-binarys_fastmath['powf'] = 'fast_powf'
+binarys_fastmath["powf"] = "fast_powf"
 @lower(math.isinf, types.Integer)
@@ -179,8 +179,9 @@ def fp16_trunc_impl(context, builder, sig, args):
 def impl_boolean(key, ty, libfunc):
     def lower_boolean_impl(context, builder, sig, args):
-        libfunc_impl = context.get_function(libfunc,
-                                            typing.signature(types.int32, ty))
+        libfunc_impl = context.get_function(
+            libfunc, typing.signature(types.int32, ty)
+        )
         result = libfunc_impl(builder, args)
         return context.cast(builder, result, types.int32, types.boolean)
@@ -197,9 +198,11 @@ def get_lower_unary_impl(key, ty, libfunc):
         if fast_replacement is not None:
             actual_libfunc = getattr(libdevice, fast_replacement)
-        libfunc_impl = context.get_function(actual_libfunc,
-                                            typing.signature(ty, ty))
+        libfunc_impl = context.get_function(
+            actual_libfunc, typing.signature(ty, ty)
+        )
         return libfunc_impl(builder, args)
     return lower_unary_impl
@@ -208,7 +211,7 @@ def get_unary_impl_for_fn_and_ty(fn, ty):
     # unary implementations, it does not appear in the unarys list. However,
     # its implementation can be looked up by key like the other
     # implementations, so we add it to the list we search here.
-    tanh_impls = ('tanh', 'tanhf', math.tanh)
+    tanh_impls = ("tanh", "tanhf", math.tanh)
     for fname64, fname32, key in unarys + [tanh_impls]:
         if fn == key:
             if ty == float32:
@@ -233,7 +236,7 @@ def impl_unary_int(key, ty, libfunc):
         elif sig.args[0] == uint64:
             convert = builder.uitofp
         else:
-            m = 'Only 64-bit integers are supported for generic unary int ops'
+            m = "Only 64-bit integers are supported for generic unary int ops"
             raise TypeError(m)
         arg = convert(args[0], ir.DoubleType())
@@ -254,9 +257,11 @@ def get_lower_binary_impl(key, ty, libfunc):
         if fast_replacement is not None:
             actual_libfunc = getattr(libdevice, fast_replacement)
-        libfunc_impl = context.get_function(actual_libfunc,
-                                            typing.signature(ty, ty, ty))
+        libfunc_impl = context.get_function(
+            actual_libfunc, typing.signature(ty, ty, ty)
+        )
         return libfunc_impl(builder, args)
     return lower_binary_impl
@@ -285,7 +290,7 @@ def impl_binary_int(key, ty, libfunc):
         elif sig.args[0] == uint64:
             convert = builder.uitofp
         else:
-            m = 'Only 64-bit integers are supported for generic binary int ops'
+            m = "Only 64-bit integers are supported for generic binary int ops"
             raise TypeError(m)
         args = [convert(arg, ir.DoubleType()) for arg in args]
@@ -390,12 +395,12 @@ def impl_tanh(ty, libfunc):
         def tanhf_impl_fastmath():
             fnty = ir.FunctionType(ir.FloatType(), [ir.FloatType()])
-            asm = ir.InlineAsm(fnty, 'tanh.approx.f32 $0, $1;', '=f,f')
+            asm = ir.InlineAsm(fnty, "tanh.approx.f32 $0, $1;", "=f,f")
             return builder.call(asm, args)
         if ty == float32 and context.fastmath:
             cc = get_compute_capability()
-            if cc >= (7,5):
+            if cc >= (7, 5):
                 return tanhf_impl_fastmath()
         return tanh_impl_libdevice()
@@ -420,7 +425,6 @@ impl_unary_int(math.tanh, uint64, libdevice.tanh)
 def cpow_implement(fty, cty):
     def core(context, builder, sig, args):
         def cpow_internal(a, b):
             if b.real == fty(0.0) and b.imag == fty(0.0):
                 return cty(1.0) + cty(0.0j)
             elif a.real == fty(0.0) and b.real == fty(0.0):
@@ -434,8 +438,9 @@ def cpow_implement(fty, cty):
                 len /= math.exp(at * b.imag)
                 phase += b.imag * math.log(vabs)
-            return len * (cty(math.cos(phase)) +
-                          cty(math.sin(phase) * cty(1.0j)))
+            return len * (
+                cty(math.cos(phase)) + cty(math.sin(phase) * cty(1.0j))
+            )
         return context.compile_internal(builder, cpow_internal, sig, args)

numba_cuda/numba/cuda/models.py CHANGED Viewed

@@ -16,11 +16,7 @@ register_model = functools.partial(register, cuda_data_manager)
 @register_model(Dim3)
 class Dim3Model(models.StructModel):
     def __init__(self, dmm, fe_type):
-        members = [
-            ('x', types.int32),
-            ('y', types.int32),
-            ('z', types.int32)
-        ]
+        members = [("x", types.int32), ("y", types.int32), ("z", types.int32)]
         super().__init__(dmm, fe_type, members)

numba_cuda/numba/cuda/nvvmutils.py CHANGED Viewed

@@ -5,159 +5,178 @@ from .cudadrv import nvvm
 def declare_atomic_cas_int(lmod, isize):
-    fname = '___numba_atomic_i' + str(isize) + '_cas_hack'
-    fnty = ir.FunctionType(ir.IntType(isize),
-                           (ir.PointerType(ir.IntType(isize)),
-                            ir.IntType(isize),
-                            ir.IntType(isize)))
+    fname = "___numba_atomic_i" + str(isize) + "_cas_hack"
+    fnty = ir.FunctionType(
+        ir.IntType(isize),
+        (
+            ir.PointerType(ir.IntType(isize)),
+            ir.IntType(isize),
+            ir.IntType(isize),
+        ),
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def atomic_cmpxchg(builder, lmod, isize, ptr, cmp, val):
-    out = builder.cmpxchg(ptr, cmp, val, 'monotonic', 'monotonic')
+    out = builder.cmpxchg(ptr, cmp, val, "monotonic", "monotonic")
     return builder.extract_value(out, 0)
 def declare_atomic_add_float32(lmod):
-    fname = 'llvm.nvvm.atomic.load.add.f32.p0f32'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType(), 0), ir.FloatType()))
+    fname = "llvm.nvvm.atomic.load.add.f32.p0f32"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType(), 0), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_add_float64(lmod):
     flags = targetconfig.ConfigStack().top()
     if flags.compute_capability >= (6, 0):
-        fname = 'llvm.nvvm.atomic.load.add.f64.p0f64'
+        fname = "llvm.nvvm.atomic.load.add.f64.p0f64"
     else:
-        fname = '___numba_atomic_double_add'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+        fname = "___numba_atomic_double_add"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_sub_float32(lmod):
-    fname = '___numba_atomic_float_sub'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType()), ir.FloatType()))
+    fname = "___numba_atomic_float_sub"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType()), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_sub_float64(lmod):
-    fname = '___numba_atomic_double_sub'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+    fname = "___numba_atomic_double_sub"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_inc_int32(lmod):
-    fname = 'llvm.nvvm.atomic.load.inc.32.p0i32'
-    fnty = ir.FunctionType(ir.IntType(32),
-                           (ir.PointerType(ir.IntType(32)), ir.IntType(32)))
+    fname = "llvm.nvvm.atomic.load.inc.32.p0i32"
+    fnty = ir.FunctionType(
+        ir.IntType(32), (ir.PointerType(ir.IntType(32)), ir.IntType(32))
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_inc_int64(lmod):
-    fname = '___numba_atomic_u64_inc'
-    fnty = ir.FunctionType(ir.IntType(64),
-                           (ir.PointerType(ir.IntType(64)), ir.IntType(64)))
+    fname = "___numba_atomic_u64_inc"
+    fnty = ir.FunctionType(
+        ir.IntType(64), (ir.PointerType(ir.IntType(64)), ir.IntType(64))
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_dec_int32(lmod):
-    fname = 'llvm.nvvm.atomic.load.dec.32.p0i32'
-    fnty = ir.FunctionType(ir.IntType(32),
-                           (ir.PointerType(ir.IntType(32)), ir.IntType(32)))
+    fname = "llvm.nvvm.atomic.load.dec.32.p0i32"
+    fnty = ir.FunctionType(
+        ir.IntType(32), (ir.PointerType(ir.IntType(32)), ir.IntType(32))
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_dec_int64(lmod):
-    fname = '___numba_atomic_u64_dec'
-    fnty = ir.FunctionType(ir.IntType(64),
-                           (ir.PointerType(ir.IntType(64)), ir.IntType(64)))
+    fname = "___numba_atomic_u64_dec"
+    fnty = ir.FunctionType(
+        ir.IntType(64), (ir.PointerType(ir.IntType(64)), ir.IntType(64))
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_max_float32(lmod):
-    fname = '___numba_atomic_float_max'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType()), ir.FloatType()))
+    fname = "___numba_atomic_float_max"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType()), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_max_float64(lmod):
-    fname = '___numba_atomic_double_max'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+    fname = "___numba_atomic_double_max"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_min_float32(lmod):
-    fname = '___numba_atomic_float_min'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType()), ir.FloatType()))
+    fname = "___numba_atomic_float_min"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType()), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_min_float64(lmod):
-    fname = '___numba_atomic_double_min'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+    fname = "___numba_atomic_double_min"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_nanmax_float32(lmod):
-    fname = '___numba_atomic_float_nanmax'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType()), ir.FloatType()))
+    fname = "___numba_atomic_float_nanmax"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType()), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_nanmax_float64(lmod):
-    fname = '___numba_atomic_double_nanmax'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+    fname = "___numba_atomic_double_nanmax"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_nanmin_float32(lmod):
-    fname = '___numba_atomic_float_nanmin'
-    fnty = ir.FunctionType(ir.FloatType(),
-                           (ir.PointerType(ir.FloatType()), ir.FloatType()))
+    fname = "___numba_atomic_float_nanmin"
+    fnty = ir.FunctionType(
+        ir.FloatType(), (ir.PointerType(ir.FloatType()), ir.FloatType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_atomic_nanmin_float64(lmod):
-    fname = '___numba_atomic_double_nanmin'
-    fnty = ir.FunctionType(ir.DoubleType(),
-                           (ir.PointerType(ir.DoubleType()), ir.DoubleType()))
+    fname = "___numba_atomic_double_nanmin"
+    fnty = ir.FunctionType(
+        ir.DoubleType(), (ir.PointerType(ir.DoubleType()), ir.DoubleType())
+    )
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_cudaCGGetIntrinsicHandle(lmod):
-    fname = 'cudaCGGetIntrinsicHandle'
-    fnty = ir.FunctionType(ir.IntType(64),
-                           (ir.IntType(32),))
+    fname = "cudaCGGetIntrinsicHandle"
+    fnty = ir.FunctionType(ir.IntType(64), (ir.IntType(32),))
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_cudaCGSynchronize(lmod):
-    fname = 'cudaCGSynchronize'
-    fnty = ir.FunctionType(ir.IntType(32),
-                           (ir.IntType(64), ir.IntType(32)))
+    fname = "cudaCGSynchronize"
+    fnty = ir.FunctionType(ir.IntType(32), (ir.IntType(64), ir.IntType(32)))
     return cgutils.get_or_insert_function(lmod, fnty, fname)
 def declare_string(builder, value):
     lmod = builder.basic_block.function.module
     cval = cgutils.make_bytearray(value.encode("utf-8") + b"\x00")
-    gl = cgutils.add_global_variable(lmod, cval.type, name="_str",
-                                     addrspace=nvvm.ADDRSPACE_CONSTANT)
-    gl.linkage = 'internal'
+    gl = cgutils.add_global_variable(
+        lmod, cval.type, name="_str", addrspace=nvvm.ADDRSPACE_CONSTANT
+    )
+    gl.linkage = "internal"
     gl.global_constant = True
     gl.initializer = cval
-    return builder.addrspacecast(gl, ir.PointerType(ir.IntType(8)), 'generic')
+    return builder.addrspacecast(gl, ir.PointerType(ir.IntType(8)), "generic")
 def declare_vprint(lmod):
@@ -172,24 +191,20 @@ def declare_vprint(lmod):
 # -----------------------------------------------------------------------------
 SREG_MAPPING = {
-    'tid.x': 'llvm.nvvm.read.ptx.sreg.tid.x',
-    'tid.y': 'llvm.nvvm.read.ptx.sreg.tid.y',
-    'tid.z': 'llvm.nvvm.read.ptx.sreg.tid.z',
-    'ntid.x': 'llvm.nvvm.read.ptx.sreg.ntid.x',
-    'ntid.y': 'llvm.nvvm.read.ptx.sreg.ntid.y',
-    'ntid.z': 'llvm.nvvm.read.ptx.sreg.ntid.z',
-    'ctaid.x': 'llvm.nvvm.read.ptx.sreg.ctaid.x',
-    'ctaid.y': 'llvm.nvvm.read.ptx.sreg.ctaid.y',
-    'ctaid.z': 'llvm.nvvm.read.ptx.sreg.ctaid.z',
-    'nctaid.x': 'llvm.nvvm.read.ptx.sreg.nctaid.x',
-    'nctaid.y': 'llvm.nvvm.read.ptx.sreg.nctaid.y',
-    'nctaid.z': 'llvm.nvvm.read.ptx.sreg.nctaid.z',
-    'warpsize': 'llvm.nvvm.read.ptx.sreg.warpsize',
-    'laneid': 'llvm.nvvm.read.ptx.sreg.laneid',
+    "tid.x": "llvm.nvvm.read.ptx.sreg.tid.x",
+    "tid.y": "llvm.nvvm.read.ptx.sreg.tid.y",
+    "tid.z": "llvm.nvvm.read.ptx.sreg.tid.z",
+    "ntid.x": "llvm.nvvm.read.ptx.sreg.ntid.x",
+    "ntid.y": "llvm.nvvm.read.ptx.sreg.ntid.y",
+    "ntid.z": "llvm.nvvm.read.ptx.sreg.ntid.z",
+    "ctaid.x": "llvm.nvvm.read.ptx.sreg.ctaid.x",
+    "ctaid.y": "llvm.nvvm.read.ptx.sreg.ctaid.y",
+    "ctaid.z": "llvm.nvvm.read.ptx.sreg.ctaid.z",
+    "nctaid.x": "llvm.nvvm.read.ptx.sreg.nctaid.x",
+    "nctaid.y": "llvm.nvvm.read.ptx.sreg.nctaid.y",
+    "nctaid.z": "llvm.nvvm.read.ptx.sreg.nctaid.z",
+    "warpsize": "llvm.nvvm.read.ptx.sreg.warpsize",
+    "laneid": "llvm.nvvm.read.ptx.sreg.laneid",
 }
@@ -205,16 +220,16 @@ class SRegBuilder(object):
         self.builder = builder
     def tid(self, xyz):
-        return call_sreg(self.builder, 'tid.%s' % xyz)
+        return call_sreg(self.builder, "tid.%s" % xyz)
     def ctaid(self, xyz):
-        return call_sreg(self.builder, 'ctaid.%s' % xyz)
+        return call_sreg(self.builder, "ctaid.%s" % xyz)
     def ntid(self, xyz):
-        return call_sreg(self.builder, 'ntid.%s' % xyz)
+        return call_sreg(self.builder, "ntid.%s" % xyz)
     def nctaid(self, xyz):
-        return call_sreg(self.builder, 'nctaid.%s' % xyz)
+        return call_sreg(self.builder, "nctaid.%s" % xyz)
     def getdim(self, xyz):
         i64 = ir.IntType(64)
@@ -227,7 +242,7 @@ class SRegBuilder(object):
 def get_global_id(builder, dim):
     sreg = SRegBuilder(builder)
-    it = (sreg.getdim(xyz) for xyz in 'xyz')
+    it = (sreg.getdim(xyz) for xyz in "xyz")
     seq = list(itertools.islice(it, None, dim))
     if dim == 1:
         return seq[0]

numba_cuda/numba/cuda/printimpl.py CHANGED Viewed

@@ -15,6 +15,7 @@ voidptr = ir.PointerType(ir.IntType(8))
 # NOTE: we don't use @lower here since print_item() doesn't return a LLVM value
 @singledispatch
 def print_item(ty, context, builder, val):
     """
@@ -22,8 +23,9 @@ def print_item(ty, context, builder, val):
     A (format string, [list of arguments]) is returned that will allow
     forming the final printf()-like call.
     """
-    raise NotImplementedError("printing unimplemented for values of type %s"
-                              % (ty,))
+    raise NotImplementedError(
+        "printing unimplemented for values of type %s" % (ty,)
+    )
 @print_item.register(types.Integer)
@@ -92,11 +94,13 @@ def print_varargs(context, builder, sig, args):
     rawfmt = " ".join(formats) + "\n"
     if len(args) > 32:
-        msg = ('CUDA print() cannot print more than 32 items. '
-               'The raw format string will be emitted by the kernel instead.')
+        msg = (
+            "CUDA print() cannot print more than 32 items. "
+            "The raw format string will be emitted by the kernel instead."
+        )
         warn(msg, NumbaWarning)
-        rawfmt = rawfmt.replace('%', '%%')
+        rawfmt = rawfmt.replace("%", "%%")
     fmt = context.insert_string_const_addrspace(builder, rawfmt)
     array = cgutils.make_anonymous_struct(builder, values)
     arrayptr = cgutils.alloca_once_value(builder, array)

numba-cuda 0.8.0__py3-none-any.whl → 0.9.0__py3-none-any.whl

numba-cuda 0.8.0py3-none-any.whl → 0.9.0py3-none-any.whl