PyPI - numba-cuda - Versions diffs - 0.19.1__py3-none-any.whl → 0.20.1__py3-none-any.whl - Mend

numba-cuda 0.19.1py3-none-any.whl → 0.20.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of numba-cuda might be problematic. Click here for more details.

Files changed (172) hide show

numba_cuda/VERSION +1 -1
numba_cuda/numba/cuda/__init__.py +1 -1
numba_cuda/numba/cuda/_internal/cuda_bf16.py +12706 -1470
numba_cuda/numba/cuda/_internal/cuda_fp16.py +2653 -8769
numba_cuda/numba/cuda/api.py +6 -1
numba_cuda/numba/cuda/bf16.py +285 -2
numba_cuda/numba/cuda/cgutils.py +2 -2
numba_cuda/numba/cuda/cloudpickle/__init__.py +21 -0
numba_cuda/numba/cuda/cloudpickle/cloudpickle.py +1598 -0
numba_cuda/numba/cuda/cloudpickle/cloudpickle_fast.py +17 -0
numba_cuda/numba/cuda/codegen.py +1 -1
numba_cuda/numba/cuda/compiler.py +373 -30
numba_cuda/numba/cuda/core/analysis.py +319 -0
numba_cuda/numba/cuda/core/annotations/__init__.py +0 -0
numba_cuda/numba/cuda/core/annotations/type_annotations.py +304 -0
numba_cuda/numba/cuda/core/base.py +1289 -0
numba_cuda/numba/cuda/core/bytecode.py +727 -0
numba_cuda/numba/cuda/core/caching.py +2 -2
numba_cuda/numba/cuda/core/compiler.py +6 -14
numba_cuda/numba/cuda/core/compiler_machinery.py +497 -0
numba_cuda/numba/cuda/core/config.py +747 -0
numba_cuda/numba/cuda/core/consts.py +124 -0
numba_cuda/numba/cuda/core/cpu.py +370 -0
numba_cuda/numba/cuda/core/environment.py +68 -0
numba_cuda/numba/cuda/core/event.py +511 -0
numba_cuda/numba/cuda/core/funcdesc.py +330 -0
numba_cuda/numba/cuda/core/inline_closurecall.py +1889 -0
numba_cuda/numba/cuda/core/interpreter.py +48 -26
numba_cuda/numba/cuda/core/ir_utils.py +15 -26
numba_cuda/numba/cuda/core/options.py +262 -0
numba_cuda/numba/cuda/core/postproc.py +249 -0
numba_cuda/numba/cuda/core/pythonapi.py +1868 -0
numba_cuda/numba/cuda/core/rewrites/__init__.py +26 -0
numba_cuda/numba/cuda/core/rewrites/ir_print.py +90 -0
numba_cuda/numba/cuda/core/rewrites/registry.py +104 -0
numba_cuda/numba/cuda/core/rewrites/static_binop.py +40 -0
numba_cuda/numba/cuda/core/rewrites/static_getitem.py +187 -0
numba_cuda/numba/cuda/core/rewrites/static_raise.py +98 -0
numba_cuda/numba/cuda/core/ssa.py +496 -0
numba_cuda/numba/cuda/core/targetconfig.py +329 -0
numba_cuda/numba/cuda/core/tracing.py +231 -0
numba_cuda/numba/cuda/core/transforms.py +952 -0
numba_cuda/numba/cuda/core/typed_passes.py +738 -7
numba_cuda/numba/cuda/core/typeinfer.py +1948 -0
numba_cuda/numba/cuda/core/unsafe/__init__.py +0 -0
numba_cuda/numba/cuda/core/unsafe/bytes.py +67 -0
numba_cuda/numba/cuda/core/unsafe/eh.py +66 -0
numba_cuda/numba/cuda/core/unsafe/refcount.py +98 -0
numba_cuda/numba/cuda/core/untyped_passes.py +1983 -0
numba_cuda/numba/cuda/cpython/cmathimpl.py +560 -0
numba_cuda/numba/cuda/cpython/mathimpl.py +499 -0
numba_cuda/numba/cuda/cpython/numbers.py +1474 -0
numba_cuda/numba/cuda/cuda_paths.py +422 -246
numba_cuda/numba/cuda/cudadecl.py +1 -1
numba_cuda/numba/cuda/cudadrv/__init__.py +1 -1
numba_cuda/numba/cuda/cudadrv/devicearray.py +2 -1
numba_cuda/numba/cuda/cudadrv/driver.py +11 -140
numba_cuda/numba/cuda/cudadrv/dummyarray.py +111 -24
numba_cuda/numba/cuda/cudadrv/libs.py +5 -5
numba_cuda/numba/cuda/cudadrv/mappings.py +1 -1
numba_cuda/numba/cuda/cudadrv/nvrtc.py +19 -8
numba_cuda/numba/cuda/cudadrv/nvvm.py +1 -4
numba_cuda/numba/cuda/cudadrv/runtime.py +1 -1
numba_cuda/numba/cuda/cudaimpl.py +5 -1
numba_cuda/numba/cuda/debuginfo.py +85 -2
numba_cuda/numba/cuda/decorators.py +3 -3
numba_cuda/numba/cuda/descriptor.py +3 -4
numba_cuda/numba/cuda/deviceufunc.py +66 -2
numba_cuda/numba/cuda/dispatcher.py +18 -39
numba_cuda/numba/cuda/flags.py +141 -1
numba_cuda/numba/cuda/fp16.py +0 -2
numba_cuda/numba/cuda/include/13/cuda_bf16.h +5118 -0
numba_cuda/numba/cuda/include/13/cuda_bf16.hpp +3865 -0
numba_cuda/numba/cuda/include/13/cuda_fp16.h +5363 -0
numba_cuda/numba/cuda/include/13/cuda_fp16.hpp +3483 -0
numba_cuda/numba/cuda/lowering.py +7 -144
numba_cuda/numba/cuda/mathimpl.py +2 -1
numba_cuda/numba/cuda/memory_management/nrt.py +43 -17
numba_cuda/numba/cuda/misc/findlib.py +75 -0
numba_cuda/numba/cuda/models.py +9 -1
numba_cuda/numba/cuda/np/npdatetime_helpers.py +217 -0
numba_cuda/numba/cuda/np/npyfuncs.py +1807 -0
numba_cuda/numba/cuda/np/numpy_support.py +553 -0
numba_cuda/numba/cuda/np/ufunc/ufuncbuilder.py +59 -0
numba_cuda/numba/cuda/nvvmutils.py +1 -1
numba_cuda/numba/cuda/printimpl.py +12 -1
numba_cuda/numba/cuda/random.py +1 -1
numba_cuda/numba/cuda/serialize.py +1 -1
numba_cuda/numba/cuda/simulator/__init__.py +1 -1
numba_cuda/numba/cuda/simulator/api.py +1 -1
numba_cuda/numba/cuda/simulator/compiler.py +4 -0
numba_cuda/numba/cuda/simulator/cudadrv/devicearray.py +1 -1
numba_cuda/numba/cuda/simulator/kernelapi.py +1 -1
numba_cuda/numba/cuda/simulator/memory_management/nrt.py +14 -2
numba_cuda/numba/cuda/target.py +35 -17
numba_cuda/numba/cuda/testing.py +7 -19
numba_cuda/numba/cuda/tests/__init__.py +1 -1
numba_cuda/numba/cuda/tests/cloudpickle_main_class.py +9 -0
numba_cuda/numba/cuda/tests/core/test_serialize.py +4 -4
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_devicerecord.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_cuda_libraries.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_deallocations.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_detect.py +6 -3
numba_cuda/numba/cuda/tests/cudadrv/test_emm_plugins.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_linker.py +18 -2
numba_cuda/numba/cuda/tests/cudadrv/test_module_callbacks.py +2 -1
numba_cuda/numba/cuda/tests/cudadrv/test_nvjitlink.py +1 -1
numba_cuda/numba/cuda/tests/cudadrv/test_ptds.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/extensions_usecases.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_array.py +2 -1
numba_cuda/numba/cuda/tests/cudapy/test_atomics.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_bfloat16.py +539 -2
numba_cuda/numba/cuda/tests/cudapy/test_bfloat16_bindings.py +81 -1
numba_cuda/numba/cuda/tests/cudapy/test_caching.py +1 -3
numba_cuda/numba/cuda/tests/cudapy/test_complex.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_constmem.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_cooperative_groups.py +2 -3
numba_cuda/numba/cuda/tests/cudapy/test_copy_propagate.py +130 -0
numba_cuda/numba/cuda/tests/cudapy/test_datetime.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_debug.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo.py +293 -4
numba_cuda/numba/cuda/tests/cudapy/test_debuginfo_types.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_dispatcher.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_errors.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_exception.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_extending.py +2 -1
numba_cuda/numba/cuda/tests/cudapy/test_inline.py +18 -8
numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py +23 -21
numba_cuda/numba/cuda/tests/cudapy/test_ir_utils.py +10 -37
numba_cuda/numba/cuda/tests/cudapy/test_laplace.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_math.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_matmul.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_operator.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_print.py +20 -0
numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_reduction.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_serialize.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_sm.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_ssa.py +453 -0
numba_cuda/numba/cuda/tests/cudapy/test_sync.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_typeinfer.py +538 -0
numba_cuda/numba/cuda/tests/cudapy/test_ufuncs.py +263 -2
numba_cuda/numba/cuda/tests/cudapy/test_userexc.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_vector_type.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_vectorize_decor.py +112 -6
numba_cuda/numba/cuda/tests/cudapy/test_warning.py +1 -1
numba_cuda/numba/cuda/tests/cudapy/test_warp_ops.py +1 -1
numba_cuda/numba/cuda/tests/doc_examples/test_cg.py +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_ffi.py +3 -2
numba_cuda/numba/cuda/tests/doc_examples/test_laplace.py +0 -2
numba_cuda/numba/cuda/tests/doc_examples/test_sessionize.py +0 -2
numba_cuda/numba/cuda/tests/nocuda/test_import.py +3 -1
numba_cuda/numba/cuda/tests/nocuda/test_library_lookup.py +24 -12
numba_cuda/numba/cuda/tests/nrt/test_nrt.py +2 -1
numba_cuda/numba/cuda/tests/support.py +55 -15
numba_cuda/numba/cuda/tests/test_tracing.py +200 -0
numba_cuda/numba/cuda/types.py +56 -0
numba_cuda/numba/cuda/typing/__init__.py +9 -1
numba_cuda/numba/cuda/typing/cffi_utils.py +55 -0
numba_cuda/numba/cuda/typing/context.py +751 -0
numba_cuda/numba/cuda/typing/enumdecl.py +74 -0
numba_cuda/numba/cuda/typing/npydecl.py +658 -0
numba_cuda/numba/cuda/typing/templates.py +7 -6
numba_cuda/numba/cuda/ufuncs.py +3 -3
numba_cuda/numba/cuda/utils.py +6 -112
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/METADATA +4 -3
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/RECORD +171 -116
numba_cuda/numba/cuda/tests/cudadrv/test_mvc.py +0 -60
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/WHEEL +0 -0
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/licenses/LICENSE +0 -0
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/licenses/LICENSE.numba +0 -0
{numba_cuda-0.19.1.dist-info → numba_cuda-0.20.1.dist-info}/top_level.txt +0 -0

numba_cuda/numba/cuda/tests/cudapy/test_intrinsics.py CHANGED Viewed

@@ -629,7 +629,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.array([3.0], dtype=np.float16)
         arg2 = np.array([4.0], dtype=np.float16)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg1 + arg2)
+        np.testing.assert_allclose(ary[0], arg1 + arg2, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hadd_scalar(self):
@@ -639,7 +639,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg2 = np.float16(3.0)
         compiled[1, 1](ary, arg1, arg2)
         ref = arg1 + arg2
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -657,7 +657,9 @@ class TestCudaIntrinsic(CUDATestCase):
         arg2 = np.array([3.0], dtype=np.float16)
         arg3 = np.array([4.0], dtype=np.float16)
         compiled[1, 1](ary, arg1, arg2, arg3)
-        np.testing.assert_allclose(ary[0], arg1 * arg2 + arg3)
+        np.testing.assert_allclose(
+            ary[0], arg1 * arg2 + arg3, rtol=self.FLOAT16_RTOL
+        )
     @skip_unless_cc_53
     def test_hfma_scalar(self):
@@ -668,7 +670,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg3 = np.float16(4.0)
         compiled[1, 1](ary, arg1, arg2, arg3)
         ref = arg1 * arg2 + arg3
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -687,7 +689,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.array([3.0], dtype=np.float16)
         arg2 = np.array([4.0], dtype=np.float16)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg1 - arg2)
+        np.testing.assert_allclose(ary[0], arg1 - arg2, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hsub_scalar(self):
@@ -697,7 +699,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg2 = np.float16(1.57)
         compiled[1, 1](ary, arg1, arg2)
         ref = arg1 - arg2
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -714,7 +716,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.array([3.0], dtype=np.float16)
         arg2 = np.array([4.0], dtype=np.float16)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg1 * arg2)
+        np.testing.assert_allclose(ary[0], arg1 * arg2, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hmul_scalar(self):
@@ -724,7 +726,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg2 = np.float16(1.57)
         compiled[1, 1](ary, arg1, arg2)
         ref = arg1 * arg2
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -743,7 +745,7 @@ class TestCudaIntrinsic(CUDATestCase):
         compiled[1, 1](ary, arg1, arg2)
         ref = arg1 / arg2
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hdiv(self):
@@ -754,7 +756,7 @@ class TestCudaIntrinsic(CUDATestCase):
         compiled.forall(ary.size)(ary, arry1, arry2)
         ref = arry1 / arry2
-        np.testing.assert_allclose(ary, ref)
+        np.testing.assert_allclose(ary, ref, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hneg(self):
@@ -762,7 +764,7 @@ class TestCudaIntrinsic(CUDATestCase):
         ary = np.zeros(1, dtype=np.float16)
         arg1 = np.array([3.0], dtype=np.float16)
         compiled[1, 1](ary, arg1)
-        np.testing.assert_allclose(ary[0], -arg1)
+        np.testing.assert_allclose(ary[0], -arg1, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hneg_scalar(self):
@@ -771,7 +773,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.float16(3.1415926)
         compiled[1, 1](ary, arg1)
         ref = -arg1
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -787,7 +789,7 @@ class TestCudaIntrinsic(CUDATestCase):
         ary = np.zeros(1, dtype=np.float16)
         arg1 = np.array([-3.0], dtype=np.float16)
         compiled[1, 1](ary, arg1)
-        np.testing.assert_allclose(ary[0], abs(arg1))
+        np.testing.assert_allclose(ary[0], abs(arg1), rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_habs_scalar(self):
@@ -796,7 +798,7 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.float16(-3.1415926)
         compiled[1, 1](ary, arg1)
         ref = abs(arg1)
-        np.testing.assert_allclose(ary[0], ref)
+        np.testing.assert_allclose(ary[0], ref, rtol=self.FLOAT16_RTOL)
     @skip_on_cudasim("Compilation unsupported in the simulator")
     @skip_if_nvjitlink_missing("Numbast generated bindings")
@@ -849,7 +851,7 @@ class TestCudaIntrinsic(CUDATestCase):
                 kernel = cuda.jit("void(f2[:], f2[:])")(kernel)
                 kernel[1, N](r, x)
                 expected = fn(x, dtype=np.float16)
-                np.testing.assert_allclose(r, expected)
+                np.testing.assert_allclose(r, expected, rtol=self.FLOAT16_RTOL)
         x2 = np.random.randint(1, 10, size=N).astype(np.float16)
         for kernel, fn in zip(exp_kernels, expected_exp_functions):
@@ -857,7 +859,7 @@ class TestCudaIntrinsic(CUDATestCase):
                 kernel = cuda.jit("void(f2[:], f2[:])")(kernel)
                 kernel[1, N](r, x2)
                 expected = fn(x2, dtype=np.float16)
-                np.testing.assert_allclose(r, expected)
+                np.testing.assert_allclose(r, expected, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hexp10(self):
@@ -876,7 +878,7 @@ class TestCudaIntrinsic(CUDATestCase):
         # Run the kernel
         hexp10_vectors[1, N](r, x)
-        np.testing.assert_allclose(r, 10**x)
+        np.testing.assert_allclose(r, 10**x, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_fp16_comparison(self):
@@ -948,10 +950,10 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.float16(3.0)
         arg2 = np.float16(4.0)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg2)
+        np.testing.assert_allclose(ary[0], arg2, rtol=self.FLOAT16_RTOL)
         arg1 = np.float16(5.0)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg1)
+        np.testing.assert_allclose(ary[0], arg1, rtol=self.FLOAT16_RTOL)
     @skip_unless_cc_53
     def test_hmin(self):
@@ -960,10 +962,10 @@ class TestCudaIntrinsic(CUDATestCase):
         arg1 = np.float16(3.0)
         arg2 = np.float16(4.0)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg1)
+        np.testing.assert_allclose(ary[0], arg1, rtol=self.FLOAT16_RTOL)
         arg1 = np.float16(5.0)
         compiled[1, 1](ary, arg1, arg2)
-        np.testing.assert_allclose(ary[0], arg2)
+        np.testing.assert_allclose(ary[0], arg2, rtol=self.FLOAT16_RTOL)
     def test_cbrt_f32(self):
         compiled = cuda.jit("void(float32[:], float32)")(simple_cbrt)

numba_cuda/numba/cuda/tests/cudapy/test_ir_utils.py CHANGED Viewed

@@ -2,63 +2,34 @@
 # SPDX-License-Identifier: BSD-2-Clause
 from numba.cuda.testing import CUDATestCase
-import numba
-from numba.core.registry import cpu_target
-from numba.core.compiler import CompilerBase, Flags
-from numba.core.compiler_machinery import PassManager
+from numba.cuda.core.compiler import CompilerBase
+from numba.cuda.flags import Flags
+from numba.cuda.core.compiler_machinery import PassManager
 from numba.cuda.core import ir_utils
-from numba.core import types, ir, bytecode, compiler, registry
-from numba.core.untyped_passes import (
+from numba.core import types, ir, bytecode, registry
+from numba.cuda import compiler
+from numba.cuda.core.untyped_passes import (
     ExtractByteCode,
     TranslateByteCode,
     FixupArgs,
     IRProcessing,
 )
-from numba.experimental import jitclass
-from numba.core.typed_passes import (
+from numba.cuda.core.typed_passes import (
     NopythonTypeInference,
-    type_inference_stage,
     DeadCodeElimination,
 )
+from numba.cuda.testing import skip_on_cudasim
 # global constant for testing find_const
 GLOBAL_B = 11
-@jitclass([("val", numba.core.types.List(numba.intp))])
-class Dummy(object):
-    def __init__(self, val):
-        self.val = val
 class TestIrUtils(CUDATestCase):
     """
     Tests ir handling utility functions like find_callname.
     """
-    def test_obj_func_match(self):
-        """Test matching of an object method (other than Array see #3449)"""
-        def test_func():
-            d = Dummy([1])
-            d.val.append(2)
-        test_ir = compiler.run_frontend(test_func)
-        typingctx = cpu_target.typing_context
-        targetctx = cpu_target.target_context
-        typing_res = type_inference_stage(
-            typingctx, targetctx, test_ir, (), None
-        )
-        matched_call = ir_utils.find_callname(
-            test_ir, test_ir.blocks[0].body[7].value, typing_res.typemap
-        )
-        self.assertTrue(
-            isinstance(matched_call, tuple)
-            and len(matched_call) == 2
-            and matched_call[0] == "append"
-        )
     def test_dead_code_elimination(self):
         class Tester(CompilerBase):
             @classmethod
@@ -177,6 +148,7 @@ class TestIrUtils(CUDATestCase):
             len(no_dce.blocks[0].body) - len(removed), len(w_dce.blocks[0].body)
         )
+    @skip_on_cudasim("Skipping ir utils tests on CUDA simulator")
     def test_find_const_global(self):
         """
         Test find_const() for values in globals (ir.Global) and freevars
@@ -203,6 +175,7 @@ class TestIrUtils(CUDATestCase):
         self.assertEqual(const_b, GLOBAL_B)
         self.assertEqual(const_c, FREEVAR_C)
+    @skip_on_cudasim("Skipping ir utils tests on CUDA simulator")
     def test_flatten_labels(self):
         """tests flatten_labels"""

numba_cuda/numba/cuda/tests/cudapy/test_laplace.py CHANGED Viewed

@@ -4,7 +4,7 @@
 import numpy as np
 from numba import cuda, float64, void
 from numba.cuda.testing import unittest, CUDATestCase
-from numba.core import config
+from numba.cuda.core import config
 # NOTE: CUDA kernel does not return any value

numba_cuda/numba/cuda/tests/cudapy/test_math.py CHANGED Viewed

@@ -8,7 +8,7 @@ from numba.cuda.testing import (
     CUDATestCase,
     skip_on_cudasim,
 )
-from numba.np import numpy_support
+from numba.cuda.np import numpy_support
 from numba import cuda, float32, float64, int32, vectorize, void, int64
 import math

numba_cuda/numba/cuda/tests/cudapy/test_matmul.py CHANGED Viewed

@@ -5,7 +5,7 @@ import numpy as np
 from numba import cuda, float32, void
 from numba.cuda.testing import unittest, CUDATestCase
-from numba.core import config
+from numba.cuda.core import config
 # Ensure the test takes a reasonable amount of time in the simulator
 if config.ENABLE_CUDASIM:

numba_cuda/numba/cuda/tests/cudapy/test_operator.py CHANGED Viewed

@@ -15,7 +15,7 @@ from numba.core.types import f2, b1
 from numba.cuda.typing import signature
 import operator
 import itertools
-from numba.np.numpy_support import from_dtype
+from numba.cuda.np.numpy_support import from_dtype
 def simple_fp16_div_scalar(ary, a, b):

numba_cuda/numba/cuda/tests/cudapy/test_print.py CHANGED Viewed

@@ -102,6 +102,21 @@ print_too_many[1, 1](np.arange(33))
 cuda.synchronize()
 """
+print_bfloat16_usecase = """\
+from numba import cuda
+from numba.cuda import config
+@cuda.jit
+def print_bfloat16():
+    # 0.9375 is a dyadic rational, it's integer significand can expand within 7 digits.
+    # printing this should not give any rounding error.
+    a = cuda.types.bfloat16(0.9375)
+    print(a, a, a)
+print_bfloat16[1, 1]()
+cuda.synchronize()
+"""
 class TestPrint(CUDATestCase):
     # Note that in these tests we generally strip the output to avoid dealing
@@ -148,6 +163,11 @@ class TestPrint(CUDATestCase):
         expected = [str(i) for i in np.ndindex(2, 2, 2)]
         self.assertEqual(sorted(lines), expected)
+    @skip_on_cudasim("bfloat16 on host is not yet supported.")
+    def test_bfloat16(self):
+        output, _ = self.run_code(print_bfloat16_usecase)
+        self.assertEqual(output.strip(), "0.937500 0.937500 0.937500")
     @skip_on_cudasim("cudasim can print unlimited output")
     def test_too_many_args(self):
         # Tests that we emit the format string and warn when there are more

numba_cuda/numba/cuda/tests/cudapy/test_record_dtype.py CHANGED Viewed

@@ -6,7 +6,7 @@ from numba import cuda
 from numba.core import types
 from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-from numba.np import numpy_support
+from numba.cuda.np import numpy_support
 def set_a(ary, i, v):

numba_cuda/numba/cuda/tests/cudapy/test_reduction.py CHANGED Viewed

@@ -3,7 +3,7 @@
 import numpy as np
 from numba import cuda
-from numba.core.config import ENABLE_CUDASIM
+from numba.cuda.core.config import ENABLE_CUDASIM
 from numba.cuda.testing import CUDATestCase
 import unittest

numba_cuda/numba/cuda/tests/cudapy/test_serialize.py CHANGED Viewed

@@ -7,7 +7,7 @@ from numba import cuda, vectorize
 from numba.core import types
 from numba.cuda.testing import skip_on_cudasim, CUDATestCase
 import unittest
-from numba.np import numpy_support
+from numba.cuda.np import numpy_support
 @skip_on_cudasim("pickling not supported in CUDASIM")

numba_cuda/numba/cuda/tests/cudapy/test_sm.py CHANGED Viewed

@@ -7,7 +7,7 @@ from numba.core import types
 from numba.cuda.testing import unittest, CUDATestCase, skip_on_cudasim
 import numpy as np
-from numba.np import numpy_support as nps
+from numba.cuda.np import numpy_support as nps
 from .extensions_usecases import test_struct_model_type, TestStruct

numba-cuda 0.19.1__py3-none-any.whl → 0.20.1__py3-none-any.whl

Potentially problematic release.

numba-cuda 0.19.1py3-none-any.whl → 0.20.1py3-none-any.whl