PyPI - warp-lang - Versions diffs - 0.11.0__py3-none-manylinux2014_x86_64.whl → 1.0.0__py3-none-manylinux2014_x86_64.whl - Mend

warp-lang 0.11.0__py3-none-manylinux2014_x86_64.whl → 1.0.0__py3-none-manylinux2014_x86_64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of warp-lang might be problematic. Click here for more details.

Files changed (170) hide show

warp/__init__.py +8 -0
warp/bin/warp-clang.so +0 -0
warp/bin/warp.so +0 -0
warp/build.py +7 -6
warp/build_dll.py +70 -79
warp/builtins.py +10 -6
warp/codegen.py +51 -19
warp/config.py +7 -8
warp/constants.py +3 -0
warp/context.py +948 -245
warp/dlpack.py +198 -113
warp/examples/assets/bunny.usd +0 -0
warp/examples/assets/cartpole.urdf +110 -0
warp/examples/assets/crazyflie.usd +0 -0
warp/examples/assets/cube.usda +42 -0
warp/examples/assets/nv_ant.xml +92 -0
warp/examples/assets/nv_humanoid.xml +183 -0
warp/examples/assets/quadruped.urdf +268 -0
warp/examples/assets/rocks.nvdb +0 -0
warp/examples/assets/rocks.usd +0 -0
warp/examples/assets/sphere.usda +56 -0
warp/examples/assets/torus.usda +105 -0
warp/examples/benchmarks/benchmark_api.py +383 -0
warp/examples/benchmarks/benchmark_cloth.py +279 -0
warp/examples/benchmarks/benchmark_cloth_cupy.py +88 -0
warp/examples/benchmarks/benchmark_cloth_jax.py +100 -0
warp/examples/benchmarks/benchmark_cloth_numba.py +142 -0
warp/examples/benchmarks/benchmark_cloth_numpy.py +77 -0
warp/examples/benchmarks/benchmark_cloth_pytorch.py +86 -0
warp/examples/benchmarks/benchmark_cloth_taichi.py +112 -0
warp/examples/benchmarks/benchmark_cloth_warp.py +146 -0
warp/examples/benchmarks/benchmark_launches.py +295 -0
warp/examples/core/example_dem.py +221 -0
warp/examples/core/example_fluid.py +267 -0
warp/examples/core/example_graph_capture.py +129 -0
warp/examples/core/example_marching_cubes.py +177 -0
warp/examples/core/example_mesh.py +154 -0
warp/examples/core/example_mesh_intersect.py +193 -0
warp/examples/core/example_nvdb.py +169 -0
warp/examples/core/example_raycast.py +89 -0
warp/examples/core/example_raymarch.py +178 -0
warp/examples/core/example_render_opengl.py +141 -0
warp/examples/core/example_sph.py +389 -0
warp/examples/core/example_torch.py +181 -0
warp/examples/core/example_wave.py +249 -0
warp/examples/fem/bsr_utils.py +380 -0
warp/examples/fem/example_apic_fluid.py +391 -0
warp/examples/fem/example_convection_diffusion.py +168 -0
warp/examples/fem/example_convection_diffusion_dg.py +209 -0
warp/examples/fem/example_convection_diffusion_dg0.py +194 -0
warp/examples/fem/example_deformed_geometry.py +159 -0
warp/examples/fem/example_diffusion.py +173 -0
warp/examples/fem/example_diffusion_3d.py +152 -0
warp/examples/fem/example_diffusion_mgpu.py +214 -0
warp/examples/fem/example_mixed_elasticity.py +222 -0
warp/examples/fem/example_navier_stokes.py +243 -0
warp/examples/fem/example_stokes.py +192 -0
warp/examples/fem/example_stokes_transfer.py +249 -0
warp/examples/fem/mesh_utils.py +109 -0
warp/examples/fem/plot_utils.py +287 -0
warp/examples/optim/example_bounce.py +248 -0
warp/examples/optim/example_cloth_throw.py +210 -0
warp/examples/optim/example_diffray.py +535 -0
warp/examples/optim/example_drone.py +850 -0
warp/examples/optim/example_inverse_kinematics.py +169 -0
warp/examples/optim/example_inverse_kinematics_torch.py +170 -0
warp/examples/optim/example_spring_cage.py +234 -0
warp/examples/optim/example_trajectory.py +201 -0
warp/examples/sim/example_cartpole.py +128 -0
warp/examples/sim/example_cloth.py +184 -0
warp/examples/sim/example_granular.py +113 -0
warp/examples/sim/example_granular_collision_sdf.py +185 -0
warp/examples/sim/example_jacobian_ik.py +213 -0
warp/examples/sim/example_particle_chain.py +106 -0
warp/examples/sim/example_quadruped.py +179 -0
warp/examples/sim/example_rigid_chain.py +191 -0
warp/examples/sim/example_rigid_contact.py +176 -0
warp/examples/sim/example_rigid_force.py +126 -0
warp/examples/sim/example_rigid_gyroscopic.py +97 -0
warp/examples/sim/example_rigid_soft_contact.py +124 -0
warp/examples/sim/example_soft_body.py +178 -0
warp/fabric.py +29 -20
warp/fem/cache.py +0 -1
warp/fem/dirichlet.py +0 -2
warp/fem/integrate.py +0 -1
warp/jax.py +45 -0
warp/jax_experimental.py +339 -0
warp/native/builtin.h +12 -0
warp/native/bvh.cu +18 -18
warp/native/clang/clang.cpp +8 -3
warp/native/cuda_util.cpp +94 -5
warp/native/cuda_util.h +35 -6
warp/native/cutlass_gemm.cpp +1 -1
warp/native/cutlass_gemm.cu +4 -1
warp/native/error.cpp +66 -0
warp/native/error.h +27 -0
warp/native/mesh.cu +2 -2
warp/native/reduce.cu +4 -4
warp/native/runlength_encode.cu +2 -2
warp/native/scan.cu +2 -2
warp/native/sparse.cu +0 -1
warp/native/temp_buffer.h +2 -2
warp/native/warp.cpp +95 -60
warp/native/warp.cu +1053 -218
warp/native/warp.h +49 -32
warp/optim/linear.py +33 -16
warp/render/render_opengl.py +202 -101
warp/render/render_usd.py +82 -40
warp/sim/__init__.py +13 -4
warp/sim/articulation.py +4 -5
warp/sim/collide.py +320 -175
warp/sim/import_mjcf.py +25 -30
warp/sim/import_urdf.py +94 -63
warp/sim/import_usd.py +51 -36
warp/sim/inertia.py +3 -2
warp/sim/integrator.py +233 -0
warp/sim/integrator_euler.py +447 -469
warp/sim/integrator_featherstone.py +1991 -0
warp/sim/integrator_xpbd.py +1420 -640
warp/sim/model.py +765 -487
warp/sim/particles.py +2 -1
warp/sim/render.py +35 -13
warp/sim/utils.py +222 -11
warp/stubs.py +8 -0
warp/tape.py +16 -1
warp/tests/aux_test_grad_customs.py +23 -0
warp/tests/test_array.py +190 -1
warp/tests/test_async.py +656 -0
warp/tests/test_bool.py +50 -0
warp/tests/test_dlpack.py +164 -11
warp/tests/test_examples.py +166 -74
warp/tests/test_fem.py +8 -1
warp/tests/test_generics.py +15 -5
warp/tests/test_grad.py +1 -1
warp/tests/test_grad_customs.py +172 -12
warp/tests/test_jax.py +254 -0
warp/tests/test_large.py +29 -6
warp/tests/test_launch.py +25 -0
warp/tests/test_linear_solvers.py +20 -3
warp/tests/test_matmul.py +61 -16
warp/tests/test_matmul_lite.py +13 -13
warp/tests/test_mempool.py +186 -0
warp/tests/test_multigpu.py +3 -0
warp/tests/test_options.py +16 -2
warp/tests/test_peer.py +137 -0
warp/tests/test_print.py +3 -1
warp/tests/test_quat.py +23 -0
warp/tests/test_sim_kinematics.py +97 -0
warp/tests/test_snippet.py +126 -3
warp/tests/test_streams.py +108 -79
warp/tests/test_torch.py +16 -8
warp/tests/test_utils.py +32 -27
warp/tests/test_verify_fp.py +65 -0
warp/tests/test_volume.py +1 -1
warp/tests/unittest_serial.py +2 -0
warp/tests/unittest_suites.py +12 -0
warp/tests/unittest_utils.py +14 -7
warp/thirdparty/unittest_parallel.py +15 -3
warp/torch.py +10 -8
warp/types.py +363 -246
warp/utils.py +143 -19
warp_lang-1.0.0.dist-info/LICENSE.md +126 -0
warp_lang-1.0.0.dist-info/METADATA +394 -0
{warp_lang-0.11.0.dist-info → warp_lang-1.0.0.dist-info}/RECORD +167 -86
warp/sim/optimizer.py +0 -138
warp_lang-0.11.0.dist-info/LICENSE.md +0 -36
warp_lang-0.11.0.dist-info/METADATA +0 -238
/warp/tests/{walkthough_debug.py → walkthrough_debug.py} +0 -0
{warp_lang-0.11.0.dist-info → warp_lang-1.0.0.dist-info}/WHEEL +0 -0
{warp_lang-0.11.0.dist-info → warp_lang-1.0.0.dist-info}/top_level.txt +0 -0

warp/tests/test_verify_fp.py ADDED Viewed

@@ -0,0 +1,65 @@
+# Copyright (c) 2024 NVIDIA CORPORATION.  All rights reserved.
+# NVIDIA CORPORATION and its licensors retain all intellectual property
+# and proprietary rights in and to this software, related documentation
+# and any modifications thereto.  Any use, reproduction, disclosure or
+# distribution of this software and related documentation without an express
+# license agreement from NVIDIA CORPORATION is strictly prohibited.
+import unittest
+import warp as wp
+from warp.tests.unittest_utils import *
+wp.init()
+def setUpModule():
+    wp.config.verify_fp = True  # Enable checking floating-point values to be finite
+def tearDownModule():
+    wp.config.verify_fp = False
+@wp.struct
+class TestStruct:
+    field: wp.float32
+@wp.kernel
+def finite_kernel(foos: wp.array(dtype=TestStruct)):
+    i = wp.tid()
+    foos[i].field += wp.float32(1.0)
+def test_finite(test, device):
+    foos = wp.zeros((10,), dtype=TestStruct, device=device)
+    wp.launch(
+        kernel=finite_kernel,
+        dim=(10,),
+        inputs=[foos],
+        device=device,
+    )
+    wp.synchronize()
+    expected = TestStruct()
+    expected.field = 1.0
+    for f in foos.list():
+        if f.field != expected.field:
+            raise AssertionError(f"Unexpected result, got: {f} expected: {expected}")
+devices = get_test_devices()
+class TestVerifyFP(unittest.TestCase):
+    pass
+add_function_test(TestVerifyFP, "test_finite", test_finite, devices=devices)
+if __name__ == "__main__":
+    wp.build.clear_kernel_cache()
+    unittest.main(verbosity=2)

warp/tests/test_volume.py CHANGED Viewed

@@ -627,7 +627,7 @@ def test_volume_from_numpy(test, device):
     sphere_vdb_array = sphere_vdb.array()
     test.assertEqual(sphere_vdb_array.dtype, wp.uint8)
-    test.assertFalse(sphere_vdb_array.owner)
+    test.assertIsNone(sphere_vdb_array.deleter)
 class TestVolume(unittest.TestCase):

warp/tests/unittest_serial.py CHANGED Viewed

@@ -8,6 +8,8 @@
 import warp as wp
 from warp.tests.unittest_utils import TeamCityTestRunner
+wp.init()
 def run_suite() -> bool:
     """Run a test suite"""

warp/tests/unittest_suites.py CHANGED Viewed

@@ -91,6 +91,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_arithmetic import TestArithmetic
     from warp.tests.test_array import TestArray
     from warp.tests.test_array_reduce import TestArrayReduce
+    from warp.tests.test_async import TestAsync
     from warp.tests.test_atomic import TestAtomic
     from warp.tests.test_bool import TestBool
     from warp.tests.test_builtins_resolution import TestBuiltinsResolution
@@ -117,6 +118,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_import import TestImport
     from warp.tests.test_indexedarray import TestIndexedArray
     from warp.tests.test_intersect import TestIntersect
+    from warp.tests.test_jax import TestJax
     from warp.tests.test_large import TestLarge
     from warp.tests.test_launch import TestLaunch
     from warp.tests.test_lerp import TestLerp
@@ -129,6 +131,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_math import TestMath
     from warp.tests.test_matmul import TestMatmul
     from warp.tests.test_matmul_lite import TestMatmulLite
+    from warp.tests.test_mempool import TestMempool
     from warp.tests.test_mesh import TestMesh
     from warp.tests.test_mesh_query_aabb import TestMeshQueryAABBMethods
     from warp.tests.test_mesh_query_point import TestMeshQueryPoint
@@ -140,6 +143,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_noise import TestNoise
     from warp.tests.test_operators import TestOperators
     from warp.tests.test_options import TestOptions
+    from warp.tests.test_peer import TestPeer
     from warp.tests.test_pinned import TestPinned
     from warp.tests.test_print import TestPrint
     from warp.tests.test_quat import TestQuat
@@ -147,6 +151,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_reload import TestReload
     from warp.tests.test_rounding import TestRounding
     from warp.tests.test_runlength_encode import TestRunlengthEncode
+    from warp.tests.test_sim_kinematics import TestSimKinematics
     from warp.tests.test_smoothstep import TestSmoothstep
     from warp.tests.test_snippet import TestSnippets
     from warp.tests.test_sparse import TestSparse
@@ -161,6 +166,7 @@ def default_suite(test_loader: unittest.TestLoader):
     from warp.tests.test_vec import TestVec
     from warp.tests.test_vec_lite import TestVecLite
     from warp.tests.test_vec_scalar_ops import TestVecScalarOps
+    from warp.tests.test_verify_fp import TestVerifyFP
     from warp.tests.test_volume import TestVolume
     from warp.tests.test_volume_write import TestVolumeWrite
@@ -169,6 +175,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestArithmetic,
         TestArray,
         TestArrayReduce,
+        TestAsync,
         TestAtomic,
         TestBool,
         TestBuiltinsResolution,
@@ -198,6 +205,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestImport,
         TestIndexedArray,
         TestIntersect,
+        TestJax,
         TestLarge,
         TestLaunch,
         TestLerp,
@@ -210,6 +218,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestMath,
         TestMatmul,
         TestMatmulLite,
+        TestMempool,
         TestMesh,
         TestMeshQueryAABBMethods,
         TestMeshQueryPoint,
@@ -221,6 +230,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestNoise,
         TestOperators,
         TestOptions,
+        TestPeer,
         TestPinned,
         TestPrint,
         TestQuat,
@@ -228,6 +238,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestReload,
         TestRounding,
         TestRunlengthEncode,
+        TestSimKinematics,
         TestSmoothstep,
         TestSparse,
         TestSnippets,
@@ -242,6 +253,7 @@ def default_suite(test_loader: unittest.TestLoader):
         TestVec,
         TestVecLite,
         TestVecScalarOps,
+        TestVerifyFP,
         TestVolume,
         TestVolumeWrite,
     ]

warp/tests/unittest_utils.py CHANGED Viewed

@@ -7,6 +7,7 @@
 import ctypes
 import ctypes.util
+import math
 import os
 import sys
 import time
@@ -101,6 +102,11 @@ def get_test_devices(mode=None):
     return devices
+def get_cuda_test_devices(mode=None):
+    devices = get_test_devices(mode=mode)
+    return [d for d in devices if d.is_cuda]
 # redirects and captures all stdout output (including from C-libs)
 class StdOutCapture:
     def begin(self):
@@ -127,11 +133,12 @@ class StdOutCapture:
         sys.stdout = self.tempfile
     def end(self):
-        if sys.platform == "win32":
-            # Workaround for what seems to be a Windows-specific bug where
-            # the output of CUDA's `printf` is not being immediately flushed
-            # despite the context synchronisation.
-            time.sleep(0.01)
+        # The following sleep doesn't seem to fix the test_print failure on Windows
+        # if sys.platform == "win32":
+        #    # Workaround for what seems to be a Windows-specific bug where
+        #    # the output of CUDA's `printf` is not being immediately flushed
+        #    # despite the context synchronisation.
+        #    time.sleep(0.01)
         os.dup2(self.target, self.saved.fileno())
         os.close(self.target)
@@ -185,9 +192,9 @@ def assert_np_equal(result, expect, tol=0.0):
     else:
         delta = a - b
         err = np.max(np.abs(delta))
-        if err > tol:
+        if err > tol or math.isnan(err):
             raise AssertionError(
-                f"Maximum expected error exceeds tolerance got: {a}, expected: {b}, with err: {err} > {tol}"
+                f"Maximum expected error exceeds absolute tolerance got: {a}, expected: {b}, with err: {err} > {tol}"
             )

warp/thirdparty/unittest_parallel.py CHANGED Viewed

@@ -53,7 +53,16 @@ def main(argv=None):
     """
     # Command line arguments
-    parser = argparse.ArgumentParser(prog="unittest-parallel")
+    parser = argparse.ArgumentParser(
+        prog="unittest-parallel",
+        # NVIDIA Modifications follow:
+        formatter_class=argparse.RawTextHelpFormatter,
+        epilog="""Example usage:
+        python -m warp.tests -s autodetect -p 'test_a*.py'
+        python -m warp.tests -s kit
+        python -m warp.tests -k 'mgpu' -k 'cuda'
+        """,
+    )
     # parser.add_argument("-v", "--verbose", action="store_const", const=2, default=1, help="Verbose output")
     parser.add_argument("-q", "--quiet", dest="verbose", action="store_const", const=0, default=2, help="Quiet output")
     parser.add_argument("-f", "--failfast", action="store_true", default=False, help="Stop on first fail or error")
@@ -238,6 +247,8 @@ def main(argv=None):
             import warp as wp
+            wp.init()
             # force rebuild of all kernels
             wp.build.clear_kernel_cache()
             print("Cleared Warp kernel cache")
@@ -449,6 +460,7 @@ class ParallelTestManager:
             # Clean up kernel cache (NVIDIA modification)
             import warp as wp
+            wp.init()
             wp.build.clear_kernel_cache()
             # Return (test_count, errors, failures, skipped_count, expected_failure_count, unexpected_success_count)
@@ -537,11 +549,11 @@ def set_worker_cache(args, temp_dir):
             cache_root_dir = os.path.join(os.getenv("WARP_CACHE_ROOT"), f"{wp.config.version}-{pid}")
         else:
             cache_root_dir = appdirs.user_cache_dir(
-                appname="warp", appauthor="NVIDIA Corporation", version=f"{wp.config.version}-{pid}"
+                appname="warp", appauthor="NVIDIA", version=f"{wp.config.version}-{pid}"
             )
         wp.config.kernel_cache_dir = cache_root_dir
+        wp.init()
         wp.build.clear_kernel_cache()

warp/torch.py CHANGED Viewed

@@ -121,6 +121,7 @@ def from_torch(t, dtype=None, requires_grad=None, grad=None):
     shape = tuple(t.shape)
     strides = tuple(s * ctype_size for s in t.stride())
+    device = device_from_torch(t.device)
     # if target is a vector or matrix type
     # then check if trailing dimensions match
@@ -157,20 +158,21 @@ def from_torch(t, dtype=None, requires_grad=None, grad=None):
     elif requires_grad:
         # wrap the tensor gradient, allocate if necessary
         if t.grad is None:
-            # allocate a zero-filled gradient tensor if it doesn't exist
-            import torch
-            t.grad = torch.zeros_like(t, requires_grad=False)
-        grad = from_torch(t.grad, dtype=dtype)
+            # allocate a zero-filled gradient if it doesn't exist
+            # Note: we use Warp to allocate the shared gradient with compatible strides
+            grad = warp.zeros(dtype=dtype, shape=shape, strides=strides, device=device)
+            t.grad = to_torch(grad, requires_grad=False)
+        else:
+            # TODO: this will fail if the strides are incompatible
+            grad = from_torch(t.grad, dtype=dtype)
-    a = warp.types.array(
+    a = warp.array(
         ptr=t.data_ptr(),
         dtype=dtype,
         shape=shape,
         strides=strides,
-        device=device_from_torch(t.device),
+        device=device,
         copy=False,
-        owner=False,
         grad=grad,
         requires_grad=requires_grad,
     )