PyPI - warp-lang - Versions diffs - 1.6.2__py3-none-macosx_10_13_universal2.whl → 1.7.0__py3-none-macosx_10_13_universal2.whl - Mend

warp-lang 1.6.2__py3-none-macosx_10_13_universal2.whl → 1.7.0__py3-none-macosx_10_13_universal2.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of warp-lang might be problematic. Click here for more details.

Files changed (179) hide show

warp/__init__.py +7 -1
warp/bin/libwarp-clang.dylib +0 -0
warp/bin/libwarp.dylib +0 -0
warp/build.py +410 -0
warp/build_dll.py +6 -14
warp/builtins.py +452 -362
warp/codegen.py +179 -119
warp/config.py +42 -6
warp/context.py +490 -271
warp/dlpack.py +8 -6
warp/examples/assets/nonuniform.usd +0 -0
warp/examples/assets/nvidia_logo.png +0 -0
warp/examples/benchmarks/benchmark_tile_load_store.py +103 -0
warp/examples/core/example_sample_mesh.py +300 -0
warp/examples/fem/example_apic_fluid.py +1 -1
warp/examples/fem/example_burgers.py +2 -2
warp/examples/fem/example_deformed_geometry.py +1 -1
warp/examples/fem/example_distortion_energy.py +1 -1
warp/examples/fem/example_magnetostatics.py +6 -6
warp/examples/fem/utils.py +9 -3
warp/examples/interop/example_jax_callable.py +116 -0
warp/examples/interop/example_jax_ffi_callback.py +132 -0
warp/examples/interop/example_jax_kernel.py +205 -0
warp/examples/optim/example_fluid_checkpoint.py +497 -0
warp/examples/tile/example_tile_matmul.py +2 -4
warp/fem/__init__.py +11 -1
warp/fem/adaptivity.py +4 -4
warp/fem/field/nodal_field.py +22 -68
warp/fem/field/virtual.py +62 -23
warp/fem/geometry/adaptive_nanogrid.py +9 -10
warp/fem/geometry/closest_point.py +1 -1
warp/fem/geometry/deformed_geometry.py +5 -2
warp/fem/geometry/geometry.py +5 -0
warp/fem/geometry/grid_2d.py +12 -12
warp/fem/geometry/grid_3d.py +12 -15
warp/fem/geometry/hexmesh.py +5 -7
warp/fem/geometry/nanogrid.py +9 -11
warp/fem/geometry/quadmesh.py +13 -13
warp/fem/geometry/tetmesh.py +3 -4
warp/fem/geometry/trimesh.py +3 -8
warp/fem/integrate.py +262 -93
warp/fem/linalg.py +5 -5
warp/fem/quadrature/pic_quadrature.py +37 -22
warp/fem/quadrature/quadrature.py +194 -25
warp/fem/space/__init__.py +1 -1
warp/fem/space/basis_function_space.py +4 -2
warp/fem/space/basis_space.py +25 -18
warp/fem/space/hexmesh_function_space.py +2 -2
warp/fem/space/partition.py +6 -2
warp/fem/space/quadmesh_function_space.py +8 -8
warp/fem/space/shape/cube_shape_function.py +23 -23
warp/fem/space/shape/square_shape_function.py +12 -12
warp/fem/space/shape/triangle_shape_function.py +1 -1
warp/fem/space/tetmesh_function_space.py +3 -3
warp/fem/space/trimesh_function_space.py +2 -2
warp/fem/utils.py +12 -6
warp/jax.py +14 -1
warp/jax_experimental/__init__.py +16 -0
warp/{jax_experimental.py → jax_experimental/custom_call.py} +14 -27
warp/jax_experimental/ffi.py +698 -0
warp/jax_experimental/xla_ffi.py +602 -0
warp/math.py +89 -0
warp/native/array.h +13 -0
warp/native/builtin.h +29 -3
warp/native/bvh.cpp +3 -1
warp/native/bvh.cu +42 -14
warp/native/bvh.h +2 -1
warp/native/clang/clang.cpp +30 -3
warp/native/cuda_util.cpp +14 -0
warp/native/cuda_util.h +2 -0
warp/native/exports.h +68 -63
warp/native/intersect.h +26 -26
warp/native/intersect_adj.h +33 -33
warp/native/marching.cu +1 -1
warp/native/mat.h +513 -9
warp/native/mesh.h +10 -10
warp/native/quat.h +99 -11
warp/native/rand.h +6 -0
warp/native/sort.cpp +122 -59
warp/native/sort.cu +152 -15
warp/native/sort.h +8 -1
warp/native/sparse.cpp +43 -22
warp/native/sparse.cu +52 -17
warp/native/svd.h +116 -0
warp/native/tile.h +301 -105
warp/native/tile_reduce.h +46 -3
warp/native/vec.h +68 -7
warp/native/volume.cpp +85 -113
warp/native/volume_builder.cu +25 -10
warp/native/volume_builder.h +6 -0
warp/native/warp.cpp +5 -6
warp/native/warp.cu +99 -10
warp/native/warp.h +19 -10
warp/optim/linear.py +10 -10
warp/sim/articulation.py +4 -4
warp/sim/collide.py +21 -10
warp/sim/import_mjcf.py +449 -155
warp/sim/import_urdf.py +32 -12
warp/sim/integrator_euler.py +5 -5
warp/sim/integrator_featherstone.py +3 -10
warp/sim/integrator_vbd.py +207 -2
warp/sim/integrator_xpbd.py +5 -5
warp/sim/model.py +42 -13
warp/sim/utils.py +2 -2
warp/sparse.py +642 -555
warp/stubs.py +216 -19
warp/tests/__main__.py +0 -15
warp/tests/cuda/__init__.py +0 -0
warp/tests/{test_mempool.py → cuda/test_mempool.py} +39 -0
warp/tests/{test_streams.py → cuda/test_streams.py} +71 -0
warp/tests/geometry/__init__.py +0 -0
warp/tests/{test_mesh_query_point.py → geometry/test_mesh_query_point.py} +66 -63
warp/tests/{test_mesh_query_ray.py → geometry/test_mesh_query_ray.py} +1 -1
warp/tests/{test_volume.py → geometry/test_volume.py} +41 -6
warp/tests/interop/__init__.py +0 -0
warp/tests/{test_dlpack.py → interop/test_dlpack.py} +28 -5
warp/tests/sim/__init__.py +0 -0
warp/tests/{disabled_kinematics.py → sim/disabled_kinematics.py} +9 -10
warp/tests/{test_collision.py → sim/test_collision.py} +2 -2
warp/tests/{test_model.py → sim/test_model.py} +40 -0
warp/tests/{test_sim_kinematics.py → sim/test_sim_kinematics.py} +2 -1
warp/tests/sim/test_vbd.py +597 -0
warp/tests/test_bool.py +1 -1
warp/tests/test_examples.py +28 -36
warp/tests/test_fem.py +23 -4
warp/tests/test_linear_solvers.py +0 -11
warp/tests/test_mat.py +233 -79
warp/tests/test_mat_scalar_ops.py +4 -4
warp/tests/test_overwrite.py +0 -60
warp/tests/test_quat.py +67 -46
warp/tests/test_rand.py +44 -37
warp/tests/test_sparse.py +47 -6
warp/tests/test_spatial.py +75 -0
warp/tests/test_static.py +1 -1
warp/tests/test_utils.py +84 -4
warp/tests/test_vec.py +46 -34
warp/tests/tile/__init__.py +0 -0
warp/tests/{test_tile.py → tile/test_tile.py} +136 -51
warp/tests/{test_tile_load.py → tile/test_tile_load.py} +1 -1
warp/tests/{test_tile_mathdx.py → tile/test_tile_mathdx.py} +9 -6
warp/tests/{test_tile_mlp.py → tile/test_tile_mlp.py} +25 -14
warp/tests/{test_tile_reduce.py → tile/test_tile_reduce.py} +60 -1
warp/tests/{test_tile_view.py → tile/test_tile_view.py} +1 -1
warp/tests/unittest_serial.py +1 -0
warp/tests/unittest_suites.py +45 -59
warp/tests/unittest_utils.py +2 -1
warp/thirdparty/unittest_parallel.py +3 -1
warp/types.py +110 -658
warp/utils.py +137 -72
{warp_lang-1.6.2.dist-info → warp_lang-1.7.0.dist-info}/METADATA +29 -7
{warp_lang-1.6.2.dist-info → warp_lang-1.7.0.dist-info}/RECORD +172 -162
{warp_lang-1.6.2.dist-info → warp_lang-1.7.0.dist-info}/WHEEL +1 -1
warp/examples/optim/example_walker.py +0 -317
warp/native/cutlass_gemm.cpp +0 -43
warp/native/cutlass_gemm.cu +0 -382
warp/tests/test_matmul.py +0 -511
warp/tests/test_matmul_lite.py +0 -411
warp/tests/test_vbd.py +0 -386
warp/tests/unused_test_misc.py +0 -77
/warp/tests/{test_async.py → cuda/test_async.py} +0 -0
/warp/tests/{test_ipc.py → cuda/test_ipc.py} +0 -0
/warp/tests/{test_multigpu.py → cuda/test_multigpu.py} +0 -0
/warp/tests/{test_peer.py → cuda/test_peer.py} +0 -0
/warp/tests/{test_pinned.py → cuda/test_pinned.py} +0 -0
/warp/tests/{test_bvh.py → geometry/test_bvh.py} +0 -0
/warp/tests/{test_hash_grid.py → geometry/test_hash_grid.py} +0 -0
/warp/tests/{test_marching_cubes.py → geometry/test_marching_cubes.py} +0 -0
/warp/tests/{test_mesh.py → geometry/test_mesh.py} +0 -0
/warp/tests/{test_mesh_query_aabb.py → geometry/test_mesh_query_aabb.py} +0 -0
/warp/tests/{test_volume_write.py → geometry/test_volume_write.py} +0 -0
/warp/tests/{test_jax.py → interop/test_jax.py} +0 -0
/warp/tests/{test_paddle.py → interop/test_paddle.py} +0 -0
/warp/tests/{test_torch.py → interop/test_torch.py} +0 -0
/warp/tests/{flaky_test_sim_grad.py → sim/flaky_test_sim_grad.py} +0 -0
/warp/tests/{test_coloring.py → sim/test_coloring.py} +0 -0
/warp/tests/{test_sim_grad_bounce_linear.py → sim/test_sim_grad_bounce_linear.py} +0 -0
/warp/tests/{test_tile_shared_memory.py → tile/test_tile_shared_memory.py} +0 -0
{warp_lang-1.6.2.dist-info → warp_lang-1.7.0.dist-info/licenses}/LICENSE.md +0 -0
{warp_lang-1.6.2.dist-info → warp_lang-1.7.0.dist-info}/top_level.txt +0 -0

warp/native/tile_reduce.h CHANGED Viewed

@@ -24,6 +24,8 @@
 namespace wp
 {
+#if defined(__CUDA_ARCH__)
 template <typename T>
 inline CUDA_CALLABLE T warp_shuffle_down(T val, int offset, int mask)
 {
@@ -157,7 +159,39 @@ auto tile_reduce_impl(Op f, Tile& t)
     return output;
 }
-void adj_tile_reduce_impl()
+#else
+// CPU implementation
+template <typename Tile, typename Op>
+auto tile_reduce_impl(Op f, Tile& t)
+{
+   using T = typename Tile::Type;
+    auto input = t.copy_to_register();
+    auto output = tile_register_t<T, tile_layout_register_t<tile_shape_t<1>>>();
+   using Layout = typename decltype(input)::Layout;
+   T sum = input.data[0];
+    WP_PRAGMA_UNROLL
+    for (int i=1; i < Layout::NumRegs; ++i)
+    {
+        int linear = Layout::linear_from_register(i);
+        if (!Layout::valid(linear))
+            break;
+        sum = f(sum, input.data[i]);
+    }
+    output.data[0] = sum;
+    return output;
+}
+#endif // !defined(__CUDA_ARCH__)
+inline void adj_tile_reduce_impl()
 {
     // todo: general purpose reduction gradients not implemented
 }
@@ -180,16 +214,25 @@ void adj_tile_sum(Tile& t, Tile& adj_t, AdjTile& adj_ret)
 {
     using T = typename Tile::Type;
+#if !defined(__CUDA_ARCH__)
+    for (int i=0; i < Tile::Layout::Size; ++i)
+    {
+        adj_t(i) += adj_ret.data[0];
+    }
+#else
     // broadcast incoming adjoint to block
     WP_TILE_SHARED T scratch;
-    if (threadIdx.x == 0)
+    if (WP_TILE_THREAD_IDX == 0)
         scratch = adj_ret.data[0];
     WP_TILE_SYNC();
     // broadcast scalar across input dimensions (note zero strides)
-    auto adj_ret_reg = tile_shared_t<T, tile_layout_strided_t<typename Tile::Layout::Shape, tile_stride_t<0, 0>>>(&scratch, NULL).copy_to_register();
+    auto adj_ret_reg = tile_shared_t<T, tile_layout_strided_t<typename Tile::Layout::Shape, tile_stride_t<0, 0>>, false>(&scratch, nullptr).copy_to_register();
     adj_t.grad_add(adj_ret_reg);
+#endif
 }
 template <typename Tile>

warp/native/vec.h CHANGED Viewed

@@ -506,37 +506,98 @@ inline CUDA_CALLABLE void adj_indexref(vec_t<Length, Type>* v, int idx,
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE void augassign_add(vec_t<Length, Type>& v, int idx, Type value)
+inline CUDA_CALLABLE void add_inplace(vec_t<Length, Type>& v, int idx, Type value)
 {
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
     v[idx] += value;
 }
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE void adj_augassign_add(vec_t<Length, Type>& v, int idx, Type value,
+inline CUDA_CALLABLE void adj_add_inplace(vec_t<Length, Type>& v, int idx, Type value,
                                         vec_t<Length, Type>& adj_v, int adj_idx, Type& adj_value)
 {
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
     adj_value += adj_v[idx];
 }
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE void augassign_sub(vec_t<Length, Type>& v, int idx, Type value)
+inline CUDA_CALLABLE void sub_inplace(vec_t<Length, Type>& v, int idx, Type value)
 {
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
     v[idx] -= value;
 }
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE void adj_augassign_sub(vec_t<Length, Type>& v, int idx, Type value,
+inline CUDA_CALLABLE void adj_sub_inplace(vec_t<Length, Type>& v, int idx, Type value,
                                         vec_t<Length, Type>& adj_v, int adj_idx, Type& adj_value)
 {
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
     adj_value -= adj_v[idx];
 }
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE vec_t<Length, Type> assign(vec_t<Length, Type>& v, int idx, Type value)
+inline CUDA_CALLABLE void assign_inplace(vec_t<Length, Type>& v, int idx, Type value)
+{
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
+    v[idx] = value;
+}
+template<unsigned Length, typename Type>
+inline CUDA_CALLABLE void adj_assign_inplace(vec_t<Length, Type>& v, int idx, Type value, vec_t<Length, Type>& adj_v, int& adj_idx, Type& adj_value)
+{
+#ifndef NDEBUG
+    if (idx < 0 || idx >= Length)
+    {
+        printf("vec index %d out of bounds at %s %d\n", idx, __FILE__, __LINE__);
+        assert(0);
+    }
+#endif
+    adj_value += adj_v[idx];
+}
+template<unsigned Length, typename Type>
+inline CUDA_CALLABLE vec_t<Length, Type> assign_copy(vec_t<Length, Type>& v, int idx, Type value)
 {
 #ifndef NDEBUG
     if (idx < 0 || idx >= Length)
@@ -552,7 +613,7 @@ inline CUDA_CALLABLE vec_t<Length, Type> assign(vec_t<Length, Type>& v, int idx,
 }
 template<unsigned Length, typename Type>
-inline CUDA_CALLABLE void adj_assign(vec_t<Length, Type>& v, int idx, Type value, vec_t<Length, Type>& adj_v, int& adj_idx, Type& adj_value, const vec_t<Length, Type>& adj_ret)
+inline CUDA_CALLABLE void adj_assign_copy(vec_t<Length, Type>& v, int idx, Type value, vec_t<Length, Type>& adj_v, int& adj_idx, Type& adj_value, const vec_t<Length, Type>& adj_ret)
 {
 #ifndef NDEBUG
     if (idx < 0 || idx >= Length)
@@ -774,7 +835,7 @@ inline CUDA_CALLABLE vec_t<Length,Type> sign(vec_t<Length,Type> v)
 template<unsigned Length, typename Type>
 inline CUDA_CALLABLE void expect_near(const vec_t<Length, Type>& actual, const vec_t<Length, Type>& expected, const Type& tolerance)
 {
-    const Type diff(0);
+    Type diff(0);
     for(size_t i=0; i<Length; ++i)
     {
         diff = max(diff,abs(actual[i] - expected[i]));

warp/native/volume.cpp CHANGED Viewed

@@ -30,7 +30,7 @@ namespace
 struct VolumeDesc
 {
     // NanoVDB buffer either in device or host memory
-    void *buffer;
+    void* buffer;
     uint64_t size_in_bytes;
     bool owner; // whether the buffer should be deallocated when the volume is destroyed
@@ -38,23 +38,23 @@ struct VolumeDesc
     pnanovdb_tree_t tree_data;
     // Host-accessible version of the blind metadata (copy if GPU, alias if CPU)
-    pnanovdb_gridblindmetadata_t *blind_metadata;
+    pnanovdb_gridblindmetadata_t* blind_metadata;
     // CUDA context for this volume (NULL if CPU)
-    void *context;
+    void* context;
-    pnanovdb_buf_t as_pnano() const { return pnanovdb_make_buf(static_cast<uint32_t *>(buffer), size_in_bytes); }
+    pnanovdb_buf_t as_pnano() const { return pnanovdb_make_buf(static_cast<uint32_t*>(buffer), size_in_bytes); }
 };
 // Host-side volume descriptors. Maps each CPU/GPU volume buffer address (id) to a CPU desc
 std::map<uint64_t, VolumeDesc> g_volume_descriptors;
-bool volume_get_descriptor(uint64_t id, const VolumeDesc *&volumeDesc)
+bool volume_get_descriptor(uint64_t id, const VolumeDesc*& volumeDesc)
 {
     if (id == 0)
         return false;
-    const auto &iter = g_volume_descriptors.find(id);
+    const auto& iter = g_volume_descriptors.find(id);
     if (iter == g_volume_descriptors.end())
         return false;
     else
@@ -62,21 +62,21 @@ bool volume_get_descriptor(uint64_t id, const VolumeDesc *&volumeDesc)
     return true;
 }
-bool volume_exists(const void *id)
+bool volume_exists(const void* id)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     return volume_get_descriptor((uint64_t)id, volume);
 }
-void volume_add_descriptor(uint64_t id, VolumeDesc &&volumeDesc) { g_volume_descriptors[id] = std::move(volumeDesc); }
+void volume_add_descriptor(uint64_t id, VolumeDesc&& volumeDesc) { g_volume_descriptors[id] = std::move(volumeDesc); }
 void volume_rem_descriptor(uint64_t id) { g_volume_descriptors.erase(id); }
-void volume_set_map(nanovdb::Map &map, const float transform[9], const float translation[3])
+void volume_set_map(nanovdb::Map& map, const float transform[9], const float translation[3])
 {
     // Need to transpose as Map::set is transposing again
-    const mat_t<3, 3, double> transpose(transform[0], transform[3], transform[6], transform[1], transform[4], transform[7],
-                                  transform[2], transform[5], transform[8]);
+    const mat_t<3, 3, double> transpose(transform[0], transform[3], transform[6], transform[1], transform[4],
+                                        transform[7], transform[2], transform[5], transform[8]);
     const mat_t<3, 3, double> inv = inverse(transpose);
     map.set(transpose.data, inv.data, translation);
@@ -85,7 +85,7 @@ void volume_set_map(nanovdb::Map &map, const float transform[9], const float tra
 } // anonymous namespace
 // NB: buf must be a host pointer
-uint64_t volume_create_host(void *buf, uint64_t size, bool copy, bool owner)
+uint64_t volume_create_host(void* buf, uint64_t size, bool copy, bool owner)
 {
     if (size > 0 && size < sizeof(pnanovdb_grid_t) + sizeof(pnanovdb_tree_t))
         return 0; // This cannot be a valid NanoVDB grid with data
@@ -100,7 +100,7 @@ uint64_t volume_create_host(void *buf, uint64_t size, bool copy, bool owner)
     volume.context = NULL;
     memcpy_h2h(&volume.grid_data, buf, sizeof(pnanovdb_grid_t));
-    memcpy_h2h(&volume.tree_data, (pnanovdb_grid_t *)buf + 1, sizeof(pnanovdb_tree_t));
+    memcpy_h2h(&volume.tree_data, (pnanovdb_grid_t*)buf + 1, sizeof(pnanovdb_tree_t));
     if (volume.grid_data.magic != PNANOVDB_MAGIC_NUMBER && volume.grid_data.magic != PNANOVDB_MAGIC_GRID)
         return 0;
@@ -125,8 +125,8 @@ uint64_t volume_create_host(void *buf, uint64_t size, bool copy, bool owner)
     }
     // Alias blind metadata
-    volume.blind_metadata = reinterpret_cast<pnanovdb_gridblindmetadata_t *>(static_cast<uint8_t *>(volume.buffer) +
-                                                                             volume.grid_data.blind_metadata_offset);
+    volume.blind_metadata = reinterpret_cast<pnanovdb_gridblindmetadata_t*>(static_cast<uint8_t*>(volume.buffer) +
+                                                                            volume.grid_data.blind_metadata_offset);
     uint64_t id = (uint64_t)volume.buffer;
@@ -136,7 +136,7 @@ uint64_t volume_create_host(void *buf, uint64_t size, bool copy, bool owner)
 }
 // NB: buf must be a pointer on the same device
-uint64_t volume_create_device(void *context, void *buf, uint64_t size, bool copy, bool owner)
+uint64_t volume_create_device(void* context, void* buf, uint64_t size, bool copy, bool owner)
 {
     if (size > 0 && size < sizeof(pnanovdb_grid_t) + sizeof(pnanovdb_tree_t))
         return 0; // This cannot be a valid NanoVDB grid with data
@@ -153,7 +153,7 @@ uint64_t volume_create_device(void *context, void *buf, uint64_t size, bool copy
     volume.context = context ? context : cuda_context_get_current();
     memcpy_d2h(WP_CURRENT_CONTEXT, &volume.grid_data, buf, sizeof(pnanovdb_grid_t));
-    memcpy_d2h(WP_CURRENT_CONTEXT, &volume.tree_data, (pnanovdb_grid_t *)buf + 1, sizeof(pnanovdb_tree_t));
+    memcpy_d2h(WP_CURRENT_CONTEXT, &volume.tree_data, (pnanovdb_grid_t*)buf + 1, sizeof(pnanovdb_tree_t));
     // no sync needed since the above copies are to pageable memory
     if (volume.grid_data.magic != PNANOVDB_MAGIC_NUMBER && volume.grid_data.magic != PNANOVDB_MAGIC_GRID)
@@ -180,9 +180,9 @@ uint64_t volume_create_device(void *context, void *buf, uint64_t size, bool copy
     // Make blind metadata accessible on host
     const uint64_t blindmetadata_size = volume.grid_data.blind_metadata_count * sizeof(pnanovdb_gridblindmetadata_t);
-    volume.blind_metadata = static_cast<pnanovdb_gridblindmetadata_t *>(alloc_pinned(blindmetadata_size));
+    volume.blind_metadata = static_cast<pnanovdb_gridblindmetadata_t*>(alloc_pinned(blindmetadata_size));
     memcpy_d2h(WP_CURRENT_CONTEXT, volume.blind_metadata,
-               static_cast<uint8_t *>(volume.buffer) + volume.grid_data.blind_metadata_offset, blindmetadata_size);
+               static_cast<uint8_t*>(volume.buffer) + volume.grid_data.blind_metadata_offset, blindmetadata_size);
     uint64_t id = (uint64_t)volume.buffer;
     volume_add_descriptor(id, std::move(volume));
@@ -190,12 +190,12 @@ uint64_t volume_create_device(void *context, void *buf, uint64_t size, bool copy
     return id;
 }
-void volume_get_buffer_info(uint64_t id, void **buf, uint64_t *size)
+void volume_get_buffer_info(uint64_t id, void** buf, uint64_t* size)
 {
     *buf = 0;
     *size = 0;
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         *buf = volume->buffer;
@@ -203,11 +203,11 @@ void volume_get_buffer_info(uint64_t id, void **buf, uint64_t *size)
     }
 }
-void volume_get_voxel_size(uint64_t id, float *dx, float *dy, float *dz)
+void volume_get_voxel_size(uint64_t id, float* dx, float* dy, float* dz)
 {
     *dx = *dx = *dz = 0.0f;
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         *dx = (float)volume->grid_data.voxel_size[0];
@@ -216,12 +216,12 @@ void volume_get_voxel_size(uint64_t id, float *dx, float *dy, float *dz)
     }
 }
-void volume_get_tile_and_voxel_count(uint64_t id, uint32_t &tile_count, uint64_t &voxel_count)
+void volume_get_tile_and_voxel_count(uint64_t id, uint32_t& tile_count, uint64_t& voxel_count)
 {
     tile_count = 0;
     voxel_count = 0;
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         tile_count = volume->tree_data.node_count_leaf;
@@ -242,13 +242,13 @@ void volume_get_tile_and_voxel_count(uint64_t id, uint32_t &tile_count, uint64_t
     }
 }
-const char *volume_get_grid_info(uint64_t id, uint64_t *grid_size, uint32_t *grid_index, uint32_t *grid_count,
+const char* volume_get_grid_info(uint64_t id, uint64_t* grid_size, uint32_t* grid_index, uint32_t* grid_count,
                                  float translation[3], float transform[9], char type_str[16])
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
-        const pnanovdb_grid_t &grid_data = volume->grid_data;
+        const pnanovdb_grid_t& grid_data = volume->grid_data;
         *grid_count = grid_data.grid_count;
         *grid_index = grid_data.grid_index;
         *grid_size = grid_data.grid_size;
@@ -257,7 +257,7 @@ const char *volume_get_grid_info(uint64_t id, uint64_t *grid_size, uint32_t *gri
         memcpy(transform, grid_data.map.matf, sizeof(grid_data.map.matf));
         nanovdb::toStr(type_str, static_cast<nanovdb::GridType>(grid_data.grid_type));
-        return (const char *)grid_data.grid_name;
+        return (const char*)grid_data.grid_name;
     }
     *grid_size = 0;
@@ -270,7 +270,7 @@ const char *volume_get_grid_info(uint64_t id, uint64_t *grid_size, uint32_t *gri
 uint32_t volume_get_blind_data_count(uint64_t id)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         return volume->grid_data.blind_metadata_count;
@@ -278,20 +278,20 @@ uint32_t volume_get_blind_data_count(uint64_t id)
     return 0;
 }
-const char *volume_get_blind_data_info(uint64_t id, uint32_t data_index, void **buf, uint64_t *value_count,
-                                       uint32_t *value_size, char type_str[16])
+const char* volume_get_blind_data_info(uint64_t id, uint32_t data_index, void** buf, uint64_t* value_count,
+                                       uint32_t* value_size, char type_str[16])
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume) && data_index < volume->grid_data.blind_metadata_count)
     {
-        const pnanovdb_gridblindmetadata_t &metadata = volume->blind_metadata[data_index];
+        const pnanovdb_gridblindmetadata_t& metadata = volume->blind_metadata[data_index];
         *value_count = metadata.value_count;
         *value_size = metadata.value_size;
         nanovdb::toStr(type_str, static_cast<nanovdb::GridType>(metadata.data_type));
-        *buf = static_cast<uint8_t *>(volume->buffer) + volume->grid_data.blind_metadata_offset +
+        *buf = static_cast<uint8_t*>(volume->buffer) + volume->grid_data.blind_metadata_offset +
                data_index * sizeof(pnanovdb_gridblindmetadata_t) + metadata.data_offset;
-        return (const char *)metadata.name;
+        return (const char*)metadata.name;
     }
     *buf = nullptr;
     *value_count = 0;
@@ -300,16 +300,16 @@ const char *volume_get_blind_data_info(uint64_t id, uint32_t data_index, void **
     return nullptr;
 }
-void volume_get_tiles_host(uint64_t id, void *buf)
+void volume_get_tiles_host(uint64_t id, void* buf)
 {
     static constexpr uint32_t MASK = (1u << 3u) - 1u; // mask for bit operations
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         const uint32_t leaf_count = volume->tree_data.node_count_leaf;
-        pnanovdb_coord_t *leaf_coords = static_cast<pnanovdb_coord_t *>(buf);
+        pnanovdb_coord_t* leaf_coords = static_cast<pnanovdb_coord_t*>(buf);
         const uint64_t first_leaf =
             (uint64_t)volume->buffer + sizeof(pnanovdb_grid_t) + volume->tree_data.node_offset_leaf;
@@ -325,16 +325,16 @@ void volume_get_tiles_host(uint64_t id, void *buf)
     }
 }
-void volume_get_voxels_host(uint64_t id, void *buf)
+void volume_get_voxels_host(uint64_t id, void* buf)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         uint32_t leaf_count;
         uint64_t voxel_count;
         volume_get_tile_and_voxel_count(id, leaf_count, voxel_count);
-        pnanovdb_coord_t *voxel_coords = static_cast<pnanovdb_coord_t *>(buf);
+        pnanovdb_coord_t* voxel_coords = static_cast<pnanovdb_coord_t*>(buf);
         const pnanovdb_buf_t pnano_buf = volume->as_pnano();
         for (uint32_t i = 0; i < leaf_count; ++i)
@@ -363,7 +363,7 @@ void volume_get_voxels_host(uint64_t id, void *buf)
 void volume_destroy_host(uint64_t id)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         if (volume->owner)
@@ -376,7 +376,7 @@ void volume_destroy_host(uint64_t id)
 void volume_destroy_device(uint64_t id)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         ContextGuard guard(volume->context);
@@ -391,52 +391,35 @@ void volume_destroy_device(uint64_t id)
 #if WP_ENABLE_CUDA
-uint64_t volume_f_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, float bg_value)
+uint64_t volume_from_tiles_device(void* context, void* points, int num_points, float transform[9], float translation[3],
+                                  bool points_in_world_space, const void* value_ptr, uint32_t value_size,
+                                  const char* value_type)
 {
-    nanovdb::FloatGrid *grid;
-    size_t gridSize;
-    BuildGridParams<float> params;
-    params.background_value = bg_value;
-    volume_set_map(params.map, transform, translation);
-    build_grid_from_points(grid, gridSize, points, num_points, points_in_world_space, params);
-    return volume_create_device(context, grid, gridSize, false, true);
-}
-uint64_t volume_v_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, float bg_value[3])
-{
-    nanovdb::Vec3fGrid *grid;
-    size_t gridSize;
-    BuildGridParams<nanovdb::Vec3f> params;
-    params.background_value = nanovdb::Vec3f{bg_value[0], bg_value[1], bg_value[2]};
-    volume_set_map(params.map, transform, translation);
-    build_grid_from_points(grid, gridSize, points, num_points, points_in_world_space, params);
-    return volume_create_device(context, grid, gridSize, false, true);
-}
-uint64_t volume_i_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, int bg_value)
-{
-    nanovdb::Int32Grid *grid;
-    size_t gridSize;
-    BuildGridParams<int32_t> params;
-    params.background_value = (int32_t)(bg_value);
-    volume_set_map(params.map, transform, translation);
+    char gridTypeStr[12];
+#define EXPAND_BUILDER_TYPE(type)                                                                                      \
+    nanovdb::toStr(gridTypeStr, nanovdb::toGridType<type>());                                                          \
+    if (strncmp(gridTypeStr, value_type, sizeof(gridTypeStr)) == 0)                                                    \
+    {                                                                                                                  \
+        BuildGridParams<type> params;                                                                                  \
+        memcpy(&params.background_value, value_ptr, value_size);                                                       \
+        volume_set_map(params.map, transform, translation);                                                            \
+        size_t gridSize;                                                                                               \
+        nanovdb::Grid<nanovdb::NanoTree<type>>* grid;                                                                  \
+        build_grid_from_points(grid, gridSize, points, num_points, points_in_world_space, params);                     \
+        return volume_create_device(context, grid, gridSize, false, true);                                             \
+    }
-    build_grid_from_points(grid, gridSize, points, num_points, points_in_world_space, params);
+    WP_VOLUME_BUILDER_INSTANTIATE_TYPES
+#undef EXPAND_BUILDER_TYPE
-    return volume_create_device(context, grid, gridSize, false, true);
+    return 0;
 }
-uint64_t volume_index_from_tiles_device(void *context, void *points, int num_points, float transform[9],
+uint64_t volume_index_from_tiles_device(void* context, void* points, int num_points, float transform[9],
                                         float translation[3], bool points_in_world_space)
 {
-    nanovdb::IndexGrid *grid;
+    nanovdb::IndexGrid* grid;
     size_t gridSize;
     BuildGridParams<nanovdb::ValueIndex> params;
     volume_set_map(params.map, transform, translation);
@@ -446,10 +429,10 @@ uint64_t volume_index_from_tiles_device(void *context, void *points, int num_poi
     return volume_create_device(context, grid, gridSize, false, true);
 }
-uint64_t volume_from_active_voxels_device(void *context, void *points, int num_points, float transform[9],
+uint64_t volume_from_active_voxels_device(void* context, void* points, int num_points, float transform[9],
                                           float translation[3], bool points_in_world_space)
 {
-    nanovdb::OnIndexGrid *grid;
+    nanovdb::OnIndexGrid* grid;
     size_t gridSize;
     BuildGridParams<nanovdb::ValueOnIndex> params;
     volume_set_map(params.map, transform, translation);
@@ -459,71 +442,60 @@ uint64_t volume_from_active_voxels_device(void *context, void *points, int num_p
     return volume_create_device(context, grid, gridSize, false, true);
 }
-void launch_get_leaf_coords(void *context, const uint32_t leaf_count, pnanovdb_coord_t *leaf_coords,
+void launch_get_leaf_coords(void* context, const uint32_t leaf_count, pnanovdb_coord_t* leaf_coords,
                             pnanovdb_buf_t buf);
-void launch_get_voxel_coords(void *context, const uint32_t leaf_count, const uint32_t voxel_count,
-                             pnanovdb_coord_t *voxel_coords, pnanovdb_buf_t buf);
+void launch_get_voxel_coords(void* context, const uint32_t leaf_count, const uint32_t voxel_count,
+                             pnanovdb_coord_t* voxel_coords, pnanovdb_buf_t buf);
-void volume_get_tiles_device(uint64_t id, void *buf)
+void volume_get_tiles_device(uint64_t id, void* buf)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         const uint32_t leaf_count = volume->tree_data.node_count_leaf;
-        pnanovdb_coord_t *leaf_coords = static_cast<pnanovdb_coord_t *>(buf);
+        pnanovdb_coord_t* leaf_coords = static_cast<pnanovdb_coord_t*>(buf);
         launch_get_leaf_coords(volume->context, leaf_count, leaf_coords, volume->as_pnano());
     }
 }
-void volume_get_voxels_device(uint64_t id, void *buf)
+void volume_get_voxels_device(uint64_t id, void* buf)
 {
-    const VolumeDesc *volume;
+    const VolumeDesc* volume;
     if (volume_get_descriptor(id, volume))
     {
         uint32_t leaf_count;
         uint64_t voxel_count;
         volume_get_tile_and_voxel_count(id, leaf_count, voxel_count);
-        pnanovdb_coord_t *voxel_coords = static_cast<pnanovdb_coord_t *>(buf);
+        pnanovdb_coord_t* voxel_coords = static_cast<pnanovdb_coord_t*>(buf);
         launch_get_voxel_coords(volume->context, leaf_count, voxel_count, voxel_coords, volume->as_pnano());
     }
 }
 #else
 // stubs for non-CUDA platforms
-uint64_t volume_f_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, float bg_value)
-{
-    return 0;
-}
-uint64_t volume_v_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, float bg_value[3])
-{
-    return 0;
-}
-uint64_t volume_i_from_tiles_device(void *context, void *points, int num_points, float transform[9],
-                                    float translation[3], bool points_in_world_space, int bg_value)
+uint64_t volume_from_tiles_device(void* context, void* points, int num_points, float transform[9],
+                                  float translation[3], bool points_in_world_space, const void* value_ptr, uint32_t value_size,
+                                  const char* value_type)
 {
     return 0;
 }
-uint64_t volume_index_from_tiles_device(void *context, void *points, int num_points, float transform[9],
+uint64_t volume_index_from_tiles_device(void* context, void* points, int num_points, float transform[9],
                                         float translation[3], bool points_in_world_space)
 {
     return 0;
 }
-uint64_t volume_from_active_voxels_device(void *context, void *points, int num_points, float transform[9],
+uint64_t volume_from_active_voxels_device(void* context, void* points, int num_points, float transform[9],
                                           float translation[3], bool points_in_world_space)
 {
     return 0;
 }
-void volume_get_tiles_device(uint64_t id, void *buf) {}
+void volume_get_tiles_device(uint64_t id, void* buf) {}
-void volume_get_voxels_device(uint64_t id, void *buf) {}
+void volume_get_voxels_device(uint64_t id, void* buf) {}
 #endif