PyPI - warp-lang - Versions diffs - 1.7.0__py3-none-manylinux_2_34_aarch64.whl - Mend

warp-lang 1.7.0__py3-none-manylinux_2_34_aarch64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of warp-lang might be problematic. Click here for more details.

Files changed (429) hide show

warp/__init__.py +139 -0
warp/__init__.pyi +1 -0
warp/autograd.py +1142 -0
warp/bin/warp-clang.so +0 -0
warp/bin/warp.so +0 -0
warp/build.py +557 -0
warp/build_dll.py +405 -0
warp/builtins.py +6855 -0
warp/codegen.py +3969 -0
warp/config.py +158 -0
warp/constants.py +57 -0
warp/context.py +6812 -0
warp/dlpack.py +462 -0
warp/examples/__init__.py +24 -0
warp/examples/assets/bear.usd +0 -0
warp/examples/assets/bunny.usd +0 -0
warp/examples/assets/cartpole.urdf +110 -0
warp/examples/assets/crazyflie.usd +0 -0
warp/examples/assets/cube.usd +0 -0
warp/examples/assets/nonuniform.usd +0 -0
warp/examples/assets/nv_ant.xml +92 -0
warp/examples/assets/nv_humanoid.xml +183 -0
warp/examples/assets/nvidia_logo.png +0 -0
warp/examples/assets/pixel.jpg +0 -0
warp/examples/assets/quadruped.urdf +268 -0
warp/examples/assets/rocks.nvdb +0 -0
warp/examples/assets/rocks.usd +0 -0
warp/examples/assets/sphere.usd +0 -0
warp/examples/assets/square_cloth.usd +0 -0
warp/examples/benchmarks/benchmark_api.py +389 -0
warp/examples/benchmarks/benchmark_cloth.py +296 -0
warp/examples/benchmarks/benchmark_cloth_cupy.py +96 -0
warp/examples/benchmarks/benchmark_cloth_jax.py +105 -0
warp/examples/benchmarks/benchmark_cloth_numba.py +161 -0
warp/examples/benchmarks/benchmark_cloth_numpy.py +85 -0
warp/examples/benchmarks/benchmark_cloth_paddle.py +94 -0
warp/examples/benchmarks/benchmark_cloth_pytorch.py +94 -0
warp/examples/benchmarks/benchmark_cloth_taichi.py +120 -0
warp/examples/benchmarks/benchmark_cloth_warp.py +153 -0
warp/examples/benchmarks/benchmark_gemm.py +164 -0
warp/examples/benchmarks/benchmark_interop_paddle.py +166 -0
warp/examples/benchmarks/benchmark_interop_torch.py +166 -0
warp/examples/benchmarks/benchmark_launches.py +301 -0
warp/examples/benchmarks/benchmark_tile_load_store.py +103 -0
warp/examples/browse.py +37 -0
warp/examples/core/example_cupy.py +86 -0
warp/examples/core/example_dem.py +241 -0
warp/examples/core/example_fluid.py +299 -0
warp/examples/core/example_graph_capture.py +150 -0
warp/examples/core/example_marching_cubes.py +194 -0
warp/examples/core/example_mesh.py +180 -0
warp/examples/core/example_mesh_intersect.py +211 -0
warp/examples/core/example_nvdb.py +182 -0
warp/examples/core/example_raycast.py +111 -0
warp/examples/core/example_raymarch.py +205 -0
warp/examples/core/example_render_opengl.py +193 -0
warp/examples/core/example_sample_mesh.py +300 -0
warp/examples/core/example_sph.py +411 -0
warp/examples/core/example_torch.py +211 -0
warp/examples/core/example_wave.py +269 -0
warp/examples/fem/example_adaptive_grid.py +286 -0
warp/examples/fem/example_apic_fluid.py +423 -0
warp/examples/fem/example_burgers.py +261 -0
warp/examples/fem/example_convection_diffusion.py +178 -0
warp/examples/fem/example_convection_diffusion_dg.py +204 -0
warp/examples/fem/example_deformed_geometry.py +172 -0
warp/examples/fem/example_diffusion.py +196 -0
warp/examples/fem/example_diffusion_3d.py +225 -0
warp/examples/fem/example_diffusion_mgpu.py +220 -0
warp/examples/fem/example_distortion_energy.py +228 -0
warp/examples/fem/example_magnetostatics.py +240 -0
warp/examples/fem/example_mixed_elasticity.py +291 -0
warp/examples/fem/example_navier_stokes.py +261 -0
warp/examples/fem/example_nonconforming_contact.py +298 -0
warp/examples/fem/example_stokes.py +213 -0
warp/examples/fem/example_stokes_transfer.py +262 -0
warp/examples/fem/example_streamlines.py +352 -0
warp/examples/fem/utils.py +1000 -0
warp/examples/interop/example_jax_callable.py +116 -0
warp/examples/interop/example_jax_ffi_callback.py +132 -0
warp/examples/interop/example_jax_kernel.py +205 -0
warp/examples/optim/example_bounce.py +266 -0
warp/examples/optim/example_cloth_throw.py +228 -0
warp/examples/optim/example_diffray.py +561 -0
warp/examples/optim/example_drone.py +870 -0
warp/examples/optim/example_fluid_checkpoint.py +497 -0
warp/examples/optim/example_inverse_kinematics.py +182 -0
warp/examples/optim/example_inverse_kinematics_torch.py +191 -0
warp/examples/optim/example_softbody_properties.py +400 -0
warp/examples/optim/example_spring_cage.py +245 -0
warp/examples/optim/example_trajectory.py +227 -0
warp/examples/sim/example_cartpole.py +143 -0
warp/examples/sim/example_cloth.py +225 -0
warp/examples/sim/example_cloth_self_contact.py +322 -0
warp/examples/sim/example_granular.py +130 -0
warp/examples/sim/example_granular_collision_sdf.py +202 -0
warp/examples/sim/example_jacobian_ik.py +244 -0
warp/examples/sim/example_particle_chain.py +124 -0
warp/examples/sim/example_quadruped.py +203 -0
warp/examples/sim/example_rigid_chain.py +203 -0
warp/examples/sim/example_rigid_contact.py +195 -0
warp/examples/sim/example_rigid_force.py +133 -0
warp/examples/sim/example_rigid_gyroscopic.py +115 -0
warp/examples/sim/example_rigid_soft_contact.py +140 -0
warp/examples/sim/example_soft_body.py +196 -0
warp/examples/tile/example_tile_cholesky.py +87 -0
warp/examples/tile/example_tile_convolution.py +66 -0
warp/examples/tile/example_tile_fft.py +55 -0
warp/examples/tile/example_tile_filtering.py +113 -0
warp/examples/tile/example_tile_matmul.py +85 -0
warp/examples/tile/example_tile_mlp.py +383 -0
warp/examples/tile/example_tile_nbody.py +199 -0
warp/examples/tile/example_tile_walker.py +327 -0
warp/fabric.py +355 -0
warp/fem/__init__.py +106 -0
warp/fem/adaptivity.py +508 -0
warp/fem/cache.py +572 -0
warp/fem/dirichlet.py +202 -0
warp/fem/domain.py +411 -0
warp/fem/field/__init__.py +125 -0
warp/fem/field/field.py +619 -0
warp/fem/field/nodal_field.py +326 -0
warp/fem/field/restriction.py +37 -0
warp/fem/field/virtual.py +848 -0
warp/fem/geometry/__init__.py +32 -0
warp/fem/geometry/adaptive_nanogrid.py +857 -0
warp/fem/geometry/closest_point.py +84 -0
warp/fem/geometry/deformed_geometry.py +221 -0
warp/fem/geometry/element.py +776 -0
warp/fem/geometry/geometry.py +362 -0
warp/fem/geometry/grid_2d.py +392 -0
warp/fem/geometry/grid_3d.py +452 -0
warp/fem/geometry/hexmesh.py +911 -0
warp/fem/geometry/nanogrid.py +571 -0
warp/fem/geometry/partition.py +389 -0
warp/fem/geometry/quadmesh.py +663 -0
warp/fem/geometry/tetmesh.py +855 -0
warp/fem/geometry/trimesh.py +806 -0
warp/fem/integrate.py +2335 -0
warp/fem/linalg.py +419 -0
warp/fem/operator.py +293 -0
warp/fem/polynomial.py +229 -0
warp/fem/quadrature/__init__.py +17 -0
warp/fem/quadrature/pic_quadrature.py +299 -0
warp/fem/quadrature/quadrature.py +591 -0
warp/fem/space/__init__.py +228 -0
warp/fem/space/basis_function_space.py +468 -0
warp/fem/space/basis_space.py +667 -0
warp/fem/space/dof_mapper.py +251 -0
warp/fem/space/function_space.py +309 -0
warp/fem/space/grid_2d_function_space.py +177 -0
warp/fem/space/grid_3d_function_space.py +227 -0
warp/fem/space/hexmesh_function_space.py +257 -0
warp/fem/space/nanogrid_function_space.py +201 -0
warp/fem/space/partition.py +367 -0
warp/fem/space/quadmesh_function_space.py +223 -0
warp/fem/space/restriction.py +179 -0
warp/fem/space/shape/__init__.py +143 -0
warp/fem/space/shape/cube_shape_function.py +1105 -0
warp/fem/space/shape/shape_function.py +133 -0
warp/fem/space/shape/square_shape_function.py +926 -0
warp/fem/space/shape/tet_shape_function.py +834 -0
warp/fem/space/shape/triangle_shape_function.py +672 -0
warp/fem/space/tetmesh_function_space.py +271 -0
warp/fem/space/topology.py +424 -0
warp/fem/space/trimesh_function_space.py +194 -0
warp/fem/types.py +99 -0
warp/fem/utils.py +420 -0
warp/jax.py +187 -0
warp/jax_experimental/__init__.py +16 -0
warp/jax_experimental/custom_call.py +351 -0
warp/jax_experimental/ffi.py +698 -0
warp/jax_experimental/xla_ffi.py +602 -0
warp/math.py +244 -0
warp/native/array.h +1145 -0
warp/native/builtin.h +1800 -0
warp/native/bvh.cpp +492 -0
warp/native/bvh.cu +791 -0
warp/native/bvh.h +554 -0
warp/native/clang/clang.cpp +536 -0
warp/native/coloring.cpp +613 -0
warp/native/crt.cpp +51 -0
warp/native/crt.h +362 -0
warp/native/cuda_crt.h +1058 -0
warp/native/cuda_util.cpp +646 -0
warp/native/cuda_util.h +307 -0
warp/native/error.cpp +77 -0
warp/native/error.h +36 -0
warp/native/exports.h +1878 -0
warp/native/fabric.h +245 -0
warp/native/hashgrid.cpp +311 -0
warp/native/hashgrid.cu +87 -0
warp/native/hashgrid.h +240 -0
warp/native/initializer_array.h +41 -0
warp/native/intersect.h +1230 -0
warp/native/intersect_adj.h +375 -0
warp/native/intersect_tri.h +339 -0
warp/native/marching.cpp +19 -0
warp/native/marching.cu +514 -0
warp/native/marching.h +19 -0
warp/native/mat.h +2220 -0
warp/native/mathdx.cpp +87 -0
warp/native/matnn.h +343 -0
warp/native/mesh.cpp +266 -0
warp/native/mesh.cu +404 -0
warp/native/mesh.h +1980 -0
warp/native/nanovdb/GridHandle.h +366 -0
warp/native/nanovdb/HostBuffer.h +590 -0
warp/native/nanovdb/NanoVDB.h +6624 -0
warp/native/nanovdb/PNanoVDB.h +3390 -0
warp/native/noise.h +859 -0
warp/native/quat.h +1371 -0
warp/native/rand.h +342 -0
warp/native/range.h +139 -0
warp/native/reduce.cpp +174 -0
warp/native/reduce.cu +364 -0
warp/native/runlength_encode.cpp +79 -0
warp/native/runlength_encode.cu +61 -0
warp/native/scan.cpp +47 -0
warp/native/scan.cu +53 -0
warp/native/scan.h +23 -0
warp/native/solid_angle.h +466 -0
warp/native/sort.cpp +251 -0
warp/native/sort.cu +277 -0
warp/native/sort.h +33 -0
warp/native/sparse.cpp +378 -0
warp/native/sparse.cu +524 -0
warp/native/spatial.h +657 -0
warp/native/svd.h +702 -0
warp/native/temp_buffer.h +46 -0
warp/native/tile.h +2584 -0
warp/native/tile_reduce.h +264 -0
warp/native/vec.h +1426 -0
warp/native/volume.cpp +501 -0
warp/native/volume.cu +67 -0
warp/native/volume.h +969 -0
warp/native/volume_builder.cu +477 -0
warp/native/volume_builder.h +52 -0
warp/native/volume_impl.h +70 -0
warp/native/warp.cpp +1082 -0
warp/native/warp.cu +3636 -0
warp/native/warp.h +381 -0
warp/optim/__init__.py +17 -0
warp/optim/adam.py +163 -0
warp/optim/linear.py +1137 -0
warp/optim/sgd.py +112 -0
warp/paddle.py +407 -0
warp/render/__init__.py +18 -0
warp/render/render_opengl.py +3518 -0
warp/render/render_usd.py +784 -0
warp/render/utils.py +160 -0
warp/sim/__init__.py +65 -0
warp/sim/articulation.py +793 -0
warp/sim/collide.py +2395 -0
warp/sim/graph_coloring.py +300 -0
warp/sim/import_mjcf.py +790 -0
warp/sim/import_snu.py +227 -0
warp/sim/import_urdf.py +579 -0
warp/sim/import_usd.py +894 -0
warp/sim/inertia.py +324 -0
warp/sim/integrator.py +242 -0
warp/sim/integrator_euler.py +1997 -0
warp/sim/integrator_featherstone.py +2101 -0
warp/sim/integrator_vbd.py +2048 -0
warp/sim/integrator_xpbd.py +3292 -0
warp/sim/model.py +4791 -0
warp/sim/particles.py +121 -0
warp/sim/render.py +427 -0
warp/sim/utils.py +428 -0
warp/sparse.py +2057 -0
warp/stubs.py +3333 -0
warp/tape.py +1203 -0
warp/tests/__init__.py +1 -0
warp/tests/__main__.py +4 -0
warp/tests/assets/curlnoise_golden.npy +0 -0
warp/tests/assets/mlp_golden.npy +0 -0
warp/tests/assets/pixel.npy +0 -0
warp/tests/assets/pnoise_golden.npy +0 -0
warp/tests/assets/spiky.usd +0 -0
warp/tests/assets/test_grid.nvdb +0 -0
warp/tests/assets/test_index_grid.nvdb +0 -0
warp/tests/assets/test_int32_grid.nvdb +0 -0
warp/tests/assets/test_vec_grid.nvdb +0 -0
warp/tests/assets/torus.nvdb +0 -0
warp/tests/assets/torus.usda +105 -0
warp/tests/aux_test_class_kernel.py +34 -0
warp/tests/aux_test_compile_consts_dummy.py +18 -0
warp/tests/aux_test_conditional_unequal_types_kernels.py +29 -0
warp/tests/aux_test_dependent.py +29 -0
warp/tests/aux_test_grad_customs.py +29 -0
warp/tests/aux_test_instancing_gc.py +26 -0
warp/tests/aux_test_module_unload.py +23 -0
warp/tests/aux_test_name_clash1.py +40 -0
warp/tests/aux_test_name_clash2.py +40 -0
warp/tests/aux_test_reference.py +9 -0
warp/tests/aux_test_reference_reference.py +8 -0
warp/tests/aux_test_square.py +16 -0
warp/tests/aux_test_unresolved_func.py +22 -0
warp/tests/aux_test_unresolved_symbol.py +22 -0
warp/tests/cuda/__init__.py +0 -0
warp/tests/cuda/test_async.py +676 -0
warp/tests/cuda/test_ipc.py +124 -0
warp/tests/cuda/test_mempool.py +233 -0
warp/tests/cuda/test_multigpu.py +169 -0
warp/tests/cuda/test_peer.py +139 -0
warp/tests/cuda/test_pinned.py +84 -0
warp/tests/cuda/test_streams.py +634 -0
warp/tests/geometry/__init__.py +0 -0
warp/tests/geometry/test_bvh.py +200 -0
warp/tests/geometry/test_hash_grid.py +221 -0
warp/tests/geometry/test_marching_cubes.py +74 -0
warp/tests/geometry/test_mesh.py +316 -0
warp/tests/geometry/test_mesh_query_aabb.py +399 -0
warp/tests/geometry/test_mesh_query_point.py +932 -0
warp/tests/geometry/test_mesh_query_ray.py +311 -0
warp/tests/geometry/test_volume.py +1103 -0
warp/tests/geometry/test_volume_write.py +346 -0
warp/tests/interop/__init__.py +0 -0
warp/tests/interop/test_dlpack.py +729 -0
warp/tests/interop/test_jax.py +371 -0
warp/tests/interop/test_paddle.py +800 -0
warp/tests/interop/test_torch.py +1001 -0
warp/tests/run_coverage_serial.py +39 -0
warp/tests/sim/__init__.py +0 -0
warp/tests/sim/disabled_kinematics.py +244 -0
warp/tests/sim/flaky_test_sim_grad.py +290 -0
warp/tests/sim/test_collision.py +604 -0
warp/tests/sim/test_coloring.py +258 -0
warp/tests/sim/test_model.py +224 -0
warp/tests/sim/test_sim_grad_bounce_linear.py +212 -0
warp/tests/sim/test_sim_kinematics.py +98 -0
warp/tests/sim/test_vbd.py +597 -0
warp/tests/test_adam.py +163 -0
warp/tests/test_arithmetic.py +1096 -0
warp/tests/test_array.py +2972 -0
warp/tests/test_array_reduce.py +156 -0
warp/tests/test_assert.py +250 -0
warp/tests/test_atomic.py +153 -0
warp/tests/test_bool.py +220 -0
warp/tests/test_builtins_resolution.py +1298 -0
warp/tests/test_closest_point_edge_edge.py +327 -0
warp/tests/test_codegen.py +810 -0
warp/tests/test_codegen_instancing.py +1495 -0
warp/tests/test_compile_consts.py +215 -0
warp/tests/test_conditional.py +252 -0
warp/tests/test_context.py +42 -0
warp/tests/test_copy.py +238 -0
warp/tests/test_ctypes.py +638 -0
warp/tests/test_dense.py +73 -0
warp/tests/test_devices.py +97 -0
warp/tests/test_examples.py +482 -0
warp/tests/test_fabricarray.py +996 -0
warp/tests/test_fast_math.py +74 -0
warp/tests/test_fem.py +2003 -0
warp/tests/test_fp16.py +136 -0
warp/tests/test_func.py +454 -0
warp/tests/test_future_annotations.py +98 -0
warp/tests/test_generics.py +656 -0
warp/tests/test_grad.py +893 -0
warp/tests/test_grad_customs.py +339 -0
warp/tests/test_grad_debug.py +341 -0
warp/tests/test_implicit_init.py +411 -0
warp/tests/test_import.py +45 -0
warp/tests/test_indexedarray.py +1140 -0
warp/tests/test_intersect.py +73 -0
warp/tests/test_iter.py +76 -0
warp/tests/test_large.py +177 -0
warp/tests/test_launch.py +411 -0
warp/tests/test_lerp.py +151 -0
warp/tests/test_linear_solvers.py +193 -0
warp/tests/test_lvalue.py +427 -0
warp/tests/test_mat.py +2089 -0
warp/tests/test_mat_lite.py +122 -0
warp/tests/test_mat_scalar_ops.py +2913 -0
warp/tests/test_math.py +178 -0
warp/tests/test_mlp.py +282 -0
warp/tests/test_module_hashing.py +258 -0
warp/tests/test_modules_lite.py +44 -0
warp/tests/test_noise.py +252 -0
warp/tests/test_operators.py +299 -0
warp/tests/test_options.py +129 -0
warp/tests/test_overwrite.py +551 -0
warp/tests/test_print.py +339 -0
warp/tests/test_quat.py +2315 -0
warp/tests/test_rand.py +339 -0
warp/tests/test_reload.py +302 -0
warp/tests/test_rounding.py +185 -0
warp/tests/test_runlength_encode.py +196 -0
warp/tests/test_scalar_ops.py +105 -0
warp/tests/test_smoothstep.py +108 -0
warp/tests/test_snippet.py +318 -0
warp/tests/test_sparse.py +582 -0
warp/tests/test_spatial.py +2229 -0
warp/tests/test_special_values.py +361 -0
warp/tests/test_static.py +592 -0
warp/tests/test_struct.py +734 -0
warp/tests/test_tape.py +204 -0
warp/tests/test_transient_module.py +93 -0
warp/tests/test_triangle_closest_point.py +145 -0
warp/tests/test_types.py +562 -0
warp/tests/test_utils.py +588 -0
warp/tests/test_vec.py +1487 -0
warp/tests/test_vec_lite.py +80 -0
warp/tests/test_vec_scalar_ops.py +2327 -0
warp/tests/test_verify_fp.py +100 -0
warp/tests/tile/__init__.py +0 -0
warp/tests/tile/test_tile.py +780 -0
warp/tests/tile/test_tile_load.py +407 -0
warp/tests/tile/test_tile_mathdx.py +208 -0
warp/tests/tile/test_tile_mlp.py +402 -0
warp/tests/tile/test_tile_reduce.py +447 -0
warp/tests/tile/test_tile_shared_memory.py +247 -0
warp/tests/tile/test_tile_view.py +173 -0
warp/tests/unittest_serial.py +47 -0
warp/tests/unittest_suites.py +427 -0
warp/tests/unittest_utils.py +468 -0
warp/tests/walkthrough_debug.py +93 -0
warp/thirdparty/__init__.py +0 -0
warp/thirdparty/appdirs.py +598 -0
warp/thirdparty/dlpack.py +145 -0
warp/thirdparty/unittest_parallel.py +570 -0
warp/torch.py +391 -0
warp/types.py +5230 -0
warp/utils.py +1137 -0
warp_lang-1.7.0.dist-info/METADATA +516 -0
warp_lang-1.7.0.dist-info/RECORD +429 -0
warp_lang-1.7.0.dist-info/WHEEL +5 -0
warp_lang-1.7.0.dist-info/licenses/LICENSE.md +202 -0
warp_lang-1.7.0.dist-info/top_level.txt +1 -0

warp/native/volume.h ADDED Viewed

@@ -0,0 +1,969 @@
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2022 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+#include "array.h"
+#include "builtin.h"
+#define PNANOVDB_C
+#define PNANOVDB_MEMCPY_CUSTOM
+#define pnanovdb_memcpy memcpy
+#if defined(WP_NO_CRT) && !defined(__CUDACC__)
+// PNanoVDB will try to include <stdint.h> unless __CUDACC_RTC__ is defined
+#define __CUDACC_RTC__
+#endif
+#include "nanovdb/PNanoVDB.h"
+#if defined(WP_NO_CRT) && !defined(__CUDACC__)
+#undef __CUDACC_RTC__
+#endif
+namespace wp
+{
+namespace volume
+{
+// Need to kept in sync with constants in python-side Volume class
+static constexpr int CLOSEST = 0;
+static constexpr int LINEAR = 1;
+// pnanovdb helper function
+CUDA_CALLABLE inline pnanovdb_buf_t id_to_buffer(uint64_t id)
+{
+    pnanovdb_buf_t buf;
+    buf.data = (uint32_t *)id;
+    return buf;
+}
+CUDA_CALLABLE inline pnanovdb_grid_handle_t get_grid(pnanovdb_buf_t buf)
+{
+    return {0u};
+}
+CUDA_CALLABLE inline pnanovdb_uint32_t get_grid_type(pnanovdb_buf_t buf)
+{
+    return pnanovdb_grid_get_grid_type(buf, get_grid(buf));
+}
+CUDA_CALLABLE inline pnanovdb_tree_handle_t get_tree(pnanovdb_buf_t buf)
+{
+    return pnanovdb_grid_get_tree(buf, get_grid(buf));
+}
+CUDA_CALLABLE inline pnanovdb_root_handle_t get_root(pnanovdb_buf_t buf)
+{
+    return pnanovdb_tree_get_root(buf, get_tree(buf));
+}
+template <typename T> struct pnano_traits
+{
+};
+// to add support for more grid types, extend this
+// and update _volume_supported_value_types in builtins.py
+template <> struct pnano_traits<int32_t>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_INT32;
+};
+template <> struct pnano_traits<int64_t>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_INT64;
+};
+template <> struct pnano_traits<uint32_t>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_UINT32;
+};
+template <> struct pnano_traits<float>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_FLOAT;
+};
+template <> struct pnano_traits<double>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_DOUBLE;
+};
+template <> struct pnano_traits<vec3f>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_VEC3F;
+};
+template <> struct pnano_traits<vec3d>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_VEC3D;
+};
+template <> struct pnano_traits<vec4f>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_VEC4F;
+};
+template <> struct pnano_traits<vec4d>
+{
+    static constexpr int GRID_TYPE = PNANOVDB_GRID_TYPE_VEC4D;
+};
+// common accessors over various grid types
+// WARNING: implementation below only for >=32b values, but that's the case for all types above
+// for smaller types add a specialization
+template <typename T> CUDA_CALLABLE inline void pnano_read(T &result, pnanovdb_buf_t buf, pnanovdb_address_t address)
+{
+    result = *reinterpret_cast<const T *>(buf.data + (address.byte_offset >> 2));
+}
+template <typename T>
+CUDA_CALLABLE inline void pnano_write(const T &value, pnanovdb_buf_t buf, pnanovdb_address_t address)
+{
+    *reinterpret_cast<T *>(buf.data + (address.byte_offset >> 2)) = value;
+}
+template <typename T>
+CUDA_CALLABLE inline void pnano_read(T &result, pnanovdb_buf_t buf, pnanovdb_root_handle_t root,
+                                     PNANOVDB_IN(pnanovdb_coord_t) ijk)
+{
+    using traits = pnano_traits<T>;
+    const pnanovdb_address_t address = pnanovdb_root_get_value_address(traits::GRID_TYPE, buf, root, ijk);
+    pnano_read<T>(result, buf, address);
+}
+template <typename T>
+CUDA_CALLABLE inline void pnano_read(T &result, pnanovdb_buf_t buf, PNANOVDB_INOUT(pnanovdb_readaccessor_t) acc,
+                                     PNANOVDB_IN(pnanovdb_coord_t) ijk)
+{
+    using traits = pnano_traits<T>;
+    // pnanovdb_address_t address = pnanovdb_readaccessor_get_value_address(traits::GRID_TYPE, buf, acc, ijk);
+    pnanovdb_uint32_t level;
+    const pnanovdb_address_t address =
+        pnanovdb_readaccessor_get_value_address_and_level(traits::GRID_TYPE, buf, acc, ijk, PNANOVDB_REF(level));
+    pnano_read<T>(result, buf, address);
+}
+/// regular grid accessor (values stored in leafs)
+struct value_accessor_base
+{
+    pnanovdb_buf_t buf;
+    pnanovdb_root_handle_t root;
+    pnanovdb_readaccessor_t accessor;
+    explicit inline CUDA_CALLABLE value_accessor_base(const pnanovdb_buf_t buf) : buf(buf), root(get_root(buf))
+    {
+    }
+    CUDA_CALLABLE inline void init_cache()
+    {
+        pnanovdb_readaccessor_init(PNANOVDB_REF(accessor), root);
+    }
+};
+template <typename T> struct leaf_value_accessor : value_accessor_base
+{
+    using ValueType = T;
+    explicit inline CUDA_CALLABLE leaf_value_accessor(const pnanovdb_buf_t buf) : value_accessor_base(buf)
+    {
+    }
+    CUDA_CALLABLE inline bool is_valid() const
+    {
+        return get_grid_type(buf) == pnano_traits<T>::GRID_TYPE;
+    }
+    CUDA_CALLABLE inline T read_single(const pnanovdb_coord_t &ijk) const
+    {
+        T val;
+        pnano_read(val, buf, root, PNANOVDB_REF(ijk));
+        return val;
+    }
+    CUDA_CALLABLE inline T read_cache(const pnanovdb_coord_t &ijk)
+    {
+        T val;
+        pnano_read(val, buf, PNANOVDB_REF(accessor), PNANOVDB_REF(ijk));
+        return val;
+    }
+    CUDA_CALLABLE inline void adj_read_single(const pnanovdb_coord_t &ijk, const T &adj_ret)
+    {
+        // NOP
+    }
+    CUDA_CALLABLE inline void adj_read_cache(const pnanovdb_coord_t &ijk, const T &adj_ret)
+    {
+        // NOP
+    }
+};
+CUDA_CALLABLE inline pnanovdb_uint64_t leaf_regular_get_voxel_index(pnanovdb_buf_t buf,
+                                                                    pnanovdb_address_t value_address,
+                                                                    PNANOVDB_IN(pnanovdb_coord_t) ijk)
+{
+    // compute leaf index from value address, assuming all leaf voxels are allocated
+    const pnanovdb_grid_type_t grid_type = get_grid_type(buf);
+    const pnanovdb_uint32_t n = pnanovdb_leaf_coord_to_offset(ijk);
+    const pnanovdb_uint32_t byte_offset = PNANOVDB_GRID_TYPE_GET(grid_type, leaf_off_table) +
+                                          ((PNANOVDB_GRID_TYPE_GET(grid_type, value_stride_bits) * n) >> 3u);
+    const pnanovdb_address_t leaf_address = pnanovdb_address_offset_neg(value_address, byte_offset);
+    const pnanovdb_uint64_t first_leaf_offset = pnanovdb_tree_get_node_offset_leaf(buf, get_tree(buf));
+    const pnanovdb_uint32_t leaf_size = PNANOVDB_GRID_TYPE_GET(grid_type, leaf_size);
+    const pnanovdb_uint64_t leaf_index = (leaf_address.byte_offset - first_leaf_offset) / leaf_size;
+    return leaf_index * PNANOVDB_LEAF_TABLE_COUNT + n + 1;
+}
+CUDA_CALLABLE inline pnanovdb_uint64_t get_grid_voxel_index(pnanovdb_grid_type_t grid_type, pnanovdb_buf_t buf,
+                                                            pnanovdb_address_t value_address,
+                                                            const pnanovdb_coord_t &ijk)
+{
+    switch (grid_type)
+    {
+    case PNANOVDB_GRID_TYPE_INDEX:
+        return pnanovdb_leaf_index_get_value_index(buf, value_address, PNANOVDB_REF(ijk));
+    case PNANOVDB_GRID_TYPE_ONINDEX:
+        return pnanovdb_leaf_onindex_get_value_index(buf, value_address, PNANOVDB_REF(ijk));
+    case PNANOVDB_GRID_TYPE_INDEXMASK:
+        return pnanovdb_leaf_indexmask_get_value_index(buf, value_address, PNANOVDB_REF(ijk));
+    case PNANOVDB_GRID_TYPE_ONINDEXMASK:
+        return pnanovdb_leaf_onindexmask_get_value_index(buf, value_address, PNANOVDB_REF(ijk));
+    default:
+        return leaf_regular_get_voxel_index(buf, value_address, PNANOVDB_REF(ijk));
+    }
+};
+/// index grid accessor
+template <typename T> struct index_value_accessor : value_accessor_base
+{
+    using ValueType = T;
+    pnanovdb_grid_type_t grid_type;
+    array_t<T> data;
+    const T &background;
+    T *adj_background;
+    explicit inline CUDA_CALLABLE index_value_accessor(const pnanovdb_buf_t buf, const array_t<T> &data,
+                                                       const T &background, T *adj_background = nullptr)
+        : value_accessor_base(buf), grid_type(get_grid_type(buf)), data(data), background(background),
+          adj_background(adj_background)
+    {
+    }
+    CUDA_CALLABLE inline bool is_valid() const
+    {
+        // Accessor is valid for all grid types
+        return true;
+    }
+    CUDA_CALLABLE inline T read_single(const pnanovdb_coord_t &ijk) const
+    {
+        pnanovdb_uint32_t level;
+        const pnanovdb_address_t address =
+            pnanovdb_root_get_value_address_and_level(grid_type, buf, root, PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+        return read_at(level, address, ijk);
+    }
+    CUDA_CALLABLE inline T read_cache(const pnanovdb_coord_t &ijk)
+    {
+        pnanovdb_uint32_t level;
+        const pnanovdb_address_t address = pnanovdb_readaccessor_get_value_address_and_level(
+            grid_type, buf, PNANOVDB_REF(accessor), PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+        return read_at(level, address, ijk);
+    }
+    CUDA_CALLABLE inline T read_at(pnanovdb_uint32_t level, const pnanovdb_address_t address,
+                                   const pnanovdb_coord_t &ijk) const
+    {
+        if (level == 0)
+        {
+            pnanovdb_uint64_t voxel_index = get_grid_voxel_index(grid_type, buf, address, ijk);
+            if (voxel_index > 0)
+            {
+                return *wp::address(data, voxel_index - 1);
+            }
+        }
+        return background;
+    }
+    CUDA_CALLABLE inline void adj_read_single(const pnanovdb_coord_t &ijk, const T &adj_ret)
+    {
+        pnanovdb_uint32_t level;
+        const pnanovdb_address_t address =
+            pnanovdb_root_get_value_address_and_level(grid_type, buf, root, PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+        adj_read_at(level, address, ijk, adj_ret);
+    }
+    CUDA_CALLABLE inline void adj_read_cache(const pnanovdb_coord_t &ijk, const T &adj_ret)
+    {
+        pnanovdb_uint32_t level;
+        const pnanovdb_address_t address = pnanovdb_readaccessor_get_value_address_and_level(
+            grid_type, buf, PNANOVDB_REF(accessor), PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+        adj_read_at(level, address, ijk, adj_ret);
+    }
+    CUDA_CALLABLE inline void adj_read_at(pnanovdb_uint32_t level, const pnanovdb_address_t address,
+                                          const pnanovdb_coord_t &ijk, const T &adj_ret) const
+    {
+        if (level == 0)
+        {
+            pnanovdb_uint64_t voxel_index = get_grid_voxel_index(grid_type, buf, address, ijk);
+            if (voxel_index > 0)
+            {
+                adj_atomic_add(&index_grad(data, voxel_index - 1), adj_ret);
+                return;
+            }
+        }
+        *adj_background += adj_ret;
+    }
+};
+CUDA_CALLABLE inline pnanovdb_coord_t vec3_round_to_coord(const pnanovdb_vec3_t a)
+{
+    pnanovdb_coord_t v;
+    v.x = pnanovdb_float_to_int32(roundf(a.x));
+    v.y = pnanovdb_float_to_int32(roundf(a.y));
+    v.z = pnanovdb_float_to_int32(roundf(a.z));
+    return v;
+}
+template <typename T> struct val_traits
+{
+    using grad_t = vec_t<3, T>;
+    using scalar_t = T;
+    // multiplies the gradient on the right
+    // needs to be specialized for scalar types as gradient is stored as column rather than row vector
+    static CUDA_CALLABLE inline T rmul(const grad_t &grad, const vec_t<3, scalar_t> &rhs)
+    {
+        return dot(grad, rhs);
+    }
+};
+template <unsigned Length, typename T> struct val_traits<vec_t<Length, T>>
+{
+    using grad_t = mat_t<3, Length, T>;
+    using scalar_t = T;
+    static CUDA_CALLABLE inline vec_t<Length, T> rmul(const grad_t &grad, const vec_t<3, scalar_t> &rhs)
+    {
+        return mul(grad, rhs);
+    }
+};
+// Sampling the volume at the given index-space coordinates, uvw can be fractional
+template <typename Accessor>
+CUDA_CALLABLE inline typename Accessor::ValueType volume_sample(Accessor &accessor, vec3 uvw, int sampling_mode)
+{
+    using T = typename Accessor::ValueType;
+    using w_t = typename val_traits<T>::scalar_t;
+    if (!accessor.is_valid())
+    {
+        return 0;
+    }
+    const pnanovdb_buf_t buf = accessor.buf;
+    const pnanovdb_vec3_t uvw_pnano{uvw[0], uvw[1], uvw[2]};
+    if (sampling_mode == CLOSEST)
+    {
+        const pnanovdb_coord_t ijk = vec3_round_to_coord(uvw_pnano);
+        return accessor.read_single(ijk);
+    }
+    else if (sampling_mode == LINEAR)
+    {
+        // NB. linear sampling is not used on int volumes
+        constexpr pnanovdb_coord_t OFFSETS[] = {
+            {0, 0, 0}, {0, 0, 1}, {0, 1, 0}, {0, 1, 1}, {1, 0, 0}, {1, 0, 1}, {1, 1, 0}, {1, 1, 1},
+        };
+        const pnanovdb_vec3_t ijk_base{floorf(uvw_pnano.x), floorf(uvw_pnano.y), floorf(uvw_pnano.z)};
+        const pnanovdb_vec3_t ijk_frac{uvw_pnano.x - ijk_base.x, uvw_pnano.y - ijk_base.y, uvw_pnano.z - ijk_base.z};
+        const pnanovdb_coord_t ijk{(pnanovdb_int32_t)ijk_base.x, (pnanovdb_int32_t)ijk_base.y,
+                                   (pnanovdb_int32_t)ijk_base.z};
+        accessor.init_cache();
+        T val = 0;
+        const float wx[2]{1 - ijk_frac.x, ijk_frac.x};
+        const float wy[2]{1 - ijk_frac.y, ijk_frac.y};
+        const float wz[2]{1 - ijk_frac.z, ijk_frac.z};
+        for (int idx = 0; idx < 8; ++idx)
+        {
+            const pnanovdb_coord_t &offs = OFFSETS[idx];
+            const pnanovdb_coord_t ijk_shifted = pnanovdb_coord_add(ijk, offs);
+            const T v = accessor.read_cache(ijk_shifted);
+            const w_t w = wx[offs.x] * wy[offs.y] * wz[offs.z];
+            val = add(val, w * v);
+        }
+        return val;
+    }
+    return 0;
+}
+template <typename Accessor>
+CUDA_CALLABLE inline void adj_volume_sample(Accessor &accessor, vec3 uvw, int sampling_mode, vec3 &adj_uvw,
+                                            const typename Accessor::ValueType &adj_ret)
+{
+    // TODO: accessor data gradients
+    using T = typename Accessor::ValueType;
+    using w_t = typename val_traits<T>::scalar_t;
+    using w_grad_t = vec_t<3, w_t>;
+    if (!accessor.is_valid())
+    {
+        return;
+    }
+    const pnanovdb_buf_t buf = accessor.buf;
+    const pnanovdb_vec3_t uvw_pnano{uvw[0], uvw[1], uvw[2]};
+    if (sampling_mode != LINEAR)
+    {
+        const pnanovdb_coord_t ijk = vec3_round_to_coord(uvw_pnano);
+        accessor.adj_read_single(ijk, adj_ret);
+        return;
+    }
+    constexpr pnanovdb_coord_t OFFSETS[] = {
+        {0, 0, 0}, {0, 0, 1}, {0, 1, 0}, {0, 1, 1}, {1, 0, 0}, {1, 0, 1}, {1, 1, 0}, {1, 1, 1},
+    };
+    const pnanovdb_vec3_t ijk_base{floorf(uvw_pnano.x), floorf(uvw_pnano.y), floorf(uvw_pnano.z)};
+    const pnanovdb_vec3_t ijk_frac{uvw_pnano.x - ijk_base.x, uvw_pnano.y - ijk_base.y, uvw_pnano.z - ijk_base.z};
+    const pnanovdb_coord_t ijk{(pnanovdb_int32_t)ijk_base.x, (pnanovdb_int32_t)ijk_base.y,
+                               (pnanovdb_int32_t)ijk_base.z};
+    accessor.init_cache();
+    const float wx[2]{1 - ijk_frac.x, ijk_frac.x};
+    const float wy[2]{1 - ijk_frac.y, ijk_frac.y};
+    const float wz[2]{1 - ijk_frac.z, ijk_frac.z};
+    for (int idx = 0; idx < 8; ++idx)
+    {
+        const pnanovdb_coord_t &offs = OFFSETS[idx];
+        const pnanovdb_coord_t ijk_shifted = pnanovdb_coord_add(ijk, offs);
+        const T v = accessor.read_cache(ijk_shifted);
+        const vec3 signs(offs.x * 2 - 1, offs.y * 2 - 1, offs.z * 2 - 1);
+        const w_t w = wx[offs.x] * wy[offs.y] * wz[offs.z];
+        const w_grad_t grad_w(signs[0] * wy[offs.y] * wz[offs.z], signs[1] * wx[offs.x] * wz[offs.z],
+                              signs[2] * wx[offs.x] * wy[offs.y]);
+        adj_uvw += vec3(mul(w_t(dot(v, adj_ret)), grad_w));
+        const T adj_v = w * adj_ret;
+        accessor.adj_read_cache(ijk_shifted, adj_v);
+    }
+}
+// Sampling the volume at the given index-space coordinates, uvw can be fractional
+template <typename Accessor>
+CUDA_CALLABLE inline typename Accessor::ValueType volume_sample_grad(
+    Accessor &accessor, vec3 uvw, int sampling_mode, typename val_traits<typename Accessor::ValueType>::grad_t &grad)
+{
+    using T = typename Accessor::ValueType;
+    using grad_T = typename val_traits<T>::grad_t;
+    using w_t = typename val_traits<T>::scalar_t;
+    using w_grad_t = vec_t<3, w_t>;
+    grad = grad_T{};
+    if (!accessor.is_valid())
+    {
+        return 0;
+    }
+    const pnanovdb_buf_t buf = accessor.buf;
+    const pnanovdb_vec3_t uvw_pnano{uvw[0], uvw[1], uvw[2]};
+    if (sampling_mode == CLOSEST)
+    {
+        const pnanovdb_coord_t ijk = vec3_round_to_coord(uvw_pnano);
+        return accessor.read_single(ijk);
+    }
+    else if (sampling_mode == LINEAR)
+    {
+        // NB. linear sampling is not used on int volumes
+        constexpr pnanovdb_coord_t OFFSETS[] = {
+            {0, 0, 0}, {0, 0, 1}, {0, 1, 0}, {0, 1, 1}, {1, 0, 0}, {1, 0, 1}, {1, 1, 0}, {1, 1, 1},
+        };
+        const pnanovdb_vec3_t ijk_base{floorf(uvw_pnano.x), floorf(uvw_pnano.y), floorf(uvw_pnano.z)};
+        const pnanovdb_vec3_t ijk_frac{uvw_pnano.x - ijk_base.x, uvw_pnano.y - ijk_base.y, uvw_pnano.z - ijk_base.z};
+        const pnanovdb_coord_t ijk{(pnanovdb_int32_t)ijk_base.x, (pnanovdb_int32_t)ijk_base.y,
+                                   (pnanovdb_int32_t)ijk_base.z};
+        accessor.init_cache();
+        T val = 0;
+        const float wx[2]{1 - ijk_frac.x, ijk_frac.x};
+        const float wy[2]{1 - ijk_frac.y, ijk_frac.y};
+        const float wz[2]{1 - ijk_frac.z, ijk_frac.z};
+        for (int idx = 0; idx < 8; ++idx)
+        {
+            const pnanovdb_coord_t &offs = OFFSETS[idx];
+            const pnanovdb_coord_t ijk_shifted = pnanovdb_coord_add(ijk, offs);
+            const T v = accessor.read_cache(ijk_shifted);
+            const vec3 signs(offs.x * 2 - 1, offs.y * 2 - 1, offs.z * 2 - 1);
+            const w_t w = wx[offs.x] * wy[offs.y] * wz[offs.z];
+            const w_grad_t grad_w(signs[0] * wy[offs.y] * wz[offs.z], signs[1] * wx[offs.x] * wz[offs.z],
+                                  signs[2] * wx[offs.x] * wy[offs.y]);
+            val = add(val, w * v);
+            grad += outer(v, grad_w);
+        }
+        return val;
+    }
+    return 0;
+}
+template <typename Accessor>
+CUDA_CALLABLE inline void adj_volume_sample_grad(Accessor &accessor, vec3 uvw, int sampling_mode,
+                                                 typename val_traits<typename Accessor::ValueType>::grad_t &grad,
+                                                 vec3 &adj_uvw,
+                                                 typename val_traits<typename Accessor::ValueType>::grad_t &adj_grad,
+                                                 const typename Accessor::ValueType &adj_ret)
+{
+    // TODO: accessor data gradients
+    using T = typename Accessor::ValueType;
+    using grad_T = typename val_traits<T>::grad_t;
+    using w_t = typename val_traits<T>::scalar_t;
+    using w_grad_t = vec_t<3, w_t>;
+    using w_hess_t = mat_t<3, 3, w_t>;
+    if (!accessor.is_valid())
+    {
+        return;
+    }
+    const pnanovdb_buf_t buf = accessor.buf;
+    const pnanovdb_vec3_t uvw_pnano{uvw[0], uvw[1], uvw[2]};
+    if (sampling_mode != LINEAR)
+    {
+        const pnanovdb_coord_t ijk = vec3_round_to_coord(uvw_pnano);
+        accessor.adj_read_single(ijk, adj_ret);
+        return;
+    }
+    constexpr pnanovdb_coord_t OFFSETS[] = {
+        {0, 0, 0}, {0, 0, 1}, {0, 1, 0}, {0, 1, 1}, {1, 0, 0}, {1, 0, 1}, {1, 1, 0}, {1, 1, 1},
+    };
+    const pnanovdb_vec3_t ijk_base{floorf(uvw_pnano.x), floorf(uvw_pnano.y), floorf(uvw_pnano.z)};
+    const pnanovdb_vec3_t ijk_frac{uvw_pnano.x - ijk_base.x, uvw_pnano.y - ijk_base.y, uvw_pnano.z - ijk_base.z};
+    const pnanovdb_coord_t ijk{(pnanovdb_int32_t)ijk_base.x, (pnanovdb_int32_t)ijk_base.y,
+                               (pnanovdb_int32_t)ijk_base.z};
+    accessor.init_cache();
+    const float wx[2]{1 - ijk_frac.x, ijk_frac.x};
+    const float wy[2]{1 - ijk_frac.y, ijk_frac.y};
+    const float wz[2]{1 - ijk_frac.z, ijk_frac.z};
+    for (int idx = 0; idx < 8; ++idx)
+    {
+        const pnanovdb_coord_t &offs = OFFSETS[idx];
+        const pnanovdb_coord_t ijk_shifted = pnanovdb_coord_add(ijk, offs);
+        const T v = accessor.read_cache(ijk_shifted);
+        const vec3 signs(offs.x * 2 - 1, offs.y * 2 - 1, offs.z * 2 - 1);
+        const w_t w = wx[offs.x] * wy[offs.y] * wz[offs.z];
+        const w_grad_t grad_w(signs[0] * wy[offs.y] * wz[offs.z], signs[1] * wx[offs.x] * wz[offs.z],
+                              signs[2] * wx[offs.x] * wy[offs.y]);
+        adj_uvw += vec3(mul(w_t(dot(v, adj_ret)), grad_w));
+        const w_hess_t hess_w(0.0, signs[1] * signs[0] * wz[offs.z], signs[2] * signs[0] * wy[offs.y],
+                              signs[0] * signs[1] * wz[offs.z], 0.0, signs[2] * signs[1] * wx[offs.x],
+                              signs[0] * signs[2] * wy[offs.y], signs[1] * signs[2] * wx[offs.x], 0.0);
+        adj_uvw += vec3(mul(mul(v, adj_grad), hess_w));
+        const T adj_v = w * adj_ret + val_traits<T>::rmul(adj_grad, grad_w);
+        accessor.adj_read_cache(ijk_shifted, adj_v);
+    }
+}
+} // namespace volume
+  // namespace volume
+// exposed kernel builtins
+// volume_sample
+template <typename T> CUDA_CALLABLE inline T volume_sample(uint64_t id, vec3 uvw, int sampling_mode)
+{
+    volume::leaf_value_accessor<T> accessor(volume::id_to_buffer(id));
+    return volume::volume_sample(accessor, uvw, sampling_mode);
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_sample(uint64_t id, vec3 uvw, int sampling_mode, uint64_t &adj_id, vec3 &adj_uvw,
+                                            int &adj_sampling_mode, const T &adj_ret)
+{
+    volume::leaf_value_accessor<T> accessor(volume::id_to_buffer(id));
+    volume::adj_volume_sample(accessor, uvw, sampling_mode, adj_uvw, adj_ret);
+}
+template <typename T>
+CUDA_CALLABLE inline T volume_sample_grad(uint64_t id, vec3 uvw, int sampling_mode,
+                                          typename volume::val_traits<T>::grad_t &grad)
+{
+    volume::leaf_value_accessor<T> accessor(volume::id_to_buffer(id));
+    return volume::volume_sample_grad(accessor, uvw, sampling_mode, grad);
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_sample_grad(uint64_t id, vec3 uvw, int sampling_mode,
+                                                 typename volume::val_traits<T>::grad_t &grad, uint64_t &adj_id,
+                                                 vec3 &adj_uvw, int &adj_sampling_mode,
+                                                 typename volume::val_traits<T>::grad_t &adj_grad, const T &adj_ret)
+{
+    volume::leaf_value_accessor<T> accessor(volume::id_to_buffer(id));
+    volume::adj_volume_sample_grad(accessor, uvw, sampling_mode, grad, adj_uvw, adj_grad, adj_ret);
+}
+// Sampling a float volume at the given index-space coordinates, uvw can be fractional
+CUDA_CALLABLE inline float volume_sample_f(uint64_t id, vec3 uvw, int sampling_mode)
+{
+    return volume_sample<float>(id, uvw, sampling_mode);
+}
+// Sampling an int volume at the given index-space coordinates, uvw can be fractional
+CUDA_CALLABLE inline int32_t volume_sample_i(uint64_t id, vec3 uvw)
+{
+    return volume_sample<int32_t>(id, uvw, volume::CLOSEST);
+}
+// Sampling a vector volume at the given index-space coordinates, uvw can be fractional
+CUDA_CALLABLE inline vec3 volume_sample_v(uint64_t id, vec3 uvw, int sampling_mode)
+{
+    return volume_sample<vec3>(id, uvw, sampling_mode);
+}
+CUDA_CALLABLE inline void adj_volume_sample_f(uint64_t id, vec3 uvw, int sampling_mode, uint64_t &adj_id, vec3 &adj_uvw,
+                                              int &adj_sampling_mode, const float &adj_ret)
+{
+    adj_volume_sample(id, uvw, sampling_mode, adj_id, adj_uvw, adj_sampling_mode, adj_ret);
+}
+CUDA_CALLABLE inline void adj_volume_sample_v(uint64_t id, vec3 uvw, int sampling_mode, uint64_t &adj_id, vec3 &adj_uvw,
+                                              int &adj_sampling_mode, const vec3 &adj_ret)
+{
+    adj_volume_sample(id, uvw, sampling_mode, adj_id, adj_uvw, adj_sampling_mode, adj_ret);
+}
+CUDA_CALLABLE inline void adj_volume_sample_i(uint64_t id, vec3 uvw, uint64_t &adj_id, vec3 &adj_uvw,
+                                              const int32_t &adj_ret)
+{
+    // NOP
+}
+// Sampling the volume at the given index-space coordinates, uvw can be fractional
+CUDA_CALLABLE inline float volume_sample_grad_f(uint64_t id, vec3 uvw, int sampling_mode, vec3 &grad)
+{
+    return volume_sample_grad<float>(id, uvw, sampling_mode, grad);
+}
+CUDA_CALLABLE inline void adj_volume_sample_grad_f(uint64_t id, vec3 uvw, int sampling_mode, vec3 &grad,
+                                                   uint64_t &adj_id, vec3 &adj_uvw, int &adj_sampling_mode,
+                                                   vec3 &adj_grad, const float &adj_ret)
+{
+    adj_volume_sample_grad<float>(id, uvw, sampling_mode, grad, adj_id, adj_uvw, adj_sampling_mode, adj_grad, adj_ret);
+}
+// volume_sample_index
+template <typename T>
+CUDA_CALLABLE inline T volume_sample_index(uint64_t id, vec3 uvw, int sampling_mode, const array_t<T> &voxel_data,
+                                           const T &background)
+{
+    volume::index_value_accessor<T> accessor(volume::id_to_buffer(id), voxel_data, background);
+    return volume::volume_sample(accessor, uvw, sampling_mode);
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_sample_index(uint64_t id, vec3 uvw, int sampling_mode,
+                                                  const array_t<T> &voxel_data, const T &background, uint64_t &adj_id,
+                                                  vec3 &adj_uvw, int &adj_sampling_mode, array_t<T> &adj_voxel_data,
+                                                  T &adj_background, const T &adj_ret)
+{
+    volume::index_value_accessor<T> accessor(volume::id_to_buffer(id), voxel_data, background, &adj_background);
+    volume::adj_volume_sample(accessor, uvw, sampling_mode, adj_uvw, adj_ret);
+}
+template <typename T>
+CUDA_CALLABLE inline T volume_sample_grad_index(uint64_t id, vec3 uvw, int sampling_mode, const array_t<T> &voxel_data,
+                                                const T &background, typename volume::val_traits<T>::grad_t &grad)
+{
+    volume::index_value_accessor<T> accessor(volume::id_to_buffer(id), voxel_data, background);
+    return volume::volume_sample_grad(accessor, uvw, sampling_mode, grad);
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_sample_grad_index(
+    uint64_t id, vec3 uvw, int sampling_mode, const array_t<T> &voxel_data, const T &background,
+    typename volume::val_traits<T>::grad_t &grad, uint64_t &adj_id, vec3 &adj_uvw, int &adj_sampling_mode,
+    array_t<T> &adj_voxel_data, T &adj_background, typename volume::val_traits<T>::grad_t &adj_grad, const T &adj_ret)
+{
+    volume::index_value_accessor<T> accessor(volume::id_to_buffer(id), voxel_data, background, &adj_background);
+    volume::adj_volume_sample_grad(accessor, uvw, sampling_mode, grad, adj_uvw, adj_grad, adj_ret);
+}
+// volume_lookup
+template <typename T> CUDA_CALLABLE inline T volume_lookup(uint64_t id, int32_t i, int32_t j, int32_t k)
+{
+    using traits = volume::pnano_traits<T>;
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    if (volume::get_grid_type(buf) != traits::GRID_TYPE)
+        return 0;
+    const pnanovdb_root_handle_t root = volume::get_root(buf);
+    const pnanovdb_coord_t ijk{i, j, k};
+    T val;
+    volume::pnano_read(val, buf, root, PNANOVDB_REF(ijk));
+    return val;
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_lookup(uint64_t id, int32_t i, int32_t j, int32_t k, uint64_t &adj_id,
+                                            int32_t &adj_i, int32_t &adj_j, int32_t &adj_k, const T &adj_ret)
+{
+    // NOP -- adjoint of grid values is not available
+}
+CUDA_CALLABLE inline float volume_lookup_f(uint64_t id, int32_t i, int32_t j, int32_t k)
+{
+    return volume_lookup<float>(id, i, j, k);
+}
+CUDA_CALLABLE inline int32_t volume_lookup_i(uint64_t id, int32_t i, int32_t j, int32_t k)
+{
+    return volume_lookup<int32_t>(id, i, j, k);
+}
+CUDA_CALLABLE inline vec3 volume_lookup_v(uint64_t id, int32_t i, int32_t j, int32_t k)
+{
+    return volume_lookup<vec3>(id, i, j, k);
+}
+CUDA_CALLABLE inline void adj_volume_lookup_f(uint64_t id, int32_t i, int32_t j, int32_t k, uint64_t &adj_id,
+                                              int32_t &adj_i, int32_t &adj_j, int32_t &adj_k, const float &adj_ret)
+{
+    adj_volume_lookup(id, i, j, k, adj_id, adj_i, adj_j, adj_k, adj_ret);
+}
+CUDA_CALLABLE inline void adj_volume_lookup_i(uint64_t id, int32_t i, int32_t j, int32_t k, uint64_t &adj_id,
+                                              int32_t &adj_i, int32_t &adj_j, int32_t &adj_k, const int32_t &adj_ret)
+{
+    adj_volume_lookup(id, i, j, k, adj_id, adj_i, adj_j, adj_k, adj_ret);
+}
+CUDA_CALLABLE inline void adj_volume_lookup_v(uint64_t id, int32_t i, int32_t j, int32_t k, uint64_t &adj_id,
+                                              int32_t &adj_i, int32_t &adj_j, int32_t &adj_k, const vec3 &adj_ret)
+{
+    adj_volume_lookup(id, i, j, k, adj_id, adj_i, adj_j, adj_k, adj_ret);
+}
+CUDA_CALLABLE inline int32_t volume_lookup_index(uint64_t id, int32_t i, int32_t j, int32_t k)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_root_handle_t root = volume::get_root(buf);
+    const pnanovdb_grid_type_t grid_type = volume::get_grid_type(buf);
+    const pnanovdb_coord_t ijk{i, j, k};
+    pnanovdb_uint32_t level;
+    const pnanovdb_address_t address =
+        pnanovdb_root_get_value_address_and_level(grid_type, buf, root, PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+    if (level == 0)
+    {
+        pnanovdb_uint64_t voxel_index = volume::get_grid_voxel_index(grid_type, buf, address, ijk);
+        return static_cast<int32_t>(voxel_index) - 1;
+    }
+    return -1;
+}
+CUDA_CALLABLE inline void adj_volume_lookup_index(uint64_t id, int32_t i, int32_t j, int32_t k, uint64_t &adj_id,
+                                                  int32_t &adj_i, int32_t &adj_j, int32_t &adj_k, const vec3 &adj_ret)
+{
+    // NOP
+}
+// volume_store
+template <typename T>
+CUDA_CALLABLE inline void volume_store(uint64_t id, int32_t i, int32_t j, int32_t k, const T &value)
+{
+    using traits = volume::pnano_traits<T>;
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    if (volume::get_grid_type(buf) != traits::GRID_TYPE)
+        return;
+    const pnanovdb_root_handle_t root = volume::get_root(buf);
+    const pnanovdb_coord_t ijk{i, j, k};
+    pnanovdb_uint32_t level;
+    const pnanovdb_address_t address =
+        pnanovdb_root_get_value_address_and_level(traits::GRID_TYPE, buf, root, PNANOVDB_REF(ijk), PNANOVDB_REF(level));
+    if (level == 0)
+    {
+        // only write at at leaf level (prevent modifying background value)
+        // TODO is this the intended semantics? or should be allow writing to background?
+        volume::pnano_write(value, buf, address);
+    }
+}
+template <typename T>
+CUDA_CALLABLE inline void adj_volume_store(uint64_t id, int32_t i, int32_t j, int32_t k, const T &value,
+                                           uint64_t &adj_id, int32_t &adj_i, int32_t &adj_j, int32_t &adj_k,
+                                           T &adj_value)
+{
+    // NOP -- adjoint of grid values is not available
+}
+CUDA_CALLABLE inline void volume_store_f(uint64_t id, int32_t i, int32_t j, int32_t k, const float &value)
+{
+    volume_store(id, i, j, k, value);
+}
+CUDA_CALLABLE inline void adj_volume_store_f(uint64_t id, int32_t i, int32_t j, int32_t k, const float &value,
+                                             uint64_t &adj_id, int32_t &adj_i, int32_t &adj_j, int32_t &adj_k,
+                                             float &adj_value)
+{
+    adj_volume_store(id, i, j, k, value, adj_id, adj_i, adj_j, adj_k, adj_value);
+}
+CUDA_CALLABLE inline void volume_store_v(uint64_t id, int32_t i, int32_t j, int32_t k, const vec3 &value)
+{
+    volume_store(id, i, j, k, value);
+}
+CUDA_CALLABLE inline void adj_volume_store_v(uint64_t id, int32_t i, int32_t j, int32_t k, const vec3 &value,
+                                             uint64_t &adj_id, int32_t &adj_i, int32_t &adj_j, int32_t &adj_k,
+                                             vec3 &adj_value)
+{
+    adj_volume_store(id, i, j, k, value, adj_id, adj_i, adj_j, adj_k, adj_value);
+}
+CUDA_CALLABLE inline void volume_store_i(uint64_t id, int32_t i, int32_t j, int32_t k, const int32_t &value)
+{
+    volume_store(id, i, j, k, value);
+}
+CUDA_CALLABLE inline void adj_volume_store_i(uint64_t id, int32_t i, int32_t j, int32_t k, const int32_t &value,
+                                             uint64_t &adj_id, int32_t &adj_i, int32_t &adj_j, int32_t &adj_k,
+                                             int32_t &adj_value)
+{
+    adj_volume_store(id, i, j, k, value, adj_id, adj_i, adj_j, adj_k, adj_value);
+}
+// Transform position from index space to world space
+CUDA_CALLABLE inline vec3 volume_index_to_world(uint64_t id, vec3 uvw)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{uvw[0], uvw[1], uvw[2]};
+    const pnanovdb_vec3_t xyz = pnanovdb_grid_index_to_worldf(buf, grid, PNANOVDB_REF(pos));
+    return {xyz.x, xyz.y, xyz.z};
+}
+// Transform position from world space to index space
+CUDA_CALLABLE inline vec3 volume_world_to_index(uint64_t id, vec3 xyz)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{xyz[0], xyz[1], xyz[2]};
+    const pnanovdb_vec3_t uvw = pnanovdb_grid_world_to_indexf(buf, grid, PNANOVDB_REF(pos));
+    return {uvw.x, uvw.y, uvw.z};
+}
+CUDA_CALLABLE inline void adj_volume_index_to_world(uint64_t id, vec3 uvw, uint64_t &adj_id, vec3 &adj_uvw,
+                                                    const vec3 &adj_ret)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{adj_ret[0], adj_ret[1], adj_ret[2]};
+    const pnanovdb_vec3_t xyz = pnanovdb_grid_index_to_world_dirf(buf, grid, PNANOVDB_REF(pos));
+    adj_uvw = add(adj_uvw, vec3{xyz.x, xyz.y, xyz.z});
+}
+CUDA_CALLABLE inline void adj_volume_world_to_index(uint64_t id, vec3 xyz, uint64_t &adj_id, vec3 &adj_xyz,
+                                                    const vec3 &adj_ret)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{adj_ret[0], adj_ret[1], adj_ret[2]};
+    const pnanovdb_vec3_t uvw = pnanovdb_grid_world_to_index_dirf(buf, grid, PNANOVDB_REF(pos));
+    adj_xyz = add(adj_xyz, vec3{uvw.x, uvw.y, uvw.z});
+}
+// Transform direction from index space to world space
+CUDA_CALLABLE inline vec3 volume_index_to_world_dir(uint64_t id, vec3 uvw)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{uvw[0], uvw[1], uvw[2]};
+    const pnanovdb_vec3_t xyz = pnanovdb_grid_index_to_world_dirf(buf, grid, PNANOVDB_REF(pos));
+    return {xyz.x, xyz.y, xyz.z};
+}
+// Transform direction from world space to index space
+CUDA_CALLABLE inline vec3 volume_world_to_index_dir(uint64_t id, vec3 xyz)
+{
+    const pnanovdb_buf_t buf = volume::id_to_buffer(id);
+    const pnanovdb_grid_handle_t grid = {0u};
+    const pnanovdb_vec3_t pos{xyz[0], xyz[1], xyz[2]};
+    const pnanovdb_vec3_t uvw = pnanovdb_grid_world_to_index_dirf(buf, grid, PNANOVDB_REF(pos));
+    return {uvw.x, uvw.y, uvw.z};
+}
+CUDA_CALLABLE inline void adj_volume_index_to_world_dir(uint64_t id, vec3 uvw, uint64_t &adj_id, vec3 &adj_uvw,
+                                                        const vec3 &adj_ret)
+{
+    adj_volume_index_to_world(id, uvw, adj_id, adj_uvw, adj_ret);
+}
+CUDA_CALLABLE inline void adj_volume_world_to_index_dir(uint64_t id, vec3 xyz, uint64_t &adj_id, vec3 &adj_xyz,
+                                                        const vec3 &adj_ret)
+{
+    adj_volume_world_to_index(id, xyz, adj_id, adj_xyz, adj_ret);
+}
+} // namespace wp