PyPI - gstaichi - Versions diffs - 0.1.25.dev0__cp312-cp312-win_amd64.whl - Mend

gstaichi 0.1.25.dev0__cp312-cp312-win_amd64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (138) hide show

gstaichi/CHANGELOG.md +9 -0
gstaichi/__init__.py +40 -0
gstaichi/__main__.py +5 -0
gstaichi/_funcs.py +706 -0
gstaichi/_kernels.py +420 -0
gstaichi/_lib/__init__.py +3 -0
gstaichi/_lib/core/__init__.py +0 -0
gstaichi/_lib/core/gstaichi_python.cp312-win_amd64.pyd +0 -0
gstaichi/_lib/core/gstaichi_python.pyi +2937 -0
gstaichi/_lib/core/py.typed +0 -0
gstaichi/_lib/runtime/runtime_cuda.bc +0 -0
gstaichi/_lib/runtime/runtime_x64.bc +0 -0
gstaichi/_lib/runtime/slim_libdevice.10.bc +0 -0
gstaichi/_lib/utils.py +249 -0
gstaichi/_logging.py +131 -0
gstaichi/_main.py +545 -0
gstaichi/_snode/__init__.py +5 -0
gstaichi/_snode/fields_builder.py +187 -0
gstaichi/_snode/snode_tree.py +34 -0
gstaichi/_test_tools/__init__.py +0 -0
gstaichi/_test_tools/load_kernel_string.py +30 -0
gstaichi/_version.py +1 -0
gstaichi/_version_check.py +103 -0
gstaichi/ad/__init__.py +3 -0
gstaichi/ad/_ad.py +530 -0
gstaichi/algorithms/__init__.py +3 -0
gstaichi/algorithms/_algorithms.py +117 -0
gstaichi/assets/.git +1 -0
gstaichi/assets/Go-Regular.ttf +0 -0
gstaichi/assets/static/imgs/ti_gallery.png +0 -0
gstaichi/examples/minimal.py +28 -0
gstaichi/experimental.py +16 -0
gstaichi/lang/__init__.py +50 -0
gstaichi/lang/_ndarray.py +352 -0
gstaichi/lang/_ndrange.py +152 -0
gstaichi/lang/_template_mapper.py +199 -0
gstaichi/lang/_texture.py +172 -0
gstaichi/lang/_wrap_inspect.py +189 -0
gstaichi/lang/any_array.py +99 -0
gstaichi/lang/argpack.py +411 -0
gstaichi/lang/ast/__init__.py +5 -0
gstaichi/lang/ast/ast_transformer.py +1318 -0
gstaichi/lang/ast/ast_transformer_utils.py +341 -0
gstaichi/lang/ast/ast_transformers/__init__.py +0 -0
gstaichi/lang/ast/ast_transformers/call_transformer.py +267 -0
gstaichi/lang/ast/ast_transformers/function_def_transformer.py +320 -0
gstaichi/lang/ast/checkers.py +106 -0
gstaichi/lang/ast/symbol_resolver.py +57 -0
gstaichi/lang/ast/transform.py +9 -0
gstaichi/lang/common_ops.py +310 -0
gstaichi/lang/exception.py +80 -0
gstaichi/lang/expr.py +180 -0
gstaichi/lang/field.py +466 -0
gstaichi/lang/impl.py +1241 -0
gstaichi/lang/kernel_arguments.py +157 -0
gstaichi/lang/kernel_impl.py +1382 -0
gstaichi/lang/matrix.py +1881 -0
gstaichi/lang/matrix_ops.py +341 -0
gstaichi/lang/matrix_ops_utils.py +190 -0
gstaichi/lang/mesh.py +687 -0
gstaichi/lang/misc.py +778 -0
gstaichi/lang/ops.py +1494 -0
gstaichi/lang/runtime_ops.py +13 -0
gstaichi/lang/shell.py +35 -0
gstaichi/lang/simt/__init__.py +5 -0
gstaichi/lang/simt/block.py +94 -0
gstaichi/lang/simt/grid.py +7 -0
gstaichi/lang/simt/subgroup.py +191 -0
gstaichi/lang/simt/warp.py +96 -0
gstaichi/lang/snode.py +489 -0
gstaichi/lang/source_builder.py +150 -0
gstaichi/lang/struct.py +855 -0
gstaichi/lang/util.py +381 -0
gstaichi/linalg/__init__.py +8 -0
gstaichi/linalg/matrixfree_cg.py +310 -0
gstaichi/linalg/sparse_cg.py +59 -0
gstaichi/linalg/sparse_matrix.py +303 -0
gstaichi/linalg/sparse_solver.py +123 -0
gstaichi/math/__init__.py +11 -0
gstaichi/math/_complex.py +205 -0
gstaichi/math/mathimpl.py +886 -0
gstaichi/profiler/__init__.py +6 -0
gstaichi/profiler/kernel_metrics.py +260 -0
gstaichi/profiler/kernel_profiler.py +586 -0
gstaichi/profiler/memory_profiler.py +15 -0
gstaichi/profiler/scoped_profiler.py +36 -0
gstaichi/sparse/__init__.py +3 -0
gstaichi/sparse/_sparse_grid.py +77 -0
gstaichi/tools/__init__.py +12 -0
gstaichi/tools/diagnose.py +117 -0
gstaichi/tools/np2ply.py +364 -0
gstaichi/tools/vtk.py +38 -0
gstaichi/types/__init__.py +19 -0
gstaichi/types/annotations.py +47 -0
gstaichi/types/compound_types.py +90 -0
gstaichi/types/enums.py +49 -0
gstaichi/types/ndarray_type.py +147 -0
gstaichi/types/primitive_types.py +206 -0
gstaichi/types/quant.py +88 -0
gstaichi/types/texture_type.py +85 -0
gstaichi/types/utils.py +13 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools/cmake/SPIRV-ToolsConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools/cmake/SPIRV-ToolsTarget-release.cmake +29 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools/cmake/SPIRV-ToolsTarget.cmake +113 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-diff/cmake/SPIRV-Tools-diffConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-diff/cmake/SPIRV-Tools-diffTargets-release.cmake +19 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-diff/cmake/SPIRV-Tools-diffTargets.cmake +122 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-link/cmake/SPIRV-Tools-linkConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-link/cmake/SPIRV-Tools-linkTargets-release.cmake +19 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-link/cmake/SPIRV-Tools-linkTargets.cmake +122 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-lint/cmake/SPIRV-Tools-lintConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-lint/cmake/SPIRV-Tools-lintTargets-release.cmake +19 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-lint/cmake/SPIRV-Tools-lintTargets.cmake +122 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-opt/cmake/SPIRV-Tools-optConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-opt/cmake/SPIRV-Tools-optTargets-release.cmake +19 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-opt/cmake/SPIRV-Tools-optTargets.cmake +122 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-reduce/cmake/SPIRV-Tools-reduceConfig.cmake +5 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-reduce/cmake/SPIRV-Tools-reduceTarget-release.cmake +19 -0
gstaichi-0.1.25.dev0.data/data/SPIRV-Tools-reduce/cmake/SPIRV-Tools-reduceTarget.cmake +122 -0
gstaichi-0.1.25.dev0.data/data/bin/SPIRV-Tools-shared.dll +0 -0
gstaichi-0.1.25.dev0.data/data/include/spirv-tools/instrument.hpp +268 -0
gstaichi-0.1.25.dev0.data/data/include/spirv-tools/libspirv.h +907 -0
gstaichi-0.1.25.dev0.data/data/include/spirv-tools/libspirv.hpp +375 -0
gstaichi-0.1.25.dev0.data/data/include/spirv-tools/linker.hpp +97 -0
gstaichi-0.1.25.dev0.data/data/include/spirv-tools/optimizer.hpp +970 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-diff.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-link.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-lint.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-opt.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-reduce.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools-shared.lib +0 -0
gstaichi-0.1.25.dev0.data/data/lib/SPIRV-Tools.lib +0 -0
gstaichi-0.1.25.dev0.dist-info/METADATA +105 -0
gstaichi-0.1.25.dev0.dist-info/RECORD +138 -0
gstaichi-0.1.25.dev0.dist-info/WHEEL +5 -0
gstaichi-0.1.25.dev0.dist-info/entry_points.txt +2 -0
gstaichi-0.1.25.dev0.dist-info/licenses/LICENSE +201 -0
gstaichi-0.1.25.dev0.dist-info/top_level.txt +1 -0

gstaichi/lang/util.py ADDED Viewed

@@ -0,0 +1,381 @@
+# type: ignore
+import functools
+import os
+import traceback
+import warnings
+import numpy as np
+from colorama import Fore, Style
+from gstaichi._lib import core as _ti_core
+from gstaichi._logging import is_logging_effective
+from gstaichi.lang import impl
+from gstaichi.types.primitive_types import (
+    f16,
+    f32,
+    f64,
+    i8,
+    i16,
+    i32,
+    i64,
+    u1,
+    u8,
+    u16,
+    u32,
+    u64,
+)
+def has_pytorch():
+    """Whether has pytorch in the current Python environment.
+    Returns:
+        bool: True if has pytorch else False.
+    """
+    _has_pytorch = False
+    _env_torch = os.environ.get("TI_ENABLE_TORCH", "1")
+    if not _env_torch or int(_env_torch):
+        try:
+            import torch  # pylint: disable=C0415
+            _has_pytorch = True
+        except:
+            pass
+    return _has_pytorch
+def has_paddle():
+    """Whether has paddle in the current Python environment.
+    Returns:
+        bool: True if has paddle else False.
+    """
+    _has_paddle = False
+    _env_paddle = os.environ.get("TI_ENABLE_PADDLE", "1")
+    if not _env_paddle or int(_env_paddle):
+        try:
+            import paddle  # pylint: disable=C0415
+            _has_paddle = True
+        except:
+            pass
+    return _has_paddle
+def get_clangpp():
+    from distutils.spawn import find_executable  # pylint: disable=C0415
+    # GsTaichi itself uses llvm-10.0.0 to compile.
+    # There will be some issues compiling CUDA with other clang++ version.
+    _clangpp_candidates = ["clang++-10"]
+    for c in _clangpp_candidates:
+        if find_executable(c) is not None:
+            _clangpp_presence = find_executable(c)
+            return _clangpp_presence
+    return None
+def has_clangpp():
+    return get_clangpp() is not None
+def is_matrix_class(rhs):
+    matrix_class = False
+    try:
+        if rhs._is_matrix_class:
+            matrix_class = True
+    except:
+        pass
+    return matrix_class
+def is_gstaichi_class(rhs):
+    gstaichi_class = False
+    try:
+        if rhs._is_gstaichi_class:
+            gstaichi_class = True
+    except:
+        pass
+    return gstaichi_class
+def to_numpy_type(dt):
+    """Convert gstaichi data type to its counterpart in numpy.
+    Args:
+        dt (DataType): The desired data type to convert.
+    Returns:
+        DataType: The counterpart data type in numpy.
+    """
+    if dt == f32:
+        return np.float32
+    if dt == f64:
+        return np.float64
+    if dt == i32:
+        return np.int32
+    if dt == i64:
+        return np.int64
+    if dt == i8:
+        return np.int8
+    if dt == i16:
+        return np.int16
+    if dt == u1:
+        return np.bool_
+    if dt == u8:
+        return np.uint8
+    if dt == u16:
+        return np.uint16
+    if dt == u32:
+        return np.uint32
+    if dt == u64:
+        return np.uint64
+    if dt == f16:
+        return np.half
+    assert False
+def to_pytorch_type(dt):
+    """Convert gstaichi data type to its counterpart in torch.
+    Args:
+        dt (DataType): The desired data type to convert.
+    Returns:
+        DataType: The counterpart data type in torch.
+    """
+    import torch  # pylint: disable=C0415
+    # pylint: disable=E1101
+    if dt == f32:
+        return torch.float32
+    if dt == f64:
+        return torch.float64
+    if dt == i32:
+        return torch.int32
+    if dt == i64:
+        return torch.int64
+    if dt == i8:
+        return torch.int8
+    if dt == i16:
+        return torch.int16
+    if dt == u1:
+        return torch.bool
+    if dt == u8:
+        return torch.uint8
+    if dt == f16:
+        return torch.float16
+    if dt in (u16, u32, u64):
+        if hasattr(torch, "uint16"):
+            if dt == u16:
+                return torch.uint16
+            if dt == u32:
+                return torch.uint32
+            if dt == u64:
+                return torch.uint64
+        raise RuntimeError(f"PyTorch doesn't support {dt.to_string()} data type before version 2.3.0.")
+    raise RuntimeError(f"PyTorch doesn't support {dt.to_string()} data type.")
+def to_paddle_type(dt):
+    """Convert gstaichi data type to its counterpart in paddle.
+    Args:
+        dt (DataType): The desired data type to convert.
+    Returns:
+        DataType: The counterpart data type in paddle.
+    """
+    import paddle  # pylint: disable=C0415
+    if dt == f32:
+        return paddle.float32
+    if dt == f64:
+        return paddle.float64
+    if dt == i32:
+        return paddle.int32
+    if dt == i64:
+        return paddle.int64
+    if dt == i8:
+        return paddle.int8
+    if dt == i16:
+        return paddle.int16
+    if dt == u1:
+        return paddle.bool
+    if dt == u8:
+        return paddle.uint8
+    if dt == f16:
+        return paddle.float16
+    if dt in (u16, u32, u64):
+        raise RuntimeError(f"Paddle doesn't support {dt.to_string()} data type.")
+    assert False
+def to_gstaichi_type(dt):
+    """Convert numpy or torch or paddle data type to its counterpart in gstaichi.
+    Args:
+        dt (DataType): The desired data type to convert.
+    Returns:
+        DataType: The counterpart data type in gstaichi.
+    """
+    if type(dt) == _ti_core.DataTypeCxx:
+        return dt
+    if dt == np.float32:
+        return f32
+    if dt == np.float64:
+        return f64
+    if dt == np.int32:
+        return i32
+    if dt == np.int64:
+        return i64
+    if dt == np.int8:
+        return i8
+    if dt == np.int16:
+        return i16
+    if dt == np.bool_:
+        return u1
+    if dt == np.uint8:
+        return u8
+    if dt == np.uint16:
+        return u16
+    if dt == np.uint32:
+        return u32
+    if dt == np.uint64:
+        return u64
+    if dt == np.half:
+        return f16
+    if has_pytorch():
+        import torch  # pylint: disable=C0415
+        # pylint: disable=E1101
+        if dt == torch.float32:
+            return f32
+        if dt == torch.float64:
+            return f64
+        if dt == torch.int32:
+            return i32
+        if dt == torch.int64:
+            return i64
+        if dt == torch.int8:
+            return i8
+        if dt == torch.int16:
+            return i16
+        if dt == torch.bool:
+            return u1
+        if dt == torch.uint8:
+            return u8
+        if dt == torch.float16:
+            return f16
+        if hasattr(torch, "uint16"):
+            if dt == torch.uint16:
+                return u16
+            if dt == torch.uint32:
+                return u32
+            if dt == torch.uint64:
+                return u64
+        raise RuntimeError(f"PyTorch doesn't support {dt.to_string()} data type before version 2.3.0.")
+    if has_paddle():
+        import paddle  # pylint: disable=C0415
+        if dt == paddle.float32:
+            return f32
+        if dt == paddle.float64:
+            return f64
+        if dt == paddle.int32:
+            return i32
+        if dt == paddle.int64:
+            return i64
+        if dt == paddle.int8:
+            return i8
+        if dt == paddle.int16:
+            return i16
+        if dt == paddle.bool:
+            return u1
+        if dt == paddle.uint8:
+            return u8
+        if dt == paddle.float16:
+            return f16
+        if dt in (u16, u32, u64):
+            raise RuntimeError(f"Paddle doesn't support {dt.to_string()} data type.")
+    raise AssertionError(f"Unknown type {dt}")
+def cook_dtype(dtype):
+    if isinstance(dtype, _ti_core.DataTypeCxx):
+        return dtype
+    if isinstance(dtype, _ti_core.Type):
+        return _ti_core.DataTypeCxx(dtype)
+    if dtype is float:
+        return impl.get_runtime().default_fp
+    if dtype is int:
+        return impl.get_runtime().default_ip
+    if dtype is bool:
+        return u1
+    raise ValueError(f"Invalid data type {dtype}")
+def in_gstaichi_scope():
+    return impl.inside_kernel()
+def in_python_scope():
+    return not in_gstaichi_scope()
+def gstaichi_scope(func):
+    @functools.wraps(func)
+    def wrapped(*args, **kwargs):
+        assert in_gstaichi_scope(), f"{func.__name__} cannot be called in Python-scope"
+        return func(*args, **kwargs)
+    return wrapped
+def python_scope(func):
+    @functools.wraps(func)
+    def wrapped(*args, **kwargs):
+        assert in_python_scope(), f"{func.__name__} cannot be called in GsTaichi-scope"
+        return func(*args, **kwargs)
+    return wrapped
+def warning(msg, warning_type=UserWarning, stacklevel=1, print_stack=True):
+    """Print a warning message. Note that the builtin `warnings` module is
+    unreliable since it may be suppressed by other packages such as IPython.
+    Args:
+        msg (str): message to print.
+        warning_type (Type[Warning]): type of warning.
+        stacklevel (int): warning stack level from the caller.
+        print_stack (bool): whether to print the stack
+    """
+    if not is_logging_effective("warn"):
+        return
+    if print_stack:
+        msg += f"\n{get_traceback(stacklevel)}"
+    warnings.warn(Fore.YELLOW + Style.BRIGHT + msg + Style.RESET_ALL, warning_type)
+def get_traceback(stacklevel=1):
+    s = traceback.extract_stack()[: -1 - stacklevel]
+    return "".join(traceback.format_list(s))
+__all__ = []

gstaichi/linalg/__init__.py ADDED Viewed

@@ -0,0 +1,8 @@
+# type: ignore
+"""GsTaichi support module for sparse matrix operations."""
+from gstaichi.linalg.matrixfree_cg import *
+from gstaichi.linalg.sparse_cg import SparseCG
+from gstaichi.linalg.sparse_matrix import *
+from gstaichi.linalg.sparse_solver import SparseSolver

gstaichi/linalg/matrixfree_cg.py ADDED Viewed

@@ -0,0 +1,310 @@
+# type: ignore
+from math import sqrt
+from gstaichi.lang import misc
+from gstaichi.lang.exception import GsTaichiRuntimeError, GsTaichiTypeError
+from gstaichi.lang.impl import FieldsBuilder, field, grouped
+from gstaichi.lang.kernel_impl import data_oriented, kernel
+from gstaichi.types import primitive_types, template
+@data_oriented
+class LinearOperator:
+    def __init__(self, matvec_kernel):
+        self._matvec = matvec_kernel
+    def matvec(self, x, Ax):
+        if x.shape != Ax.shape:
+            raise GsTaichiRuntimeError(f"Dimension mismatch x.shape{x.shape} != Ax.shape{Ax.shape}.")
+        self._matvec(x, Ax)
+def MatrixFreeCG(A, b, x, tol=1e-6, maxiter=5000, quiet=True):
+    """Matrix-free conjugate-gradient solver.
+    Use conjugate-gradient method to solve the linear system Ax = b, where A is implicitly
+    represented as a LinearOperator.
+    Args:
+        A (LinearOperator): The coefficient matrix A of the linear system.
+        b (Field): The right-hand side of the linear system.
+        x (Field): The initial guess for the solution.
+        maxiter (int): Maximum number of iterations.
+        atol: Tolerance(absolute) for convergence.
+        quiet (bool): Switch to turn on/off iteration log.
+    """
+    if b.dtype != x.dtype:
+        raise GsTaichiTypeError(f"Dtype mismatch b.dtype({b.dtype}) != x.dtype({x.dtype}).")
+    if str(b.dtype) == "f32":
+        solver_dtype = primitive_types.f32
+    elif str(b.dtype) == "f64":
+        solver_dtype = primitive_types.f64
+    else:
+        raise GsTaichiTypeError(f"Not supported dtype: {b.dtype}")
+    if b.shape != x.shape:
+        raise GsTaichiRuntimeError(f"Dimension mismatch b.shape{b.shape} != x.shape{x.shape}.")
+    size = b.shape
+    vector_fields_builder = FieldsBuilder()
+    p = field(dtype=solver_dtype)
+    r = field(dtype=solver_dtype)
+    Ap = field(dtype=solver_dtype)
+    Ax = field(dtype=solver_dtype)
+    if len(size) == 1:
+        axes = misc.i
+    elif len(size) == 2:
+        axes = misc.ij
+    elif len(size) == 3:
+        axes = misc.ijk
+    else:
+        raise GsTaichiRuntimeError(f"MatrixFreeCG only support 1D, 2D, 3D inputs; your inputs is {len(size)}-D.")
+    vector_fields_builder.dense(axes, size).place(p, r, Ap, Ax)
+    vector_fields_snode_tree = vector_fields_builder.finalize()
+    scalar_builder = FieldsBuilder()
+    alpha = field(dtype=solver_dtype)
+    beta = field(dtype=solver_dtype)
+    scalar_builder.place(alpha, beta)
+    scalar_snode_tree = scalar_builder.finalize()
+    @kernel
+    def init():
+        for I in grouped(x):
+            r[I] = b[I] - Ax[I]
+            p[I] = 0.0
+            Ap[I] = 0.0
+    @kernel
+    def reduce(p: template(), q: template()) -> solver_dtype:
+        result = solver_dtype(0.0)
+        for I in grouped(p):
+            result += p[I] * q[I]
+        return result
+    @kernel
+    def update_x():
+        for I in grouped(x):
+            x[I] += alpha[None] * p[I]
+    @kernel
+    def update_r():
+        for I in grouped(r):
+            r[I] -= alpha[None] * Ap[I]
+    @kernel
+    def update_p():
+        for I in grouped(p):
+            p[I] = r[I] + beta[None] * p[I]
+    def solve():
+        succeeded = True
+        A._matvec(x, Ax)
+        init()
+        initial_rTr = reduce(r, r)
+        if not quiet:
+            print(f">>> Initial residual = {initial_rTr:e}")
+        old_rTr = initial_rTr
+        new_rTr = initial_rTr
+        update_p()
+        if sqrt(initial_rTr) >= tol:  # Do nothing if the initial residual is small enough
+            # -- Main loop --
+            for i in range(maxiter):
+                A._matvec(p, Ap)  # compute Ap = A x p
+                pAp = reduce(p, Ap)
+                alpha[None] = old_rTr / pAp
+                update_x()
+                update_r()
+                new_rTr = reduce(r, r)
+                if sqrt(new_rTr) < tol:
+                    if not quiet:
+                        print(">>> Conjugate Gradient method converged.")
+                        print(f">>> #iterations {i}")
+                    break
+                beta[None] = new_rTr / old_rTr
+                update_p()
+                old_rTr = new_rTr
+                if not quiet:
+                    print(f">>> Iter = {i+1:4}, Residual = {sqrt(new_rTr):e}")
+        if new_rTr >= tol:
+            if not quiet:
+                print(
+                    f">>> Conjugate Gradient method failed to converge in {maxiter} iterations: Residual = {sqrt(new_rTr):e}"
+                )
+            succeeded = False
+        return succeeded
+    succeeded = solve()
+    vector_fields_snode_tree.destroy()
+    scalar_snode_tree.destroy()
+    return succeeded
+def MatrixFreeBICGSTAB(A, b, x, tol=1e-6, maxiter=5000, quiet=True):
+    """Matrix-free biconjugate-gradient stabilized solver (BiCGSTAB).
+    Use BiCGSTAB method to solve the linear system Ax = b, where A is implicitly
+    represented as a LinearOperator.
+    Args:
+        A (LinearOperator): The coefficient matrix A of the linear system.
+        b (Field): The right-hand side of the linear system.
+        x (Field): The initial guess for the solution.
+        maxiter (int): Maximum number of iterations.
+        atol: Tolerance(absolute) for convergence.
+        quiet (bool): Switch to turn on/off iteration log.
+    """
+    if b.dtype != x.dtype:
+        raise GsTaichiTypeError(f"Dtype mismatch b.dtype({b.dtype}) != x.dtype({x.dtype}).")
+    if str(b.dtype) == "f32":
+        solver_dtype = primitive_types.f32
+    elif str(b.dtype) == "f64":
+        solver_dtype = primitive_types.f64
+    else:
+        raise GsTaichiTypeError(f"Not supported dtype: {b.dtype}")
+    if b.shape != x.shape:
+        raise GsTaichiRuntimeError(f"Dimension mismatch b.shape{b.shape} != x.shape{x.shape}.")
+    size = b.shape
+    vector_fields_builder = FieldsBuilder()
+    p = field(dtype=solver_dtype)
+    p_hat = field(dtype=solver_dtype)
+    r = field(dtype=solver_dtype)
+    r_tld = field(dtype=solver_dtype)
+    s = field(dtype=solver_dtype)
+    s_hat = field(dtype=solver_dtype)
+    t = field(dtype=solver_dtype)
+    Ap = field(dtype=solver_dtype)
+    Ax = field(dtype=solver_dtype)
+    Ashat = field(dtype=solver_dtype)
+    if len(size) == 1:
+        axes = misc.i
+    elif len(size) == 2:
+        axes = misc.ij
+    elif len(size) == 3:
+        axes = misc.ijk
+    else:
+        raise GsTaichiRuntimeError(f"MatrixFreeBICGSTAB only support 1D, 2D, 3D inputs; your inputs is {len(size)}-D.")
+    vector_fields_builder.dense(axes, size).place(p, p_hat, r, r_tld, s, s_hat, t, Ap, Ax, Ashat)
+    vector_fields_snode_tree = vector_fields_builder.finalize()
+    scalar_builder = FieldsBuilder()
+    alpha = field(dtype=solver_dtype)
+    beta = field(dtype=solver_dtype)
+    omega = field(dtype=solver_dtype)
+    rho = field(dtype=solver_dtype)
+    rho_1 = field(dtype=solver_dtype)
+    scalar_builder.place(alpha, beta, omega, rho, rho_1)
+    scalar_snode_tree = scalar_builder.finalize()
+    succeeded = True
+    @kernel
+    def init():
+        for I in grouped(x):
+            r[I] = b[I] - Ax[I]
+            r_tld[I] = b[I]
+            p[I] = 0.0
+            Ap[I] = 0.0
+            Ashat[I] = 0.0
+        rho[None] = 0.0
+        rho_1[None] = 1.0
+        alpha[None] = 1.0
+        beta[None] = 1.0
+        omega[None] = 1.0
+    @kernel
+    def reduce(p: template(), q: template()) -> solver_dtype:
+        result = solver_dtype(0.0)
+        for I in grouped(p):
+            result += p[I] * q[I]
+        return result
+    @kernel
+    def copy(orig: template(), dest: template()):
+        for I in grouped(orig):
+            dest[I] = orig[I]
+    @kernel
+    def update_p():
+        for I in grouped(p):
+            p[I] = r[I] + beta[None] * (p[I] - omega[None] * Ap[I])
+    @kernel
+    def update_phat():
+        for I in grouped(p_hat):
+            p_hat[I] = p[I]
+    @kernel
+    def update_s():
+        for I in grouped(s):
+            s[I] = r[I] - alpha[None] * Ap[I]
+    @kernel
+    def update_shat():
+        for I in grouped(s_hat):
+            s_hat[I] = s[I]
+    @kernel
+    def update_x():
+        for I in grouped(x):
+            x[I] += alpha[None] * p_hat[I] + omega[None] * s_hat[I]
+    @kernel
+    def update_r():
+        for I in grouped(r):
+            r[I] = s[I] - omega[None] * t[I]
+    def solve():
+        succeeded = True
+        A._matvec(x, Ax)
+        init()
+        initial_rTr = reduce(r, r)
+        rTr = initial_rTr
+        if not quiet:
+            print(f">>> Initial residual = {initial_rTr:e}")
+        if sqrt(initial_rTr) >= tol:  # Do nothing if the initial residual is small enough
+            for i in range(maxiter):
+                rho[None] = reduce(r, r_tld)
+                if rho[None] == 0.0:
+                    if not quiet:
+                        print(">>> BICGSTAB failed because r@r_tld = 0.")
+                    succeeded = False
+                    break
+                if i == 0:
+                    copy(orig=r, dest=p)
+                else:
+                    beta[None] = (rho[None] / rho_1[None]) * (alpha[None] / omega[None])
+                    update_p()
+                update_phat()
+                A._matvec(p, Ap)
+                alpha_lower = reduce(r_tld, Ap)
+                alpha[None] = rho[None] / alpha_lower
+                update_s()
+                update_shat()
+                A._matvec(s_hat, Ashat)
+                copy(orig=Ashat, dest=t)
+                omega_upper = reduce(t, s)
+                omega_lower = reduce(t, t)
+                omega[None] = omega_upper / (omega_lower + 1e-16) if omega_lower == 0.0 else omega_upper / omega_lower
+                update_x()
+                update_r()
+                rTr = reduce(r, r)
+                if not quiet:
+                    print(f">>> Iter = {i+1:4}, Residual = {sqrt(rTr):e}")
+                if sqrt(rTr) < tol:
+                    if not quiet:
+                        print(f">>> BICGSTAB method converged at #iterations {i}")
+                    break
+                rho_1[None] = rho[None]
+        if rTr >= tol:
+            if not quiet:
+                print(f">>> BICGSTAB failed to converge in {maxiter} iterations: Residual = {sqrt(rTr):e}")
+            succeeded = False
+        return succeeded
+    succeeded = solve()
+    vector_fields_snode_tree.destroy()
+    scalar_snode_tree.destroy()
+    return succeeded