PyPI - brainstate - Versions diffs - 0.0.2.post20241010__py2.py3-none-any.whl → 0.1.0__py2.py3-none-any.whl - Mend

brainstate 0.0.2.post20241010py2.py3-none-any.whl → 0.1.0py2.py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (175) hide show

brainstate/__init__.py +31 -11
brainstate/_state.py +760 -316
brainstate/_state_test.py +41 -12
brainstate/_utils.py +31 -4
brainstate/augment/__init__.py +40 -0
brainstate/augment/_autograd.py +608 -0
brainstate/augment/_autograd_test.py +1193 -0
brainstate/augment/_eval_shape.py +102 -0
brainstate/augment/_eval_shape_test.py +40 -0
brainstate/augment/_mapping.py +525 -0
brainstate/augment/_mapping_test.py +210 -0
brainstate/augment/_random.py +99 -0
brainstate/{transform → compile}/__init__.py +25 -13
brainstate/compile/_ad_checkpoint.py +204 -0
brainstate/compile/_ad_checkpoint_test.py +51 -0
brainstate/compile/_conditions.py +259 -0
brainstate/compile/_conditions_test.py +221 -0
brainstate/compile/_error_if.py +94 -0
brainstate/compile/_error_if_test.py +54 -0
brainstate/compile/_jit.py +314 -0
brainstate/compile/_jit_test.py +143 -0
brainstate/compile/_loop_collect_return.py +516 -0
brainstate/compile/_loop_collect_return_test.py +59 -0
brainstate/compile/_loop_no_collection.py +185 -0
brainstate/compile/_loop_no_collection_test.py +51 -0
brainstate/compile/_make_jaxpr.py +756 -0
brainstate/compile/_make_jaxpr_test.py +134 -0
brainstate/compile/_progress_bar.py +111 -0
brainstate/compile/_unvmap.py +159 -0
brainstate/compile/_util.py +147 -0
brainstate/environ.py +408 -381
brainstate/environ_test.py +34 -32
brainstate/{nn/event → event}/__init__.py +6 -6
brainstate/event/_csr.py +308 -0
brainstate/event/_csr_test.py +118 -0
brainstate/event/_fixed_probability.py +271 -0
brainstate/event/_fixed_probability_test.py +128 -0
brainstate/event/_linear.py +219 -0
brainstate/event/_linear_test.py +112 -0
brainstate/{nn/event → event}/_misc.py +7 -7
brainstate/functional/_activations.py +521 -511
brainstate/functional/_activations_test.py +300 -300
brainstate/functional/_normalization.py +43 -43
brainstate/functional/_others.py +15 -15
brainstate/functional/_spikes.py +49 -49
brainstate/graph/__init__.py +33 -0
brainstate/graph/_graph_context.py +443 -0
brainstate/graph/_graph_context_test.py +65 -0
brainstate/graph/_graph_convert.py +246 -0
brainstate/graph/_graph_node.py +300 -0
brainstate/graph/_graph_node_test.py +75 -0
brainstate/graph/_graph_operation.py +1746 -0
brainstate/graph/_graph_operation_test.py +724 -0
brainstate/init/_base.py +28 -10
brainstate/init/_generic.py +175 -172
brainstate/init/_random_inits.py +470 -415
brainstate/init/_random_inits_test.py +150 -0
brainstate/init/_regular_inits.py +66 -69
brainstate/init/_regular_inits_test.py +51 -0
brainstate/mixin.py +236 -244
brainstate/mixin_test.py +44 -46
brainstate/nn/__init__.py +26 -51
brainstate/nn/_collective_ops.py +199 -0
brainstate/nn/_dyn_impl/__init__.py +46 -0
brainstate/nn/_dyn_impl/_dynamics_neuron.py +290 -0
brainstate/nn/_dyn_impl/_dynamics_neuron_test.py +162 -0
brainstate/nn/_dyn_impl/_dynamics_synapse.py +320 -0
brainstate/nn/_dyn_impl/_dynamics_synapse_test.py +132 -0
brainstate/nn/_dyn_impl/_inputs.py +154 -0
brainstate/nn/{_projection/__init__.py → _dyn_impl/_projection_alignpost.py} +6 -13
brainstate/nn/_dyn_impl/_rate_rnns.py +400 -0
brainstate/nn/_dyn_impl/_rate_rnns_test.py +64 -0
brainstate/nn/_dyn_impl/_readout.py +128 -0
brainstate/nn/_dyn_impl/_readout_test.py +54 -0
brainstate/nn/_dynamics/__init__.py +37 -0
brainstate/nn/_dynamics/_dynamics_base.py +631 -0
brainstate/nn/_dynamics/_dynamics_base_test.py +79 -0
brainstate/nn/_dynamics/_projection_base.py +346 -0
brainstate/nn/_dynamics/_state_delay.py +453 -0
brainstate/nn/_dynamics/_synouts.py +161 -0
brainstate/nn/_dynamics/_synouts_test.py +58 -0
brainstate/nn/_elementwise/__init__.py +22 -0
brainstate/nn/_elementwise/_dropout.py +418 -0
brainstate/nn/_elementwise/_dropout_test.py +100 -0
brainstate/nn/_elementwise/_elementwise.py +1122 -0
brainstate/nn/_elementwise/_elementwise_test.py +171 -0
brainstate/nn/_exp_euler.py +97 -0
brainstate/nn/_exp_euler_test.py +36 -0
brainstate/nn/_interaction/__init__.py +32 -0
brainstate/nn/_interaction/_connections.py +726 -0
brainstate/nn/_interaction/_connections_test.py +254 -0
brainstate/nn/_interaction/_embedding.py +59 -0
brainstate/nn/_interaction/_normalizations.py +388 -0
brainstate/nn/_interaction/_normalizations_test.py +75 -0
brainstate/nn/_interaction/_poolings.py +1179 -0
brainstate/nn/_interaction/_poolings_test.py +219 -0
brainstate/nn/_module.py +328 -0
brainstate/nn/_module_test.py +211 -0
brainstate/nn/metrics.py +309 -309
brainstate/optim/__init__.py +14 -2
brainstate/optim/_base.py +66 -0
brainstate/optim/_lr_scheduler.py +363 -400
brainstate/optim/_lr_scheduler_test.py +25 -24
brainstate/optim/_optax_optimizer.py +103 -176
brainstate/optim/_optax_optimizer_test.py +41 -1
brainstate/optim/_sgd_optimizer.py +950 -1025
brainstate/random/_rand_funs.py +3269 -3268
brainstate/random/_rand_funs_test.py +568 -0
brainstate/random/_rand_seed.py +149 -117
brainstate/random/_rand_seed_test.py +50 -0
brainstate/random/_rand_state.py +1356 -1321
brainstate/random/_random_for_unit.py +13 -13
brainstate/surrogate.py +1262 -1243
brainstate/{nn/_projection/_utils.py → transform.py} +1 -2
brainstate/typing.py +157 -130
brainstate/util/__init__.py +52 -0
brainstate/util/_caller.py +100 -0
brainstate/util/_dict.py +734 -0
brainstate/util/_dict_test.py +160 -0
brainstate/util/_error.py +28 -0
brainstate/util/_filter.py +178 -0
brainstate/util/_others.py +497 -0
brainstate/util/_pretty_repr.py +208 -0
brainstate/util/_scaling.py +260 -0
brainstate/util/_struct.py +524 -0
brainstate/util/_tracers.py +75 -0
brainstate/{_visualization.py → util/_visualization.py} +16 -16
{brainstate-0.0.2.post20241010.dist-info → brainstate-0.1.0.dist-info}/METADATA +11 -11
brainstate-0.1.0.dist-info/RECORD +135 -0
brainstate/_module.py +0 -1637
brainstate/_module_test.py +0 -207
brainstate/nn/_base.py +0 -251
brainstate/nn/_connections.py +0 -686
brainstate/nn/_dynamics.py +0 -426
brainstate/nn/_elementwise.py +0 -1438
brainstate/nn/_embedding.py +0 -66
brainstate/nn/_misc.py +0 -133
brainstate/nn/_normalizations.py +0 -389
brainstate/nn/_others.py +0 -101
brainstate/nn/_poolings.py +0 -1229
brainstate/nn/_poolings_test.py +0 -231
brainstate/nn/_projection/_align_post.py +0 -546
brainstate/nn/_projection/_align_pre.py +0 -599
brainstate/nn/_projection/_delta.py +0 -241
brainstate/nn/_projection/_vanilla.py +0 -101
brainstate/nn/_rate_rnns.py +0 -410
brainstate/nn/_readout.py +0 -136
brainstate/nn/_synouts.py +0 -166
brainstate/nn/event/csr.py +0 -312
brainstate/nn/event/csr_test.py +0 -118
brainstate/nn/event/fixed_probability.py +0 -276
brainstate/nn/event/fixed_probability_test.py +0 -127
brainstate/nn/event/linear.py +0 -220
brainstate/nn/event/linear_test.py +0 -111
brainstate/random/random_test.py +0 -593
brainstate/transform/_autograd.py +0 -585
brainstate/transform/_autograd_test.py +0 -1181
brainstate/transform/_conditions.py +0 -334
brainstate/transform/_conditions_test.py +0 -220
brainstate/transform/_error_if.py +0 -94
brainstate/transform/_error_if_test.py +0 -55
brainstate/transform/_jit.py +0 -265
brainstate/transform/_jit_test.py +0 -118
brainstate/transform/_loop_collect_return.py +0 -502
brainstate/transform/_loop_no_collection.py +0 -170
brainstate/transform/_make_jaxpr.py +0 -739
brainstate/transform/_make_jaxpr_test.py +0 -131
brainstate/transform/_mapping.py +0 -109
brainstate/transform/_progress_bar.py +0 -111
brainstate/transform/_unvmap.py +0 -143
brainstate/util.py +0 -746
brainstate-0.0.2.post20241010.dist-info/RECORD +0 -87
{brainstate-0.0.2.post20241010.dist-info → brainstate-0.1.0.dist-info}/LICENSE +0 -0
{brainstate-0.0.2.post20241010.dist-info → brainstate-0.1.0.dist-info}/WHEEL +0 -0
{brainstate-0.0.2.post20241010.dist-info → brainstate-0.1.0.dist-info}/top_level.txt +0 -0

brainstate/augment/_autograd_test.py ADDED Viewed

@@ -0,0 +1,1193 @@
+# Copyright 2024 BDP Ecosystem Limited. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ==============================================================================
+# -*- coding: utf-8 -*-
+from __future__ import annotations
+import unittest
+from pprint import pprint
+import jax
+import jax.numpy as jnp
+import pytest
+import brainstate as bst
+from brainstate.augment._autograd import _jacfwd
+class TestPureFuncGrad(unittest.TestCase):
+    def test_grad_pure_func_1(self):
+        def call(a, b, c): return jnp.sum(a + b + c)
+        bst.random.seed(1)
+        a = jnp.ones(10)
+        b = bst.random.randn(10)
+        c = bst.random.uniform(size=10)
+        f_grad = bst.augment.grad(call, argnums=[0, 1, 2])
+        grads = f_grad(a, b, c)
+        for g in grads: assert (g == 1.).all()
+    def test_grad_pure_func_2(self):
+        def call(a, b, c): return jnp.sum(a + b + c)
+        bst.random.seed(1)
+        a = jnp.ones(10)
+        b = bst.random.randn(10)
+        c = bst.random.uniform(size=10)
+        f_grad = bst.augment.grad(call)
+        assert (f_grad(a, b, c) == 1.).all()
+    def test_grad_pure_func_aux1(self):
+        def call(a, b, c):
+            return jnp.sum(a + b + c), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(1)
+        f_grad = bst.augment.grad(call, argnums=[0, 1, 2])
+        with pytest.raises(TypeError):
+            f_grad(jnp.ones(10), bst.random.randn(10), bst.random.uniform(size=10))
+    def test_grad_pure_func_aux2(self):
+        def call(a, b, c):
+            return jnp.sum(a + b + c), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(1)
+        f_grad = bst.augment.grad(call, argnums=[0, 1, 2], has_aux=True)
+        grads, aux = f_grad(jnp.ones(10), bst.random.randn(10), bst.random.uniform(size=10))
+        for g in grads: assert (g == 1.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+    def test_grad_pure_func_return1(self):
+        def call(a, b, c): return jnp.sum(a + b + c)
+        bst.random.seed(1)
+        a = jnp.ones(10)
+        b = bst.random.randn(10)
+        c = bst.random.uniform(size=10)
+        f_grad = bst.augment.grad(call, return_value=True)
+        grads, returns = f_grad(a, b, c)
+        assert (grads == 1.).all()
+        assert returns == jnp.sum(a + b + c)
+    def test_grad_func_return_aux1(self):
+        def call(a, b, c):
+            return jnp.sum(a + b + c), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(1)
+        a = jnp.ones(10)
+        b = bst.random.randn(10)
+        c = bst.random.uniform(size=10)
+        f_grad = bst.augment.grad(call, return_value=True, has_aux=True)
+        grads, returns, aux = f_grad(a, b, c)
+        assert (grads == 1.).all()
+        assert returns == jnp.sum(a + b + c)
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+class TestObjectFuncGrad(unittest.TestCase):
+    def test_grad_ob1(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self):
+                return jnp.sum(self.a.value + self.b.value + self.c.value)
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states={'a': t.a, 'b': t.b, 'c': t.c})
+        grads = f_grad()
+        for g in grads.values():
+            assert (g == 1.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=[t.a, t.b])
+        grads = f_grad()
+        for g in grads: assert (g == 1.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.a)
+        grads = f_grad()
+        assert (grads == 1.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states())
+        grads = f_grad()
+        for g in grads.values():
+            assert (g == 1.).all()
+    def test_grad_ob_aux(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self):
+                return jnp.sum(self.a.value + self.b.value + self.c.value), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=[t.a, t.b], has_aux=True)
+        grads, aux = f_grad()
+        for g in grads: assert (g == 1.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.a, has_aux=True)
+        grads, aux = f_grad()
+        assert (grads == 1.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states(), has_aux=True)
+        grads, aux = f_grad()
+        self.assertTrue(len(grads) == len(t.states()))
+    def test_grad_ob_return(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self):
+                return jnp.sum(self.a.value + self.b.value + self.c.value)
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=[t.a, t.b], return_value=True)
+        grads, returns = f_grad()
+        for g in grads: assert (g == 1.).all()
+        assert returns == t()
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.a, return_value=True)
+        grads, returns = f_grad()
+        assert (grads == 1.).all()
+        assert returns == t()
+    def test_grad_ob_aux_return(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self):
+                return jnp.sum(self.a.value + self.b.value + self.c.value), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=[t.a, t.b], has_aux=True, return_value=True)
+        grads, returns, aux = f_grad()
+        for g in grads: assert (g == 1.).all()
+        assert returns == jnp.sum(t.a.value + t.b.value + t.c.value)
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.a, has_aux=True, return_value=True)
+        grads, returns, aux = f_grad()
+        assert (grads == 1.).all()
+        assert returns == jnp.sum(t.a.value + t.b.value + t.c.value)
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+    def test_grad_ob_argnums(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                bst.random.seed()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self, d):
+                return jnp.sum(self.a.value + self.b.value + self.c.value + 2 * d)
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, t.states(), argnums=0)
+        var_grads, arg_grads = f_grad(bst.random.random(10))
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads == 2.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, t.states(), argnums=[0])
+        var_grads, arg_grads = f_grad(bst.random.random(10))
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads[0] == 2.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=0)
+        arg_grads = f_grad(bst.random.random(10))
+        assert (arg_grads == 2.).all()
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=[0])
+        arg_grads = f_grad(bst.random.random(10))
+        assert (arg_grads[0] == 2.).all()
+    def test_grad_ob_argnums_aux(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self, d):
+                return jnp.sum(self.a.value + self.b.value + self.c.value + 2 * d), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states(), argnums=0, has_aux=True)
+        (var_grads, arg_grads), aux = f_grad(bst.random.random(10))
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states(), argnums=[0], has_aux=True)
+        (var_grads, arg_grads), aux = f_grad(bst.random.random(10))
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads[0] == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=0, has_aux=True)
+        arg_grads, aux = f_grad(bst.random.random(10))
+        assert (arg_grads == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=[0], has_aux=True)
+        arg_grads, aux = f_grad(bst.random.random(10))
+        assert (arg_grads[0] == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+    def test_grad_ob_argnums_return(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self, d):
+                return jnp.sum(self.a.value + self.b.value + self.c.value + 2 * d)
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, t.states(), argnums=0, return_value=True)
+        d = bst.random.random(10)
+        (var_grads, arg_grads), loss = f_grad(d)
+        for g in var_grads.values():
+            assert (g == 1.).all()
+        assert (arg_grads == 2.).all()
+        assert loss == t(d)
+        t = Test()
+        f_grad = bst.augment.grad(t, t.states(), argnums=[0], return_value=True)
+        d = bst.random.random(10)
+        (var_grads, arg_grads), loss = f_grad(d)
+        for g in var_grads.values():
+            assert (g == 1.).all()
+        assert (arg_grads[0] == 2.).all()
+        assert loss == t(d)
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=0, return_value=True)
+        d = bst.random.random(10)
+        arg_grads, loss = f_grad(d)
+        assert (arg_grads == 2.).all()
+        assert loss == t(d)
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=[0], return_value=True)
+        d = bst.random.random(10)
+        arg_grads, loss = f_grad(d)
+        assert (arg_grads[0] == 2.).all()
+        assert loss == t(d)
+    def test_grad_ob_argnums_aux_return(self):
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.a = bst.ParamState(jnp.ones(10))
+                self.b = bst.ParamState(bst.random.randn(10))
+                self.c = bst.ParamState(bst.random.uniform(size=10))
+            def __call__(self, d):
+                return jnp.sum(self.a.value + self.b.value + self.c.value + 2 * d), (jnp.sin(100), jnp.exp(0.1))
+        bst.random.seed(0)
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states(), argnums=0, has_aux=True, return_value=True)
+        d = bst.random.random(10)
+        (var_grads, arg_grads), loss, aux = f_grad(d)
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        assert loss == t(d)[0]
+        t = Test()
+        f_grad = bst.augment.grad(t, grad_states=t.states(), argnums=[0], has_aux=True, return_value=True)
+        d = bst.random.random(10)
+        (var_grads, arg_grads), loss, aux = f_grad(d)
+        for g in var_grads.values(): assert (g == 1.).all()
+        assert (arg_grads[0] == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        assert loss == t(d)[0]
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=0, has_aux=True, return_value=True)
+        d = bst.random.random(10)
+        arg_grads, loss, aux = f_grad(d)
+        assert (arg_grads == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        assert loss == t(d)[0]
+        t = Test()
+        f_grad = bst.augment.grad(t, argnums=[0], has_aux=True, return_value=True)
+        d = bst.random.random(10)
+        arg_grads, loss, aux = f_grad(d)
+        assert (arg_grads[0] == 2.).all()
+        assert aux[0] == jnp.sin(100)
+        assert aux[1] == jnp.exp(0.1)
+        assert loss == t(d)[0]
+class TestPureFuncJacobian(unittest.TestCase):
+    def test1(self):
+        jac, aux = _jacfwd(lambda x: (x ** 3, [x ** 2]), has_aux=True)(3.)
+        self.assertTrue(jax.numpy.allclose(jac, jax.jacfwd(lambda x: x ** 3)(3.)))
+        self.assertTrue(aux[0] == 9.)
+    def test_jacfwd_and_aux_nested(self):
+        def f(x):
+            jac, aux = _jacfwd(lambda x: (x ** 3, [x ** 3]), has_aux=True)(x)
+            return aux[0]
+        f2 = lambda x: x ** 3
+        self.assertEqual(_jacfwd(f)(4.), _jacfwd(f2)(4.))
+        self.assertEqual(jax.jit(_jacfwd(f))(4.), _jacfwd(f2)(4.))
+        self.assertEqual(jax.jit(_jacfwd(jax.jit(f)))(4.), _jacfwd(f2)(4.))
+        self.assertEqual(_jacfwd(f)(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+        self.assertEqual(jax.jit(_jacfwd(f))(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+        self.assertEqual(jax.jit(_jacfwd(jax.jit(f)))(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+        def f(x):
+            jac, aux = _jacfwd(lambda x: (x ** 3, [x ** 3]), has_aux=True)(x)
+            return aux[0] * jnp.sin(x)
+        f2 = lambda x: x ** 3 * jnp.sin(x)
+        self.assertEqual(_jacfwd(f)(4.), _jacfwd(f2)(4.))
+        self.assertEqual(jax.jit(_jacfwd(f))(4.), _jacfwd(f2)(4.))
+        self.assertEqual(jax.jit(_jacfwd(jax.jit(f)))(4.), _jacfwd(f2)(4.))
+        self.assertEqual(_jacfwd(f)(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+        self.assertEqual(jax.jit(_jacfwd(f))(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+        self.assertEqual(jax.jit(_jacfwd(jax.jit(f)))(jnp.asarray(4.)), _jacfwd(f2)(jnp.asarray(4.)))
+    def test_jacrev1(self):
+        def f1(x, y):
+            r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r
+        br = bst.augment.jacrev(f1)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        jr = jax.jacrev(f1)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        assert (br == jr).all()
+        br = bst.augment.jacrev(f1, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        jr = jax.jacrev(f1, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        assert (br[0] == jr[0]).all()
+        assert (br[1] == jr[1]).all()
+    def test_jacrev2(self):
+        print()
+        def f2(x, y):
+            r1 = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1]])
+            r2 = jnp.asarray([4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r1, r2
+        jr = jax.jacrev(f2)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(jr)
+        br = bst.augment.jacrev(f2)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0], jr[0])
+        assert jnp.array_equal(br[1], jr[1])
+        br = bst.augment.jacrev(f2)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0], jr[0])
+        assert jnp.array_equal(br[1], jr[1])
+        def f2(x, y):
+            r1 = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1]])
+            r2 = jnp.asarray([4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r1, r2
+        br = bst.augment.jacrev(f2)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0], jr[0])
+        assert jnp.array_equal(br[1], jr[1])
+        br = bst.augment.jacrev(f2)(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0], jr[0])
+        assert jnp.array_equal(br[1], jr[1])
+    def test_jacrev3(self):
+        print()
+        def f3(x, y):
+            r1 = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1]])
+            r2 = jnp.asarray([4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r1, r2
+        jr = jax.jacrev(f3, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(jr)
+        br = bst.augment.jacrev(f3, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0][0], jr[0][0])
+        assert jnp.array_equal(br[0][1], jr[0][1])
+        assert jnp.array_equal(br[1][0], jr[1][0])
+        assert jnp.array_equal(br[1][1], jr[1][1])
+        br = bst.augment.jacrev(f3, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0][0], jr[0][0])
+        assert jnp.array_equal(br[0][1], jr[0][1])
+        assert jnp.array_equal(br[1][0], jr[1][0])
+        assert jnp.array_equal(br[1][1], jr[1][1])
+        def f3(x, y):
+            r1 = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1]])
+            r2 = jnp.asarray([4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r1, r2
+        br = bst.augment.jacrev(f3, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0][0], jr[0][0])
+        assert jnp.array_equal(br[0][1], jr[0][1])
+        assert jnp.array_equal(br[1][0], jr[1][0])
+        assert jnp.array_equal(br[1][1], jr[1][1])
+        br = bst.augment.jacrev(f3, argnums=(0, 1))(jnp.array([1., 2., 3.]), jnp.array([10., 5.]))
+        pprint(br)
+        assert jnp.array_equal(br[0][0], jr[0][0])
+        assert jnp.array_equal(br[0][1], jr[0][1])
+        assert jnp.array_equal(br[1][0], jr[1][0])
+        assert jnp.array_equal(br[1][1], jr[1][1])
+    def test_jacrev_aux1(self):
+        x = jnp.array([1., 2., 3.])
+        y = jnp.array([10., 5.])
+        def f1(x, y):
+            a = 4 * x[1] ** 2 - 2 * x[2]
+            r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], a, x[2] * jnp.sin(x[0])])
+            return r, a
+        f2 = lambda *args: f1(*args)[0]
+        jr = jax.jacrev(f2)(x, y)  # jax jacobian
+        pprint(jr)
+        grads, aux = bst.augment.jacrev(f1, has_aux=True)(x, y)
+        assert (grads == jr).all()
+        assert aux == (4 * x[1] ** 2 - 2 * x[2])
+        jr = jax.jacrev(f2, argnums=(0, 1))(x, y)  # jax jacobian
+        pprint(jr)
+        grads, aux = bst.augment.jacrev(f1, argnums=(0, 1), has_aux=True)(x, y)
+        assert (grads[0] == jr[0]).all()
+        assert (grads[1] == jr[1]).all()
+        assert aux == (4 * x[1] ** 2 - 2 * x[2])
+    def test_jacrev_return_aux1(self):
+        with bst.environ.context(precision=64):
+            def f1(x, y):
+                a = 4 * x[1] ** 2 - 2 * x[2]
+                r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], a, x[2] * jnp.sin(x[0])])
+                return r, a
+            _x = jnp.array([1., 2., 3.])
+            _y = jnp.array([10., 5.])
+            _r, _a = f1(_x, _y)
+            f2 = lambda *args: f1(*args)[0]
+            _g1 = jax.jacrev(f2)(_x, _y)  # jax jacobian
+            pprint(_g1)
+            _g2 = jax.jacrev(f2, argnums=(0, 1))(_x, _y)  # jax jacobian
+            pprint(_g2)
+            grads, vec, aux = bst.augment.jacrev(f1, return_value=True, has_aux=True)(_x, _y)
+            assert (grads == _g1).all()
+            assert aux == _a
+            assert (vec == _r).all()
+            grads, vec, aux = bst.augment.jacrev(f1, return_value=True, argnums=(0, 1), has_aux=True)(_x, _y)
+            assert (grads[0] == _g2[0]).all()
+            assert (grads[1] == _g2[1]).all()
+            assert aux == _a
+            assert (vec == _r).all()
+class TestClassFuncJacobian(unittest.TestCase):
+    def test_jacrev1(self):
+        def f1(x, y):
+            r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+            return r
+        _x = jnp.array([1., 2., 3.])
+        _y = jnp.array([10., 5.])
+        class Test(bst.nn.Module):
+            def __init__(self):
+                super(Test, self).__init__()
+                self.x = bst.State(jnp.array([1., 2., 3.]))
+                self.y = bst.State(jnp.array([10., 5.]))
+            def __call__(self, ):
+                a = self.x.value[0] * self.y.value[0]
+                b = 5 * self.x.value[2] * self.y.value[1]
+                c = 4 * self.x.value[1] ** 2 - 2 * self.x.value[2]
+                d = self.x.value[2] * jnp.sin(self.x.value[0])
+                r = jnp.asarray([a, b, c, d])
+                return r
+        _jr = jax.jacrev(f1)(_x, _y)
+        t = Test()
+        br = bst.augment.jacrev(t, grad_states=t.x)()
+        self.assertTrue((br == _jr).all())
+        _jr = jax.jacrev(f1, argnums=(0, 1))(_x, _y)
+        t = Test()
+        br = bst.augment.jacrev(t, grad_states=[t.x, t.y])()
+        self.assertTrue((br[0] == _jr[0]).all())
+        self.assertTrue((br[1] == _jr[1]).all())
+#
+#   def test_jacfwd1(self):
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#         self.y = jnp.Variable(jnp.array([10., 5.]))
+#
+#       def __call__(self, ):
+#         a = self.x[0] * self.y[0]
+#         b = 5 * self.x[2] * self.y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r
+#
+#     _jr = jax.jacfwd(f1)(_x, _y)
+#     t = Test()
+#     br = bst.augment.jacfwd(t, grad_states=t.x)()
+#     self.assertTrue((br == _jr).all())
+#
+#     _jr = jax.jacfwd(f1, argnums=(0, 1))(_x, _y)
+#     t = Test()
+#     br = bst.augment.jacfwd(t, grad_states=[t.x, t.y])()
+#     self.assertTrue((br[0] == _jr[0]).all())
+#     self.assertTrue((br[1] == _jr[1]).all())
+#
+#   def test_jacrev2(self):
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r
+#
+#     _jr = jax.jacrev(f1)(_x, _y)
+#     t = Test()
+#     br = bst.augment.jacrev(t, grad_states=t.x)(_y)
+#     self.assertTrue((br == _jr).all())
+#
+#     _jr = jax.jacrev(f1, argnums=(0, 1))(_x, _y)
+#     t = Test()
+#     var_grads, arg_grads = bst.augment.jacrev(t, grad_states=t.x, argnums=0)(_y)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#
+#   def test_jacfwd2(self):
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r
+#
+#     _jr = jax.jacfwd(f1)(_x, _y)
+#     t = Test()
+#     br = bst.augment.jacfwd(t, grad_states=t.x)(_y)
+#     self.assertTrue((br == _jr).all())
+#
+#     _jr = jax.jacfwd(f1, argnums=(0, 1))(_x, _y)
+#     t = Test()
+#     var_grads, arg_grads = bst.augment.jacfwd(t, grad_states=t.x, argnums=0)(_y)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#
+#   def test_jacrev_aux1(self):
+#     jnp.enable_x64()
+#
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r, (c, d)
+#
+#     _jr = jax.jacrev(f1)(_x, _y)
+#     t = Test()
+#     br, _ = bst.augment.jacrev(t, grad_states=t.x, has_aux=True)(_y)
+#     self.assertTrue((br == _jr).all())
+#
+#     t = Test()
+#     _jr = jax.jacrev(f1, argnums=(0, 1))(_x, _y)
+#     _aux = t(_y)[1]
+#     (var_grads, arg_grads), aux = bst.augment.jacrev(t, grad_states=t.x, argnums=0, has_aux=True)(_y)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#     self.assertTrue(jnp.array_equal(aux, _aux))
+#
+#     jnp.disable_x64()
+#
+#   def test_jacfwd_aux1(self):
+#     jnp.enable_x64()
+#
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r, (c, d)
+#
+#     _jr = jax.jacfwd(f1)(_x, _y)
+#     t = Test()
+#     br, (c, d) = bst.augment.jacfwd(t, grad_states=t.x, has_aux=True)(_y)
+#     # print(_jr)
+#     # print(br)
+#     a = (br == _jr)
+#     self.assertTrue(a.all())
+#
+#     t = Test()
+#     _jr = jax.jacfwd(f1, argnums=(0, 1))(_x, _y)
+#     _aux = t(_y)[1]
+#     (var_grads, arg_grads), aux = bst.augment.jacfwd(t, grad_states=t.x, argnums=0, has_aux=True)(_y)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#     self.assertTrue(jnp.array_equal(aux, _aux))
+#
+#     jnp.disable_x64()
+#
+#   def test_jacrev_return_aux1(self):
+#     jnp.enable_x64()
+#
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r, (c, d)
+#
+#     _jr = jax.jacrev(f1)(_x, _y)
+#     t = Test()
+#     br, _ = bst.augment.jacrev(t, grad_states=t.x, has_aux=True)(_y)
+#     self.assertTrue((br == _jr).all())
+#
+#     t = Test()
+#     _jr = jax.jacrev(f1, argnums=(0, 1))(_x, _y)
+#     _val, _aux = t(_y)
+#     (var_grads, arg_grads), value, aux = bst.augment.jacrev(t, grad_states=t.x, argnums=0, has_aux=True, return_value=True)(_y)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#     self.assertTrue(jnp.array_equal(aux, _aux))
+#     self.assertTrue(jnp.array_equal(value, _val))
+#
+#     jnp.disable_x64()
+#
+#   def test_jacfwd_return_aux1(self):
+#     jnp.enable_x64()
+#
+#     def f1(x, y):
+#       r = jnp.asarray([x[0] * y[0], 5 * x[2] * y[1], 4 * x[1] ** 2 - 2 * x[2], x[2] * jnp.sin(x[0])])
+#       return r
+#
+#     _x = jnp.array([1., 2., 3.])
+#     _y = jnp.array([10., 5.])
+#
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.array([1., 2., 3.]))
+#
+#       def __call__(self, y):
+#         a = self.x[0] * y[0]
+#         b = 5 * self.x[2] * y[1]
+#         c = 4 * self.x[1] ** 2 - 2 * self.x[2]
+#         d = self.x[2] * jnp.sin(self.x[0])
+#         r = jnp.asarray([a, b, c, d])
+#         return r, (c, d)
+#
+#     _jr = jax.jacfwd(f1)(_x, _y)
+#     t = Test()
+#     br, _ = bst.augment.jacfwd(t, grad_states=t.x, has_aux=True)(_y)
+#     self.assertTrue((br == _jr).all())
+#
+#     t = Test()
+#     _jr = jax.jacfwd(f1, argnums=(0, 1))(_x, _y)
+#     _val, _aux = t(_y)
+#     (var_grads, arg_grads), value, aux = bst.augment.jacfwd(t, grad_states=t.x, argnums=0, has_aux=True, return_value=True)(_y)
+#     print(_val, )
+#     print('_aux: ', _aux, 'aux: ', aux)
+#     print(var_grads, )
+#     print(arg_grads, )
+#     self.assertTrue((var_grads == _jr[0]).all())
+#     self.assertTrue((arg_grads == _jr[1]).all())
+#     self.assertTrue(jnp.array_equal(aux, _aux))
+#     self.assertTrue(jnp.array_equal(value, _val))
+#
+#     jnp.disable_x64()
+#
+#
+# class TestPureFuncVectorGrad(unittest.TestCase):
+#   def test1(self):
+#     f = lambda x: 3 * x ** 2
+#     _x = jnp.ones(10)
+#     pprint(bst.augment.vector_grad(f, argnums=0)(_x))
+#
+#   def test2(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       return dx
+#
+#     _x = jnp.ones(5)
+#     _y = jnp.ones(5)
+#
+#     g = bst.augment.vector_grad(f, argnums=0)(_x, _y)
+#     pprint(g)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0,))(_x, _y)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0, 1))(_x, _y)
+#     pprint(g)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x))
+#     self.assertTrue(jnp.array_equal(g[1], 2 * _y))
+#
+#   def test3(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       dy = x ** 3 + y ** 3 - 10
+#       return dx, dy
+#
+#     _x = jnp.ones(5)
+#     _y = jnp.ones(5)
+#
+#     g = bst.augment.vector_grad(f, argnums=0)(_x, _y)
+#     # pprint(g)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x + 3 * _x ** 2))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0,))(_x, _y)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x + 3 * _x ** 2))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0, 1))(_x, _y)
+#     # pprint(g)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x + 3 * _x ** 2))
+#     self.assertTrue(jnp.array_equal(g[1], 2 * _y + 3 * _y ** 2))
+#
+#   def test4_2d(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       return dx
+#
+#     _x = jnp.ones((5, 5))
+#     _y = jnp.ones((5, 5))
+#
+#     g = bst.augment.vector_grad(f, argnums=0)(_x, _y)
+#     pprint(g)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0,))(_x, _y)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x))
+#
+#     g = bst.augment.vector_grad(f, argnums=(0, 1))(_x, _y)
+#     pprint(g)
+#     self.assertTrue(jnp.array_equal(g[0], 2 * _x))
+#     self.assertTrue(jnp.array_equal(g[1], 2 * _y))
+#
+#   def test_aux1(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       dy = x ** 3 + y ** 3 - 10
+#       return dx, dy
+#
+#     _x = jnp.ones(5)
+#     _y = jnp.ones(5)
+#
+#     g, aux = bst.augment.vector_grad(f, has_aux=True)(_x, _y)
+#     pprint(g, )
+#     pprint(aux)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x))
+#     self.assertTrue(jnp.array_equal(aux, _x ** 3 + _y ** 3 - 10))
+#
+#   def test_return1(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       return dx
+#
+#     _x = jnp.ones(5)
+#     _y = jnp.ones(5)
+#
+#     g, value = bst.augment.vector_grad(f, return_value=True)(_x, _y)
+#     pprint(g, )
+#     pprint(value)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x))
+#     self.assertTrue(jnp.array_equal(value, _x ** 2 + _y ** 2 + 10))
+#
+#   def test_return_aux1(self):
+#     def f(x, y):
+#       dx = x ** 2 + y ** 2 + 10
+#       dy = x ** 3 + y ** 3 - 10
+#       return dx, dy
+#
+#     _x = jnp.ones(5)
+#     _y = jnp.ones(5)
+#
+#     g, value, aux = bst.augment.vector_grad(f, has_aux=True, return_value=True)(_x, _y)
+#     print('grad', g)
+#     print('value', value)
+#     print('aux', aux)
+#     self.assertTrue(jnp.array_equal(g, 2 * _x))
+#     self.assertTrue(jnp.array_equal(value, _x ** 2 + _y ** 2 + 10))
+#     self.assertTrue(jnp.array_equal(aux, _x ** 3 + _y ** 3 - 10))
+#
+#
+# class TestClassFuncVectorGrad(unittest.TestCase):
+#   def test1(self):
+#     class Test(bst.nn.Module):
+#       def __init__(self):
+#         super(Test, self).__init__()
+#         self.x = jnp.Variable(jnp.ones(5))
+#         self.y = jnp.Variable(jnp.ones(5))
+#
+#       def __call__(self, *args, **kwargs):
+#         return self.x ** 2 + self.y ** 2 + 10
+#
+#     t = Test()
+#
+#     g = bst.augment.vector_grad(t, grad_states=t.x)()
+#     self.assertTrue(jnp.array_equal(g, 2 * t.x))
+#
+#     g = bst.augment.vector_grad(t, grad_states=(t.x,))()
+#     self.assertTrue(jnp.array_equal(g[0], 2 * t.x))
+#
+#     g = bst.augment.vector_grad(t, grad_states=(t.x, t.y))()
+#     self.assertTrue(jnp.array_equal(g[0], 2 * t.x))
+#     self.assertTrue(jnp.array_equal(g[1], 2 * t.y))
+#
+#
+# def vgrad(f, *x):
+#   y, vjp_fn = jax.vjp(f, *x)
+#   return vjp_fn(jnp.ones(y.shape).value)[0]
+#
+#
+# class TestDebug(parameterized.TestCase):
+#   def test_debug1(self):
+#     a = bst.random.RandomState()
+#
+#     def f(b):
+#       print(a.value)
+#       return a + b + a.random()
+#
+#     f = bst.augment.vector_grad(f, argnums=0)
+#     f(1.)
+#
+#     with jax.disable_jit():
+#       f(1.)
+#
+#   @parameterized.product(
+#     grad_fun=[bst.augment.grad, bst.augment.vector_grad]
+#   )
+#   def test_print_info1(self, grad_fun):
+#     file = tempfile.TemporaryFile(mode='w+')
+#
+#     @functools.partial(grad_fun, argnums=0)
+#     def f2(a, b):
+#       print('compiling f2 ...', file=file)
+#       return a + b
+#
+#     @functools.partial(grad_fun, argnums=0)
+#     def f1(a):
+#       print('compiling f1 ...', file=file)
+#       return f2(a, 1.)
+#
+#     expect_res = '''
+# compiling f1 ...
+# compiling f2 ...
+# compiling f1 ...
+# compiling f2 ...
+#     '''
+#
+#     print(f1(1.))
+#     file.seek(0)
+#     self.assertTrue(file.read().strip() == expect_res.strip())
+#
+#     file = tempfile.TemporaryFile(mode='w+')
+#     with jax.disable_jit():
+#       expect_res = '''
+# compiling f1 ...
+# compiling f2 ...
+#       '''
+#       self.assertTrue(f1(1.) == 0.)
+#       file.seek(0)
+#       self.assertTrue(file.read().strip() == expect_res.strip())
+#
+#   @parameterized.product(
+#     grad_fun=[bst.augment.grad, bst.augment.vector_grad]
+#   )
+#   def test_print_info2(self, grad_fun):
+#     file = tempfile.TemporaryFile(mode='w+')
+#
+#     @functools.partial(grad_fun, argnums=0)
+#     def f1(a):
+#       @functools.partial(grad_fun, argnums=0)
+#       def f2(a, b):
+#         print('compiling f2 ...', file=file)
+#         return a + b
+#
+#       print('compiling f1 ...', file=file)
+#       return f2(a, 1.)
+#
+#     expect_res = '''
+# compiling f1 ...
+# compiling f2 ...
+# compiling f1 ...
+# compiling f2 ...
+# compiling f2 ...
+#     '''
+#     self.assertTrue(f1(1.) == 0.)
+#     file.seek(0)
+#     self.assertTrue(file.read().strip() == expect_res.strip())
+#
+#     file = tempfile.TemporaryFile(mode='w+')
+#     with jax.disable_jit():
+#       expect_res = '''
+# compiling f1 ...
+# compiling f2 ...
+#       '''
+#       self.assertTrue(f1(1.) == 0.)
+#       file.seek(0)
+#       # print(file.read().strip())
+#       self.assertTrue(file.read().strip() == expect_res.strip())
+#
+#   def test_debug_correctness1(self):
+#     def test_f():
+#       a = jnp.Variable(jnp.ones(2))
+#       b = jnp.Variable(jnp.zeros(2))
+#
+#       @bst.augment.vector_grad(argnums=0)
+#       def f1(c):
+#         a.value += 1
+#         b.value += 10
+#         return a * b * c
+#
+#       return a, b, f1(1.)
+#
+#     r1 = test_f()
+#     print(r1)
+#
+#     with jax.disable_jit():
+#       r2 = test_f()
+#       print(r2)
+#       self.assertTrue(jnp.allclose(r1[0], r2[0]))
+#       self.assertTrue(jnp.allclose(r1[1], r2[1]))
+#       self.assertTrue(jnp.allclose(r1[2], r2[2]))
+#
+#     def f1(c, a, b):
+#       a += 1
+#       b += 10
+#       return a * b * c
+#
+#     r3 = vgrad(f1, 1., jnp.ones(2).value, jnp.zeros(2).value)
+#     self.assertTrue(jnp.allclose(r1[2], r3))
+#
+#   def _bench_f2(self, dd):
+#     a = jnp.Variable(jnp.ones(2))
+#     b = jnp.Variable(jnp.zeros(2))
+#
+#
+#     def run_fun(d):
+#       @bst.augment.vector_grad(argnums=0)
+#       def f1(c):
+#         a.value += d
+#         b.value += 10
+#         return a * b * c
+#
+#       return a, b, f1(1.)
+#
+#     return run_fun(dd)
+#
+#   def test_debug_correctness2(self):
+#     r1 = self._bench_f2(1.)
+#     print(r1)
+#
+#     with jax.disable_jit():
+#       r2 = self._bench_f2(1.)
+#       print(r2)
+#
+#     self.assertTrue(jnp.allclose(r1[0], r2[0]))
+#     self.assertTrue(jnp.allclose(r1[1], r2[1]))
+#     self.assertTrue(jnp.allclose(r1[2], r2[2]))
+#
+#   def test_cache1(self):
+#       file = tempfile.TemporaryFile(mode='w+')
+#
+#       def f(a, b):
+#         print('compiling f ...', file=file)
+#         return a + b
+#
+#       grad1 = bst.augment.grad(f)(1., 2.)  # call "f" twice, one for Variable finding, one for compiling
+#       grad2 = bst.augment.vector_grad(f)(1., 2.)  # call "f" once for compiling
+#
+#       file.seek(0)
+#       print(file.read().strip())
+#
+#       expect_res = '''
+# compiling f ...
+# compiling f ...
+# compiling f ...
+#       '''
+#       file.seek(0)
+#       self.assertTrue(file.read().strip() == expect_res.strip())
+#
+#

brainstate 0.0.2.post20241010__py2.py3-none-any.whl → 0.1.0__py2.py3-none-any.whl

brainstate 0.0.2.post20241010py2.py3-none-any.whl → 0.1.0py2.py3-none-any.whl