PyPI - addernet - Versions diffs - 1.2.2__tar.gz → 1.2.6__tar.gz - Mend

addernet 1.2.2tar.gz → 1.2.6tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

{addernet-1.2.2 → addernet-1.2.6}/Makefile +1 -1
addernet-1.2.6/PKG-INFO +200 -0
addernet-1.2.6/README.md +170 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/__init__.py +1 -1
{addernet-1.2.2 → addernet-1.2.6}/addernet/addernet_hdc.py +19 -3
addernet-1.2.6/addernet.egg-info/PKG-INFO +200 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/SOURCES.txt +2 -0
{addernet-1.2.2 → addernet-1.2.6}/pyproject.toml +1 -1
{addernet-1.2.2 → addernet-1.2.6}/python/addernet_hdc.py +19 -3
{addernet-1.2.2 → addernet-1.2.6}/setup.py +2 -2
{addernet-1.2.2 → addernet-1.2.6}/src/addernet_cuda.cu +12 -11
{addernet-1.2.2 → addernet-1.2.6}/src/addernet_hdc.c +214 -206
addernet-1.2.6/src/addernet_hdc.h +93 -0
addernet-1.2.6/src/addernet_hdc_train_cuda.cu +235 -0
addernet-1.2.6/src/cuda_runtime.h +0 -0
addernet-1.2.6/src/hdc_core.c +302 -0
addernet-1.2.6/src/hdc_core.h +78 -0
{addernet-1.2.2 → addernet-1.2.6}/src/hdc_cuda_batch.c +19 -19
addernet-1.2.6/src/hdc_lsh.c +92 -0
addernet-1.2.6/src/hdc_lsh.h +42 -0
addernet-1.2.2/PKG-INFO +0 -351
addernet-1.2.2/README.md +0 -321
addernet-1.2.2/addernet.egg-info/PKG-INFO +0 -351
addernet-1.2.2/src/addernet_hdc.h +0 -238
addernet-1.2.2/src/hdc_core.c +0 -511
addernet-1.2.2/src/hdc_core.h +0 -151
addernet-1.2.2/src/hdc_lsh.c +0 -92
addernet-1.2.2/src/hdc_lsh.h +0 -40
{addernet-1.2.2 → addernet-1.2.6}/LICENSE +0 -0
{addernet-1.2.2 → addernet-1.2.6}/MANIFEST.in +0 -0
{addernet-1.2.2 → addernet-1.2.6}/README_DEV.md +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/addernet.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/attention.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/boost.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/build_ext.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/cluster.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/libaddernet.so +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/libaddernet_hdc.so +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/addernet.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/addernet.h +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/addernet_hdc.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/addernet_hdc.h +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_core.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_core.h +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_core_cuda.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_cuda_batch.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_lsh.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet/src/hdc_lsh.h +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/dependency_links.txt +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/entry_points.txt +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/requires.txt +0 -0
{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/top_level.txt +0 -0
{addernet-1.2.2 → addernet-1.2.6}/python/__init__.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/python/addernet.py +0 -0
{addernet-1.2.2 → addernet-1.2.6}/setup.cfg +0 -0
{addernet-1.2.2 → addernet-1.2.6}/src/addernet.c +0 -0
{addernet-1.2.2 → addernet-1.2.6}/src/addernet.h +0 -0
{addernet-1.2.2 → addernet-1.2.6}/src/hdc_core_cuda.c +0 -0

{addernet-1.2.2 → addernet-1.2.6}/Makefile RENAMED Viewed

@@ -112,7 +112,7 @@ $(CUDA_SO): $(HDC_CORE_OBJ) $(CUDA_OBJ) $(CUDA_BATCH_OBJ) $(HDC_OBJ)
 	$(CC) -shared -o $(CUDA_SO) $(HDC_CORE_OBJ) $(CUDA_OBJ) $(CUDA_BATCH_OBJ) $(HDC_OBJ) $(LDFLAGS) -ldl
 # --- CUDA (nvcc native build) ---
-CUDA_NATIVE_SRC = $(SRC_DIR)/addernet_cuda.cu
+CUDA_NATIVE_SRC = $(SRC_DIR)/addernet_cuda.cu $(SRC_DIR)/addernet_hdc_train_cuda.cu
 CUDA_NATIVE_SO  = $(BUILD_DIR)/libaddernet_cuda.so
 NVCC := $(shell command -v nvcc 2> /dev/null)

addernet-1.2.6/PKG-INFO ADDED Viewed

@@ -0,0 +1,200 @@
+Metadata-Version: 2.4
+Name: addernet
+Version: 1.2.6
+Summary: Neural networks with zero multiplications at inference. AdderNet + HDC for embedded systems.
+Author: AdderNet Team
+License: Apache-2.0
+Project-URL: Homepage, https://github.com/addernet/addernet
+Project-URL: Repository, https://github.com/addernet/addernet
+Keywords: machine-learning,neural-network,addernet,hyperdimensional-computing,embedded,no-fpu
+Classifier: Development Status :: 4 - Beta
+Classifier: Intended Audience :: Developers
+Classifier: Intended Audience :: Science/Research
+Classifier: License :: OSI Approved :: Apache Software License
+Classifier: Programming Language :: Python :: 3
+Classifier: Programming Language :: Python :: 3.8
+Classifier: Programming Language :: Python :: 3.9
+Classifier: Programming Language :: Python :: 3.10
+Classifier: Programming Language :: Python :: 3.11
+Classifier: Programming Language :: Python :: 3.12
+Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+License-File: LICENSE
+Requires-Dist: numpy
+Requires-Dist: scikit-learn
+Requires-Dist: scipy
+Provides-Extra: dev
+Requires-Dist: pytest; extra == "dev"
+Dynamic: license-file
+# AdderNet
+[![PyPI version](https://img.shields.io/pypi/v/addernet.svg)](https://pypi.org/project/addernet/)
+[![Python](https://img.shields.io/pypi/pyversions/addernet.svg)](https://pypi.org/project/addernet/)
+[![License](https://img.shields.io/github/license/PedroHenriqueBatistaSilva/AdderNet.svg)](LICENSE)
+Biblioteca de machine learning que **não usa multiplicação de ponto flutuante** na inferência. Zero.
+> Benchmarks medidos em CPU x86-64 com backend **AVX2** e GPUs NVIDIA via **CUDA**, Python 3.x, v1.2.5.
+---
+## O que é?
+AdderNet substitui multiplicações por **lookups em tabela** (LUT) e operações de soma inteiras,
+tornando a inferência viável em microcontroladores sem FPU (ESP32, STM32, RPi).
+A biblioteca expõe quatro componentes principais:
+| Classe | Descrição |
+|---|---|
+| `AdderNetLayer` | Rede de uma variável — LUT + soma, zero multiplicação |
+| `AdderNetHDC` | Classificador multivariável — Hyperdimensional Computing (HDC) |
+| `AdderCluster` | Ensemble de `AdderNetLayer` com estratégias de combinação |
+| `AdderBoost` | Gradient Boosting com `AdderNetLayer` — inferência sem multiplicação |
+---
+## Novidades v1.2.5 🚀
+- **HV_DIM Dinâmico**: A dimensionalidade hiperdimensional (`hv_dim`) agora é configurável em tempo de execução (`512`, `1024`, `2048`, `4096`, etc), sem precisar recompilar a biblioteca C!
+- **Aceleração CUDA NATIVA no Treinamento**: O loop iterativo de retreino (`AdaptHD`) foi reescrito em CUDA para ser executado massivamente em paralelo usando `atomicAdd` e otimizações de bitwise. Basta usar `use_gpu_training=True`.
+- **Aceleração CUDA na Inferência**: O processo de `predict_batch` agora tem suporte a GPU via kernels CUDA dedicados. Basta instanciar o modelo com `use_gpu=True`.
+- **Compatibilidade e Fallback**: O pacote compila nativamente o C++ e CUDA no momento do `pip install`. Se a máquina alvo (como um Raspberry Pi) não tiver placa de vídeo NVIDIA, a biblioteca roda perfeitamente fazendo fallback silencioso para CPU com `AVX2`, `NEON` ou `SCALAR`.
+- Correção de bugs de Ctypes FFI e memory alignment (agora todos os `aligned_alloc` usam arrays flats dinâmicos, preservando compatibilidade absoluta entre os tensores C contíguos e o numpy).
+---
+## Instalação
+```bash
+pip install addernet
+```
+Ou do código-fonte (para compilar com otimizações nativas e CUDA opcional):
+```bash
+git clone https://github.com/PedroHenriqueBatistaSilva/AdderNet.git
+cd AdderNet
+make all         # Compila binários da CPU
+make cuda_native # Opcional: Compila o backend de GPU (requer nvcc)
+pip install -e .
+```
+---
+## Uso — AdderNetLayer (uma variável)
+```python
+from addernet import AdderNetLayer
+rede = AdderNetLayer(size=256, bias=50, input_min=-50, input_max=200, lr=0.1)
+celsius    = [0, 10, 20, 25, 30, 37, 50, 80, 100]
+fahrenheit = [32, 50, 68, 77, 86, 98.6, 122, 176, 212]
+rede.train(celsius, fahrenheit)
+print(rede.predict(37))    # 98.60
+print(rede.predict(100))   # 212.00
+```
+### Previsão em lote (numpy)
+```python
+import numpy as np
+entradas = np.linspace(-50, 200, 1_000_000, dtype=np.float64)
+saidas = rede.predict_batch(entradas)   # ~178M pred/s com AVX2
+```
+---
+## Uso — AdderNetHDC (Aceleração GPU e HDC Dinâmico)
+```python
+from addernet import AdderNetHDC
+import numpy as np
+from sklearn.datasets import load_iris
+from sklearn.preprocessing import MinMaxScaler
+iris = load_iris()
+X = MinMaxScaler(feature_range=(0, 150)).fit_transform(iris.data)
+y = iris.target
+# HV_DIM dinâmico configurável (ex: 2048, 4096)
+model = AdderNetHDC(
+    n_vars=4,
+    n_classes=3,
+    table_size=256,
+    hv_dim=4096,              # <- Dimensionalidade configurável no runtime!
+    use_gpu=True,             # <- Ativa inferência batch em CUDA
+    use_gpu_training=True     # <- Ativa treinamento iterativo em CUDA
+)
+# Arrays numpy precisam ser "C Contiguous"
+X_c = np.ascontiguousarray(X, dtype=np.float64)
+y_c = np.ascontiguousarray(y, dtype=np.int32)
+# Treino single-pass (OnlineHD)
+model.train(X_c, y_c)
+# Retreino iterativo (AdaptHD) — massivamente paralelo na GPU
+model.train(X_c, y_c, n_iter=20, lr=1.0)
+# Inferência massiva e ultrarrápida via GPU
+preds = model.predict_batch(X_c)
+print(f"Acurácia: {model.accuracy(X_c, y_c)*100:.1f}%")
+```
+---
+## Uso — AdderCluster (ensemble multi-nó)
+```python
+from addernet import AdderCluster
+import numpy as np
+cluster = AdderCluster(
+    n_nodes=4,
+    strategy='feature',    # 'random' | 'range' | 'feature' | 'boosting'
+    combination='vote',    # 'vote' | 'mean' | 'stack'
+    input_min=0,
+    input_max=150,
+)
+cluster.fit(X, y)
+preds = cluster.predict_batch(X)
+cluster.info()
+```
+---
+## Otimizações disponíveis
+```python
+from addernet import hdc_detect_backend
+print(hdc_detect_backend())   # 'AVX2', 'NEON', ou 'SCALAR'
+model.set_threads(4)      # multithreading CPU (AdderNetHDC)
+model.warm_cache()        # pré-computar hipervectors
+model.set_cache(False)    # desligar cache (hardware com pouca RAM)
+```
+---
+## Limitações
+- **AdderNetLayer**: apenas uma variável de entrada por camada
+- **AdderNetHDC**: acurácia inferior a MLPs profundas em datasets complexos (troca por zero multiplicação)
+- `hv_dim` muito pequeno (< 1000) pode colapsar a acurácia, use a Dimensionalidade Dinâmica para testar!
+---
+## Licença
+[Apache 2.0](LICENSE) — © Pedro Henrique Batista Silva

addernet-1.2.6/README.md ADDED Viewed

@@ -0,0 +1,170 @@
+# AdderNet
+[![PyPI version](https://img.shields.io/pypi/v/addernet.svg)](https://pypi.org/project/addernet/)
+[![Python](https://img.shields.io/pypi/pyversions/addernet.svg)](https://pypi.org/project/addernet/)
+[![License](https://img.shields.io/github/license/PedroHenriqueBatistaSilva/AdderNet.svg)](LICENSE)
+Biblioteca de machine learning que **não usa multiplicação de ponto flutuante** na inferência. Zero.
+> Benchmarks medidos em CPU x86-64 com backend **AVX2** e GPUs NVIDIA via **CUDA**, Python 3.x, v1.2.5.
+---
+## O que é?
+AdderNet substitui multiplicações por **lookups em tabela** (LUT) e operações de soma inteiras,
+tornando a inferência viável em microcontroladores sem FPU (ESP32, STM32, RPi).
+A biblioteca expõe quatro componentes principais:
+| Classe | Descrição |
+|---|---|
+| `AdderNetLayer` | Rede de uma variável — LUT + soma, zero multiplicação |
+| `AdderNetHDC` | Classificador multivariável — Hyperdimensional Computing (HDC) |
+| `AdderCluster` | Ensemble de `AdderNetLayer` com estratégias de combinação |
+| `AdderBoost` | Gradient Boosting com `AdderNetLayer` — inferência sem multiplicação |
+---
+## Novidades v1.2.5 🚀
+- **HV_DIM Dinâmico**: A dimensionalidade hiperdimensional (`hv_dim`) agora é configurável em tempo de execução (`512`, `1024`, `2048`, `4096`, etc), sem precisar recompilar a biblioteca C!
+- **Aceleração CUDA NATIVA no Treinamento**: O loop iterativo de retreino (`AdaptHD`) foi reescrito em CUDA para ser executado massivamente em paralelo usando `atomicAdd` e otimizações de bitwise. Basta usar `use_gpu_training=True`.
+- **Aceleração CUDA na Inferência**: O processo de `predict_batch` agora tem suporte a GPU via kernels CUDA dedicados. Basta instanciar o modelo com `use_gpu=True`.
+- **Compatibilidade e Fallback**: O pacote compila nativamente o C++ e CUDA no momento do `pip install`. Se a máquina alvo (como um Raspberry Pi) não tiver placa de vídeo NVIDIA, a biblioteca roda perfeitamente fazendo fallback silencioso para CPU com `AVX2`, `NEON` ou `SCALAR`.
+- Correção de bugs de Ctypes FFI e memory alignment (agora todos os `aligned_alloc` usam arrays flats dinâmicos, preservando compatibilidade absoluta entre os tensores C contíguos e o numpy).
+---
+## Instalação
+```bash
+pip install addernet
+```
+Ou do código-fonte (para compilar com otimizações nativas e CUDA opcional):
+```bash
+git clone https://github.com/PedroHenriqueBatistaSilva/AdderNet.git
+cd AdderNet
+make all         # Compila binários da CPU
+make cuda_native # Opcional: Compila o backend de GPU (requer nvcc)
+pip install -e .
+```
+---
+## Uso — AdderNetLayer (uma variável)
+```python
+from addernet import AdderNetLayer
+rede = AdderNetLayer(size=256, bias=50, input_min=-50, input_max=200, lr=0.1)
+celsius    = [0, 10, 20, 25, 30, 37, 50, 80, 100]
+fahrenheit = [32, 50, 68, 77, 86, 98.6, 122, 176, 212]
+rede.train(celsius, fahrenheit)
+print(rede.predict(37))    # 98.60
+print(rede.predict(100))   # 212.00
+```
+### Previsão em lote (numpy)
+```python
+import numpy as np
+entradas = np.linspace(-50, 200, 1_000_000, dtype=np.float64)
+saidas = rede.predict_batch(entradas)   # ~178M pred/s com AVX2
+```
+---
+## Uso — AdderNetHDC (Aceleração GPU e HDC Dinâmico)
+```python
+from addernet import AdderNetHDC
+import numpy as np
+from sklearn.datasets import load_iris
+from sklearn.preprocessing import MinMaxScaler
+iris = load_iris()
+X = MinMaxScaler(feature_range=(0, 150)).fit_transform(iris.data)
+y = iris.target
+# HV_DIM dinâmico configurável (ex: 2048, 4096)
+model = AdderNetHDC(
+    n_vars=4,
+    n_classes=3,
+    table_size=256,
+    hv_dim=4096,              # <- Dimensionalidade configurável no runtime!
+    use_gpu=True,             # <- Ativa inferência batch em CUDA
+    use_gpu_training=True     # <- Ativa treinamento iterativo em CUDA
+)
+# Arrays numpy precisam ser "C Contiguous"
+X_c = np.ascontiguousarray(X, dtype=np.float64)
+y_c = np.ascontiguousarray(y, dtype=np.int32)
+# Treino single-pass (OnlineHD)
+model.train(X_c, y_c)
+# Retreino iterativo (AdaptHD) — massivamente paralelo na GPU
+model.train(X_c, y_c, n_iter=20, lr=1.0)
+# Inferência massiva e ultrarrápida via GPU
+preds = model.predict_batch(X_c)
+print(f"Acurácia: {model.accuracy(X_c, y_c)*100:.1f}%")
+```
+---
+## Uso — AdderCluster (ensemble multi-nó)
+```python
+from addernet import AdderCluster
+import numpy as np
+cluster = AdderCluster(
+    n_nodes=4,
+    strategy='feature',    # 'random' | 'range' | 'feature' | 'boosting'
+    combination='vote',    # 'vote' | 'mean' | 'stack'
+    input_min=0,
+    input_max=150,
+)
+cluster.fit(X, y)
+preds = cluster.predict_batch(X)
+cluster.info()
+```
+---
+## Otimizações disponíveis
+```python
+from addernet import hdc_detect_backend
+print(hdc_detect_backend())   # 'AVX2', 'NEON', ou 'SCALAR'
+model.set_threads(4)      # multithreading CPU (AdderNetHDC)
+model.warm_cache()        # pré-computar hipervectors
+model.set_cache(False)    # desligar cache (hardware com pouca RAM)
+```
+---
+## Limitações
+- **AdderNetLayer**: apenas uma variável de entrada por camada
+- **AdderNetHDC**: acurácia inferior a MLPs profundas em datasets complexos (troca por zero multiplicação)
+- `hv_dim` muito pequeno (< 1000) pode colapsar a acurácia, use a Dimensionalidade Dinâmica para testar!
+---
+## Licença
+[Apache 2.0](LICENSE) — © Pedro Henrique Batista Silva

{addernet-1.2.2 → addernet-1.2.6}/addernet/__init__.py RENAMED Viewed

@@ -30,6 +30,6 @@ from .attention import AdderAttention
 AnHdcModel = AdderNetHDC
-__version__ = "1.0.9"
+__version__ = "1.2.6"
 __all__ = ["AdderNetLayer", "AdderNetHDC", "AnHdcModel", "hdc_detect_backend",
            "AdderCluster", "AdderBoost", "AdderAttention"]

{addernet-1.2.2 → addernet-1.2.6}/addernet/addernet_hdc.py RENAMED Viewed

@@ -61,7 +61,7 @@ _AnHdcPtr = ctypes.c_void_p
 _lib.an_hdc_create.restype = _AnHdcPtr
 _lib.an_hdc_create.argtypes = [
     ctypes.c_int, ctypes.c_int, ctypes.c_int,
-    ctypes.POINTER(ctypes.c_int),
+    ctypes.POINTER(ctypes.c_int), ctypes.c_int
 ]
 _lib.an_hdc_free.restype = None
@@ -111,6 +111,20 @@ _lib.an_hdc_predict_batch_avx.argtypes = [
 ]
 if _lib_cuda is not None:
+    _lib_cuda.an_hdc_retrain_cuda.restype = ctypes.c_int
+    _lib_cuda.an_hdc_retrain_cuda.argtypes = [
+        _AnHdcPtr,
+        ctypes.POINTER(ctypes.c_double),
+        ctypes.POINTER(ctypes.c_int),
+        ctypes.c_int,
+        ctypes.c_int,
+        ctypes.c_float,
+        ctypes.c_int,
+        ctypes.c_int,
+        ctypes.c_int,
+        ctypes.POINTER(ctypes.c_int),
+    ]
     _lib_cuda.an_hdc_predict_batch_cuda.restype = ctypes.c_int
     _lib_cuda.an_hdc_predict_batch_cuda.argtypes = [
         _AnHdcPtr,
@@ -225,7 +239,7 @@ class AdderNetHDC:
     """
     def __init__(self, n_vars=1, n_classes=2, table_size=256, bias=None,
-                 seed=42, use_gpu=False, _ptr=None):
+                 seed=42, use_gpu=False, hv_dim=2500, use_gpu_training=False, _ptr=None):
         """
         Create a new model.
@@ -238,6 +252,8 @@ class AdderNetHDC:
             use_gpu:    toggle between CPU and CUDA backend
         """
         self.use_gpu = use_gpu
+        self.use_gpu_training = use_gpu_training
+        self.hv_dim = hv_dim
         if _ptr is not None:
             self._ptr = _ptr
@@ -252,7 +268,7 @@ class AdderNetHDC:
         if bias is not None:
             bias_arr = (ctypes.c_int * n_vars)(*bias)
-        self._ptr = _lib.an_hdc_create(n_vars, n_classes, table_size, bias_arr)
+        self._ptr = _lib.an_hdc_create(n_vars, n_classes, table_size, bias_arr, hv_dim)
         if not self._ptr:
             raise MemoryError("an_hdc_create failed")
         self._n_vars = n_vars

addernet-1.2.6/addernet.egg-info/PKG-INFO ADDED Viewed

@@ -0,0 +1,200 @@
+Metadata-Version: 2.4
+Name: addernet
+Version: 1.2.6
+Summary: Neural networks with zero multiplications at inference. AdderNet + HDC for embedded systems.
+Author: AdderNet Team
+License: Apache-2.0
+Project-URL: Homepage, https://github.com/addernet/addernet
+Project-URL: Repository, https://github.com/addernet/addernet
+Keywords: machine-learning,neural-network,addernet,hyperdimensional-computing,embedded,no-fpu
+Classifier: Development Status :: 4 - Beta
+Classifier: Intended Audience :: Developers
+Classifier: Intended Audience :: Science/Research
+Classifier: License :: OSI Approved :: Apache Software License
+Classifier: Programming Language :: Python :: 3
+Classifier: Programming Language :: Python :: 3.8
+Classifier: Programming Language :: Python :: 3.9
+Classifier: Programming Language :: Python :: 3.10
+Classifier: Programming Language :: Python :: 3.11
+Classifier: Programming Language :: Python :: 3.12
+Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+License-File: LICENSE
+Requires-Dist: numpy
+Requires-Dist: scikit-learn
+Requires-Dist: scipy
+Provides-Extra: dev
+Requires-Dist: pytest; extra == "dev"
+Dynamic: license-file
+# AdderNet
+[![PyPI version](https://img.shields.io/pypi/v/addernet.svg)](https://pypi.org/project/addernet/)
+[![Python](https://img.shields.io/pypi/pyversions/addernet.svg)](https://pypi.org/project/addernet/)
+[![License](https://img.shields.io/github/license/PedroHenriqueBatistaSilva/AdderNet.svg)](LICENSE)
+Biblioteca de machine learning que **não usa multiplicação de ponto flutuante** na inferência. Zero.
+> Benchmarks medidos em CPU x86-64 com backend **AVX2** e GPUs NVIDIA via **CUDA**, Python 3.x, v1.2.5.
+---
+## O que é?
+AdderNet substitui multiplicações por **lookups em tabela** (LUT) e operações de soma inteiras,
+tornando a inferência viável em microcontroladores sem FPU (ESP32, STM32, RPi).
+A biblioteca expõe quatro componentes principais:
+| Classe | Descrição |
+|---|---|
+| `AdderNetLayer` | Rede de uma variável — LUT + soma, zero multiplicação |
+| `AdderNetHDC` | Classificador multivariável — Hyperdimensional Computing (HDC) |
+| `AdderCluster` | Ensemble de `AdderNetLayer` com estratégias de combinação |
+| `AdderBoost` | Gradient Boosting com `AdderNetLayer` — inferência sem multiplicação |
+---
+## Novidades v1.2.5 🚀
+- **HV_DIM Dinâmico**: A dimensionalidade hiperdimensional (`hv_dim`) agora é configurável em tempo de execução (`512`, `1024`, `2048`, `4096`, etc), sem precisar recompilar a biblioteca C!
+- **Aceleração CUDA NATIVA no Treinamento**: O loop iterativo de retreino (`AdaptHD`) foi reescrito em CUDA para ser executado massivamente em paralelo usando `atomicAdd` e otimizações de bitwise. Basta usar `use_gpu_training=True`.
+- **Aceleração CUDA na Inferência**: O processo de `predict_batch` agora tem suporte a GPU via kernels CUDA dedicados. Basta instanciar o modelo com `use_gpu=True`.
+- **Compatibilidade e Fallback**: O pacote compila nativamente o C++ e CUDA no momento do `pip install`. Se a máquina alvo (como um Raspberry Pi) não tiver placa de vídeo NVIDIA, a biblioteca roda perfeitamente fazendo fallback silencioso para CPU com `AVX2`, `NEON` ou `SCALAR`.
+- Correção de bugs de Ctypes FFI e memory alignment (agora todos os `aligned_alloc` usam arrays flats dinâmicos, preservando compatibilidade absoluta entre os tensores C contíguos e o numpy).
+---
+## Instalação
+```bash
+pip install addernet
+```
+Ou do código-fonte (para compilar com otimizações nativas e CUDA opcional):
+```bash
+git clone https://github.com/PedroHenriqueBatistaSilva/AdderNet.git
+cd AdderNet
+make all         # Compila binários da CPU
+make cuda_native # Opcional: Compila o backend de GPU (requer nvcc)
+pip install -e .
+```
+---
+## Uso — AdderNetLayer (uma variável)
+```python
+from addernet import AdderNetLayer
+rede = AdderNetLayer(size=256, bias=50, input_min=-50, input_max=200, lr=0.1)
+celsius    = [0, 10, 20, 25, 30, 37, 50, 80, 100]
+fahrenheit = [32, 50, 68, 77, 86, 98.6, 122, 176, 212]
+rede.train(celsius, fahrenheit)
+print(rede.predict(37))    # 98.60
+print(rede.predict(100))   # 212.00
+```
+### Previsão em lote (numpy)
+```python
+import numpy as np
+entradas = np.linspace(-50, 200, 1_000_000, dtype=np.float64)
+saidas = rede.predict_batch(entradas)   # ~178M pred/s com AVX2
+```
+---
+## Uso — AdderNetHDC (Aceleração GPU e HDC Dinâmico)
+```python
+from addernet import AdderNetHDC
+import numpy as np
+from sklearn.datasets import load_iris
+from sklearn.preprocessing import MinMaxScaler
+iris = load_iris()
+X = MinMaxScaler(feature_range=(0, 150)).fit_transform(iris.data)
+y = iris.target
+# HV_DIM dinâmico configurável (ex: 2048, 4096)
+model = AdderNetHDC(
+    n_vars=4,
+    n_classes=3,
+    table_size=256,
+    hv_dim=4096,              # <- Dimensionalidade configurável no runtime!
+    use_gpu=True,             # <- Ativa inferência batch em CUDA
+    use_gpu_training=True     # <- Ativa treinamento iterativo em CUDA
+)
+# Arrays numpy precisam ser "C Contiguous"
+X_c = np.ascontiguousarray(X, dtype=np.float64)
+y_c = np.ascontiguousarray(y, dtype=np.int32)
+# Treino single-pass (OnlineHD)
+model.train(X_c, y_c)
+# Retreino iterativo (AdaptHD) — massivamente paralelo na GPU
+model.train(X_c, y_c, n_iter=20, lr=1.0)
+# Inferência massiva e ultrarrápida via GPU
+preds = model.predict_batch(X_c)
+print(f"Acurácia: {model.accuracy(X_c, y_c)*100:.1f}%")
+```
+---
+## Uso — AdderCluster (ensemble multi-nó)
+```python
+from addernet import AdderCluster
+import numpy as np
+cluster = AdderCluster(
+    n_nodes=4,
+    strategy='feature',    # 'random' | 'range' | 'feature' | 'boosting'
+    combination='vote',    # 'vote' | 'mean' | 'stack'
+    input_min=0,
+    input_max=150,
+)
+cluster.fit(X, y)
+preds = cluster.predict_batch(X)
+cluster.info()
+```
+---
+## Otimizações disponíveis
+```python
+from addernet import hdc_detect_backend
+print(hdc_detect_backend())   # 'AVX2', 'NEON', ou 'SCALAR'
+model.set_threads(4)      # multithreading CPU (AdderNetHDC)
+model.warm_cache()        # pré-computar hipervectors
+model.set_cache(False)    # desligar cache (hardware com pouca RAM)
+```
+---
+## Limitações
+- **AdderNetLayer**: apenas uma variável de entrada por camada
+- **AdderNetHDC**: acurácia inferior a MLPs profundas em datasets complexos (troca por zero multiplicação)
+- `hv_dim` muito pequeno (< 1000) pode colapsar a acurácia, use a Dimensionalidade Dinâmica para testar!
+---
+## Licença
+[Apache 2.0](LICENSE) — © Pedro Henrique Batista Silva

{addernet-1.2.2 → addernet-1.2.6}/addernet.egg-info/SOURCES.txt RENAMED Viewed

@@ -38,6 +38,8 @@ src/addernet.h
 src/addernet_cuda.cu
 src/addernet_hdc.c
 src/addernet_hdc.h
+src/addernet_hdc_train_cuda.cu
+src/cuda_runtime.h
 src/hdc_core.c
 src/hdc_core.h
 src/hdc_core_cuda.c

{addernet-1.2.2 → addernet-1.2.6}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 [project]
 name = "addernet"
-version = "1.2.2"
+version = "1.2.6"
 description = "Neural networks with zero multiplications at inference. AdderNet + HDC for embedded systems."
 readme = "README.md"
 license = { text = "Apache-2.0" }

addernet 1.2.2__tar.gz → 1.2.6__tar.gz

addernet 1.2.2tar.gz → 1.2.6tar.gz