RubyGems - faiss - Versions diffs - 0.2.0 → 0.2.4 - Mend

faiss 0.2.0 → 0.2.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (215) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/LICENSE.txt +1 -1
data/README.md +7 -7
data/ext/faiss/extconf.rb +6 -3
data/ext/faiss/numo.hpp +4 -4
data/ext/faiss/utils.cpp +1 -1
data/ext/faiss/utils.h +1 -1
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +365 -194
data/vendor/faiss/faiss/Clustering.h +102 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +126 -224
data/vendor/faiss/faiss/Index2Layer.h +22 -36
data/vendor/faiss/faiss/IndexAdditiveQuantizer.cpp +407 -0
data/vendor/faiss/faiss/IndexAdditiveQuantizer.h +195 -0
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +115 -176
data/vendor/faiss/faiss/IndexFlat.h +42 -59
data/vendor/faiss/faiss/IndexFlatCodes.cpp +67 -0
data/vendor/faiss/faiss/IndexFlatCodes.h +47 -0
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +545 -453
data/vendor/faiss/faiss/IndexIVF.h +169 -118
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.cpp +316 -0
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.h +121 -0
data/vendor/faiss/faiss/IndexIVFFlat.cpp +247 -252
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +459 -517
data/vendor/faiss/faiss/IndexIVFPQ.h +75 -67
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +163 -150
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +38 -25
data/vendor/faiss/faiss/IndexLSH.cpp +66 -113
data/vendor/faiss/faiss/IndexLSH.h +20 -38
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +229 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +301 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +387 -495
data/vendor/faiss/faiss/IndexPQ.h +64 -82
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +139 -127
data/vendor/faiss/faiss/IndexRefine.h +32 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +111 -172
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -59
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +654 -475
data/vendor/faiss/faiss/VectorTransform.h +64 -89
data/vendor/faiss/faiss/clone_index.cpp +78 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +198 -171
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIcmEncoder.h +60 -0
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +503 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +175 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +606 -617
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +855 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +244 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +679 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +758 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +188 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +647 -707
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +631 -480
data/vendor/faiss/faiss/impl/index_write.cpp +547 -407
data/vendor/faiss/faiss/impl/io.cpp +76 -95
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +60 -29
data/vendor/faiss/faiss/impl/kmeans1d.cpp +301 -0
data/vendor/faiss/faiss/impl/kmeans1d.h +48 -0
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +619 -397
data/vendor/faiss/faiss/index_factory.h +8 -6
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +305 -312
data/vendor/faiss/faiss/utils/distances.h +170 -122
data/vendor/faiss/faiss/utils/distances_simd.cpp +498 -508
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +54 -49
metadata +29 -4

data/vendor/faiss/faiss/impl/lattice_Zn.cpp CHANGED Viewed

@@ -9,19 +9,18 @@
 #include <faiss/impl/lattice_Zn.h>
-#include <cstdlib>
+#include <cassert>
 #include <cmath>
+#include <cstdlib>
 #include <cstring>
-#include <cassert>
+#include <algorithm>
 #include <queue>
-#include <unordered_set>
 #include <unordered_map>
-#include <algorithm>
+#include <unordered_set>
-#include <faiss/utils/distances.h>
 #include <faiss/impl/platform_macros.h>
+#include <faiss/utils/distances.h>
 namespace faiss {
@@ -35,44 +34,41 @@ inline float sqr(float x) {
     return x * x;
 }
 typedef std::vector<float> point_list_t;
 struct Comb {
     std::vector<uint64_t> tab; // Pascal's triangle
     int nmax;
-    explicit Comb(int nmax): nmax(nmax) {
+    explicit Comb(int nmax) : nmax(nmax) {
         tab.resize(nmax * nmax, 0);
         tab[0] = 1;
-        for(int i = 1; i < nmax; i++) {
+        for (int i = 1; i < nmax; i++) {
             tab[i * nmax] = 1;
-            for(int j = 1; j <= i; j++) {
+            for (int j = 1; j <= i; j++) {
                 tab[i * nmax + j] =
-                    tab[(i - 1) * nmax + j] +
-                    tab[(i - 1) * nmax + (j - 1)];
+                        tab[(i - 1) * nmax + j] + tab[(i - 1) * nmax + (j - 1)];
             }
         }
     }
     uint64_t operator()(int n, int p) const {
-        assert (n < nmax && p < nmax);
-        if (p > n) return 0;
+        assert(n < nmax && p < nmax);
+        if (p > n)
+            return 0;
         return tab[n * nmax + p];
     }
 };
 Comb comb(100);
 // compute combinations of n integer values <= v that sum up to total (squared)
-point_list_t sum_of_sq (float total, int v, int n, float add = 0) {
+point_list_t sum_of_sq(float total, int v, int n, float add = 0) {
     if (total < 0) {
         return point_list_t();
     } else if (n == 1) {
-        while (sqr(v + add) > total) v--;
+        while (sqr(v + add) > total)
+            v--;
         if (sqr(v + add) == total) {
             return point_list_t(1, v + add);
         } else {
@@ -82,9 +78,9 @@ point_list_t sum_of_sq (float total, int v, int n, float add = 0) {
         point_list_t res;
         while (v >= 0) {
             point_list_t sub_points =
-                sum_of_sq (total - sqr(v + add), v, n - 1, add);
+                    sum_of_sq(total - sqr(v + add), v, n - 1, add);
             for (size_t i = 0; i < sub_points.size(); i += n - 1) {
-                res.push_back (v + add);
+                res.push_back(v + add);
                 for (int j = 0; j < n - 1; j++) {
                     res.push_back(sub_points[i + j]);
                 }
@@ -95,7 +91,7 @@ point_list_t sum_of_sq (float total, int v, int n, float add = 0) {
     }
 }
-int decode_comb_1 (uint64_t *n, int k1, int r) {
+int decode_comb_1(uint64_t* n, int k1, int r) {
     while (comb(r, k1) > *n) {
         r--;
     }
@@ -104,10 +100,10 @@ int decode_comb_1 (uint64_t *n, int k1, int r) {
 }
 // optimized version for < 64 bits
-uint64_t repeats_encode_64 (
-     const std::vector<Repeat> & repeats,
-     int dim, const float *c)
-{
+uint64_t repeats_encode_64(
+        const std::vector<Repeat>& repeats,
+        int dim,
+        const float* c) {
     uint64_t coded = 0;
     int nfree = dim;
     uint64_t code = 0, shift = 1;
@@ -115,15 +111,16 @@ uint64_t repeats_encode_64 (
         int rank = 0, occ = 0;
         uint64_t code_comb = 0;
         uint64_t tosee = ~coded;
-        for(;;) {
+        for (;;) {
             // directly jump to next available slot.
             int i = __builtin_ctzll(tosee);
-            tosee &= ~(uint64_t{1} << i) ;
+            tosee &= ~(uint64_t{1} << i);
             if (c[i] == r->val) {
                 code_comb += comb(rank, occ + 1);
                 occ++;
                 coded |= uint64_t{1} << i;
-                if (occ == r->n) break;
+                if (occ == r->n)
+                    break;
             }
             rank++;
         }
@@ -135,11 +132,11 @@ uint64_t repeats_encode_64 (
     return code;
 }
 void repeats_decode_64(
-     const std::vector<Repeat> & repeats,
-     int dim, uint64_t code, float *c)
-{
+        const std::vector<Repeat>& repeats,
+        int dim,
+        uint64_t code,
+        float* c) {
     uint64_t decoded = 0;
     int nfree = dim;
     for (auto r = repeats.begin(); r != repeats.end(); ++r) {
@@ -149,9 +146,9 @@ void repeats_decode_64(
         int occ = 0;
         int rank = nfree;
-        int next_rank = decode_comb_1 (&code_comb, r->n, rank);
+        int next_rank = decode_comb_1(&code_comb, r->n, rank);
         uint64_t tosee = ((uint64_t{1} << dim) - 1) ^ decoded;
-        for(;;) {
+        for (;;) {
             int i = 63 - __builtin_clzll(tosee);
             tosee &= ~(uint64_t{1} << i);
             rank--;
@@ -159,25 +156,21 @@ void repeats_decode_64(
                 decoded |= uint64_t{1} << i;
                 c[i] = r->val;
                 occ++;
-                if (occ == r->n) break;
-                next_rank = decode_comb_1 (
-                   &code_comb, r->n - occ, next_rank);
+                if (occ == r->n)
+                    break;
+                next_rank = decode_comb_1(&code_comb, r->n - occ, next_rank);
             }
         }
         nfree -= r->n;
     }
 }
 } // anonymous namespace
-Repeats::Repeats (int dim, const float *c): dim(dim)
-{
-    for(int i = 0; i < dim; i++) {
+Repeats::Repeats(int dim, const float* c) : dim(dim) {
+    for (int i = 0; i < dim; i++) {
         int j = 0;
-        for(;;) {
+        for (;;) {
             if (j == repeats.size()) {
                 repeats.push_back(Repeat{c[i], 1});
                 break;
@@ -191,9 +184,7 @@ Repeats::Repeats (int dim, const float *c): dim(dim)
     }
 }
-uint64_t Repeats::count () const
-{
+uint64_t Repeats::count() const {
     uint64_t accu = 1;
     int remain = dim;
     for (int i = 0; i < repeats.size(); i++) {
@@ -203,13 +194,10 @@ uint64_t Repeats::count () const
     return accu;
 }
 // version with a bool vector that works for > 64 dim
-uint64_t Repeats::encode(const float *c) const
-{
+uint64_t Repeats::encode(const float* c) const {
     if (dim < 64) {
-        return repeats_encode_64 (repeats, dim, c);
+        return repeats_encode_64(repeats, dim, c);
     }
     std::vector<bool> coded(dim, false);
     int nfree = dim;
@@ -223,7 +211,8 @@ uint64_t Repeats::encode(const float *c) const
                     code_comb += comb(rank, occ + 1);
                     occ++;
                     coded[i] = true;
-                    if (occ == r->n) break;
+                    if (occ == r->n)
+                        break;
                 }
                 rank++;
             }
@@ -236,12 +225,9 @@ uint64_t Repeats::encode(const float *c) const
     return code;
 }
-void Repeats::decode(uint64_t code, float *c) const
-{
+void Repeats::decode(uint64_t code, float* c) const {
     if (dim < 64) {
-        repeats_decode_64 (repeats, dim, code, c);
+        repeats_decode_64(repeats, dim, code, c);
         return;
     }
@@ -254,7 +240,7 @@ void Repeats::decode(uint64_t code, float *c) const
         int occ = 0;
         int rank = nfree;
-        int next_rank = decode_comb_1 (&code_comb, r->n, rank);
+        int next_rank = decode_comb_1(&code_comb, r->n, rank);
         for (int i = dim - 1; i >= 0; i--) {
             if (!decoded[i]) {
                 rank--;
@@ -262,65 +248,61 @@ void Repeats::decode(uint64_t code, float *c) const
                     decoded[i] = true;
                     c[i] = r->val;
                     occ++;
-                    if (occ == r->n) break;
-                    next_rank = decode_comb_1 (
-                         &code_comb, r->n - occ, next_rank);
+                    if (occ == r->n)
+                        break;
+                    next_rank =
+                            decode_comb_1(&code_comb, r->n - occ, next_rank);
                 }
             }
         }
         nfree -= r->n;
     }
 }
 /********************************************
  * EnumeratedVectors functions
  ********************************************/
-void EnumeratedVectors::encode_multi(size_t n, const float *c,
-                               uint64_t * codes) const
-{
+void EnumeratedVectors::encode_multi(size_t n, const float* c, uint64_t* codes)
+        const {
 #pragma omp parallel if (n > 1000)
     {
 #pragma omp for
-        for(int i = 0; i < n; i++) {
+        for (int i = 0; i < n; i++) {
             codes[i] = encode(c + i * dim);
         }
     }
 }
-void EnumeratedVectors::decode_multi(size_t n, const uint64_t * codes,
-                               float *c) const
-{
+void EnumeratedVectors::decode_multi(size_t n, const uint64_t* codes, float* c)
+        const {
 #pragma omp parallel if (n > 1000)
     {
 #pragma omp for
-        for(int i = 0; i < n; i++) {
+        for (int i = 0; i < n; i++) {
             decode(codes[i], c + i * dim);
         }
     }
 }
-void EnumeratedVectors::find_nn (
-                  size_t nc, const uint64_t * codes,
-                  size_t nq, const float *xq,
-                  int64_t *labels, float *distances)
-{
+void EnumeratedVectors::find_nn(
+        size_t nc,
+        const uint64_t* codes,
+        size_t nq,
+        const float* xq,
+        int64_t* labels,
+        float* distances) {
     for (size_t i = 0; i < nq; i++) {
         distances[i] = -1e20;
         labels[i] = -1;
     }
     std::vector<float> c(dim);
-    for(size_t i = 0; i < nc; i++) {
+    for (size_t i = 0; i < nc; i++) {
         uint64_t code = codes[nc];
         decode(code, c.data());
         for (size_t j = 0; j < nq; j++) {
-            const float *x = xq + j * dim;
+            const float* x = xq + j * dim;
             float dis = fvec_inner_product(x, c.data(), dim);
             if (dis > distances[j]) {
                 distances[j] = dis;
@@ -328,45 +310,41 @@ void EnumeratedVectors::find_nn (
             }
         }
     }
 }
 /**********************************************************
  * ZnSphereSearch
  **********************************************************/
-ZnSphereSearch::ZnSphereSearch(int dim, int r2): dimS(dim), r2(r2) {
+ZnSphereSearch::ZnSphereSearch(int dim, int r2) : dimS(dim), r2(r2) {
     voc = sum_of_sq(r2, int(ceil(sqrt(r2)) + 1), dim);
     natom = voc.size() / dim;
 }
-float ZnSphereSearch::search(const float *x, float *c) const {
+float ZnSphereSearch::search(const float* x, float* c) const {
     std::vector<float> tmp(dimS * 2);
     std::vector<int> tmp_int(dimS);
     return search(x, c, tmp.data(), tmp_int.data());
 }
-float ZnSphereSearch::search(const float *x, float *c,
-                             float *tmp, // size 2 *dim
-                             int *tmp_int, // size dim
-                             int *ibest_out
-                             ) const {
+float ZnSphereSearch::search(
+        const float* x,
+        float* c,
+        float* tmp,   // size 2 *dim
+        int* tmp_int, // size dim
+        int* ibest_out) const {
     int dim = dimS;
-    assert (natom > 0);
-    int *o = tmp_int;
-    float *xabs = tmp;
-    float *xperm = tmp + dim;
+    assert(natom > 0);
+    int* o = tmp_int;
+    float* xabs = tmp;
+    float* xperm = tmp + dim;
     // argsort
     for (int i = 0; i < dim; i++) {
         o[i] = i;
         xabs[i] = fabsf(x[i]);
     }
-    std::sort(o, o + dim, [xabs](int a, int b) {
-            return xabs[a] > xabs[b];
-        });
+    std::sort(o, o + dim, [xabs](int a, int b) { return xabs[a] > xabs[b]; });
     for (int i = 0; i < dim; i++) {
         xperm[i] = xabs[o[i]];
     }
@@ -374,16 +352,16 @@ float ZnSphereSearch::search(const float *x, float *c,
     int ibest = -1;
     float dpbest = -100;
     for (int i = 0; i < natom; i++) {
-        float dp = fvec_inner_product (voc.data() + i * dim, xperm, dim);
+        float dp = fvec_inner_product(voc.data() + i * dim, xperm, dim);
         if (dp > dpbest) {
             dpbest = dp;
             ibest = i;
         }
     }
     // revert sort
-    const float *cin = voc.data() + ibest * dim;
+    const float* cin = voc.data() + ibest * dim;
     for (int i = 0; i < dim; i++) {
-        c[o[i]] = copysignf (cin[i], x[o[i]]);
+        c[o[i]] = copysignf(cin[i], x[o[i]]);
     }
     if (ibest_out) {
         *ibest_out = ibest;
@@ -391,33 +369,32 @@ float ZnSphereSearch::search(const float *x, float *c,
     return dpbest;
 }
-void ZnSphereSearch::search_multi(int n, const float *x,
-                                  float *c_out,
-                                  float *dp_out) {
+void ZnSphereSearch::search_multi(
+        int n,
+        const float* x,
+        float* c_out,
+        float* dp_out) {
 #pragma omp parallel if (n > 1000)
     {
 #pragma omp for
-        for(int i = 0; i < n; i++) {
+        for (int i = 0; i < n; i++) {
             dp_out[i] = search(x + i * dimS, c_out + i * dimS);
         }
     }
 }
 /**********************************************************
  * ZnSphereCodec
  **********************************************************/
-ZnSphereCodec::ZnSphereCodec(int dim, int r2):
-    ZnSphereSearch(dim, r2),
-    EnumeratedVectors(dim)
-{
+ZnSphereCodec::ZnSphereCodec(int dim, int r2)
+        : ZnSphereSearch(dim, r2), EnumeratedVectors(dim) {
     nv = 0;
     for (int i = 0; i < natom; i++) {
         Repeats repeats(dim, &voc[i * dim]);
         CodeSegment cs(repeats);
         cs.c0 = nv;
-        Repeat &br = repeats.repeats.back();
+        Repeat& br = repeats.repeats.back();
         cs.signbits = br.val == 0 ? dim - br.n : dim;
         code_segments.push_back(cs);
         nv += repeats.count() << cs.signbits;
@@ -431,7 +408,7 @@ ZnSphereCodec::ZnSphereCodec(int dim, int r2):
     }
 }
-uint64_t ZnSphereCodec::search_and_encode(const float *x) const {
+uint64_t ZnSphereCodec::search_and_encode(const float* x) const {
     std::vector<float> tmp(dim * 2);
     std::vector<int> tmp_int(dim);
     int ano; // atom number
@@ -446,30 +423,30 @@ uint64_t ZnSphereCodec::search_and_encode(const float *x) const {
             if (c[i] < 0) {
                 signs |= uint64_t{1} << nnz;
             }
-            nnz ++;
+            nnz++;
         }
     }
-    const CodeSegment &cs = code_segments[ano];
+    const CodeSegment& cs = code_segments[ano];
     assert(nnz == cs.signbits);
     uint64_t code = cs.c0 + signs;
     code += cs.encode(cabs.data()) << cs.signbits;
     return code;
 }
-uint64_t ZnSphereCodec::encode(const float *x) const
-{
+uint64_t ZnSphereCodec::encode(const float* x) const {
     return search_and_encode(x);
 }
-void ZnSphereCodec::decode(uint64_t code, float *c) const {
+void ZnSphereCodec::decode(uint64_t code, float* c) const {
     int i0 = 0, i1 = natom;
     while (i0 + 1 < i1) {
         int imed = (i0 + i1) / 2;
-        if (code_segments[imed].c0 <= code) i0 = imed;
-        else i1 = imed;
+        if (code_segments[imed].c0 <= code)
+            i0 = imed;
+        else
+            i1 = imed;
     }
-    const CodeSegment &cs = code_segments[i0];
+    const CodeSegment& cs = code_segments[i0];
     code -= cs.c0;
     uint64_t signs = code;
     code >>= cs.signbits;
@@ -481,42 +458,34 @@ void ZnSphereCodec::decode(uint64_t code, float *c) const {
             if (signs & (1UL << nnz)) {
                 c[i] = -c[i];
             }
-            nnz ++;
+            nnz++;
         }
     }
 }
 /**************************************************************
  * ZnSphereCodecRec
  **************************************************************/
-uint64_t ZnSphereCodecRec::get_nv(int ld, int r2a) const
-{
+uint64_t ZnSphereCodecRec::get_nv(int ld, int r2a) const {
     return all_nv[ld * (r2 + 1) + r2a];
 }
-uint64_t ZnSphereCodecRec::get_nv_cum(int ld, int r2t, int r2a) const
-{
+uint64_t ZnSphereCodecRec::get_nv_cum(int ld, int r2t, int r2a) const {
     return all_nv_cum[(ld * (r2 + 1) + r2t) * (r2 + 1) + r2a];
 }
-void ZnSphereCodecRec::set_nv_cum(int ld, int r2t, int r2a, uint64_t cum)
-{
+void ZnSphereCodecRec::set_nv_cum(int ld, int r2t, int r2a, uint64_t cum) {
     all_nv_cum[(ld * (r2 + 1) + r2t) * (r2 + 1) + r2a] = cum;
 }
-ZnSphereCodecRec::ZnSphereCodecRec(int dim, int r2):
-    EnumeratedVectors(dim), r2(r2)
-{
+ZnSphereCodecRec::ZnSphereCodecRec(int dim, int r2)
+        : EnumeratedVectors(dim), r2(r2) {
     log2_dim = 0;
     while (dim > (1 << log2_dim)) {
         log2_dim++;
     }
-    assert(dim == (1 << log2_dim) ||
-           !"dimension must be a power of 2");
+    assert(dim == (1 << log2_dim) || !"dimension must be a power of 2");
     all_nv.resize((log2_dim + 1) * (r2 + 1));
     all_nv_cum.resize((log2_dim + 1) * (r2 + 1) * (r2 + 1));
@@ -531,7 +500,6 @@ ZnSphereCodecRec::ZnSphereCodecRec(int dim, int r2):
     }
     for (int ld = 1; ld <= log2_dim; ld++) {
         for (int r2sub = 0; r2sub <= r2; r2sub++) {
             uint64_t nv = 0;
             for (int r2a = 0; r2a <= r2sub; r2a++) {
@@ -559,33 +527,29 @@ ZnSphereCodecRec::ZnSphereCodecRec(int dim, int r2):
     for (int r2sub = 0; r2sub <= r2; r2sub++) {
         int ld = cache_level;
         uint64_t nvi = get_nv(ld, r2sub);
-        std::vector<float> &cache = decode_cache[r2sub];
+        std::vector<float>& cache = decode_cache[r2sub];
         int dimsub = (1 << cache_level);
-        cache.resize (nvi * dimsub);
+        cache.resize(nvi * dimsub);
         std::vector<float> c(dim);
-        uint64_t code0 = get_nv_cum(cache_level + 1, r2,
-                                 r2 - r2sub);
+        uint64_t code0 = get_nv_cum(cache_level + 1, r2, r2 - r2sub);
         for (int i = 0; i < nvi; i++) {
             decode(i + code0, c.data());
-            memcpy(&cache[i * dimsub], c.data() + dim - dimsub,
+            memcpy(&cache[i * dimsub],
+                   c.data() + dim - dimsub,
                    dimsub * sizeof(*c.data()));
         }
     }
     decode_cache_ld = cache_level;
 }
-uint64_t ZnSphereCodecRec::encode(const float *c) const
-{
+uint64_t ZnSphereCodecRec::encode(const float* c) const {
     return encode_centroid(c);
 }
-uint64_t ZnSphereCodecRec::encode_centroid(const float *c) const
-{
+uint64_t ZnSphereCodecRec::encode_centroid(const float* c) const {
     std::vector<uint64_t> codes(dim);
     std::vector<int> norm2s(dim);
-    for(int i = 0; i < dim; i++) {
+    for (int i = 0; i < dim; i++) {
         if (c[i] == 0) {
             codes[i] = 0;
             norm2s[i] = 0;
@@ -596,7 +560,7 @@ uint64_t ZnSphereCodecRec::encode_centroid(const float *c) const
         }
     }
     int dim2 = dim / 2;
-    for(int ld = 1; ld <= log2_dim; ld++) {
+    for (int ld = 1; ld <= log2_dim; ld++) {
         for (int i = 0; i < dim2; i++) {
             int r2a = norm2s[2 * i];
             int r2b = norm2s[2 * i + 1];
@@ -604,10 +568,8 @@ uint64_t ZnSphereCodecRec::encode_centroid(const float *c) const
             uint64_t code_a = codes[2 * i];
             uint64_t code_b = codes[2 * i + 1];
-            codes[i] =
-                get_nv_cum(ld, r2a + r2b, r2a) +
-                code_a * get_nv(ld - 1, r2b) +
-                code_b;
+            codes[i] = get_nv_cum(ld, r2a + r2b, r2a) +
+                    code_a * get_nv(ld - 1, r2b) + code_b;
             norm2s[i] = r2a + r2b;
         }
         dim2 /= 2;
@@ -615,23 +577,20 @@ uint64_t ZnSphereCodecRec::encode_centroid(const float *c) const
     return codes[0];
 }
-void ZnSphereCodecRec::decode(uint64_t code, float *c) const
-{
+void ZnSphereCodecRec::decode(uint64_t code, float* c) const {
     std::vector<uint64_t> codes(dim);
     std::vector<int> norm2s(dim);
     codes[0] = code;
     norm2s[0] = r2;
     int dim2 = 1;
-    for(int ld = log2_dim; ld > decode_cache_ld; ld--) {
+    for (int ld = log2_dim; ld > decode_cache_ld; ld--) {
         for (int i = dim2 - 1; i >= 0; i--) {
             int r2sub = norm2s[i];
             int i0 = 0, i1 = r2sub + 1;
             uint64_t codei = codes[i];
-            const uint64_t *cum =
-                &all_nv_cum[(ld * (r2 + 1) + r2sub) * (r2 + 1)];
+            const uint64_t* cum =
+                    &all_nv_cum[(ld * (r2 + 1) + r2sub) * (r2 + 1)];
             while (i1 > i0 + 1) {
                 int imed = (i0 + i1) / 2;
                 if (cum[imed] <= codei)
@@ -649,13 +608,12 @@ void ZnSphereCodecRec::decode(uint64_t code, float *c) const
             codes[2 * i] = code_a;
             codes[2 * i + 1] = code_b;
         }
         dim2 *= 2;
     }
     if (decode_cache_ld == 0) {
-        for(int i = 0; i < dim; i++) {
+        for (int i = 0; i < dim; i++) {
             if (norm2s[i] == 0) {
                 c[i] = 0;
             } else {
@@ -666,49 +624,42 @@ void ZnSphereCodecRec::decode(uint64_t code, float *c) const
         }
     } else {
         int subdim = 1 << decode_cache_ld;
-        assert ((dim2 * subdim) == dim);
-        for(int i = 0; i < dim2; i++) {
+        assert((dim2 * subdim) == dim);
-            const std::vector<float> & cache =
-                decode_cache[norm2s[i]];
+        for (int i = 0; i < dim2; i++) {
+            const std::vector<float>& cache = decode_cache[norm2s[i]];
             assert(codes[i] < cache.size());
             memcpy(c + i * subdim,
                    &cache[codes[i] * subdim],
-                   sizeof(*c)* subdim);
+                   sizeof(*c) * subdim);
         }
     }
 }
 // if not use_rec, instanciate an arbitrary harmless znc_rec
-ZnSphereCodecAlt::ZnSphereCodecAlt (int dim, int r2):
-    ZnSphereCodec (dim, r2),
-    use_rec ((dim & (dim - 1)) == 0),
-    znc_rec (use_rec ? dim : 8,
-             use_rec ? r2 : 14)
-{}
-uint64_t ZnSphereCodecAlt::encode(const float *x) const
-{
+ZnSphereCodecAlt::ZnSphereCodecAlt(int dim, int r2)
+        : ZnSphereCodec(dim, r2),
+          use_rec((dim & (dim - 1)) == 0),
+          znc_rec(use_rec ? dim : 8, use_rec ? r2 : 14) {}
+uint64_t ZnSphereCodecAlt::encode(const float* x) const {
     if (!use_rec) {
         // it's ok if the vector is not normalized
         return ZnSphereCodec::encode(x);
     } else {
         // find nearest centroid
         std::vector<float> centroid(dim);
-        search (x, centroid.data());
+        search(x, centroid.data());
         return znc_rec.encode(centroid.data());
     }
 }
-void ZnSphereCodecAlt::decode(uint64_t code, float *c) const
-{
+void ZnSphereCodecAlt::decode(uint64_t code, float* c) const {
     if (!use_rec) {
-        ZnSphereCodec::decode (code, c);
+        ZnSphereCodec::decode(code, c);
     } else {
-        znc_rec.decode (code, c);
+        znc_rec.decode(code, c);
     }
 }
 } // namespace faiss