RubyGems - faiss - Versions diffs - 0.1.5 → 0.2.2 - Mend

faiss 0.1.5 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +24 -0
data/README.md +12 -0
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +6 -2
data/ext/faiss/index.cpp +114 -43
data/ext/faiss/index_binary.cpp +24 -30
data/ext/faiss/kmeans.cpp +20 -16
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +13 -14
data/ext/faiss/product_quantizer.cpp +23 -24
data/ext/faiss/utils.cpp +10 -37
data/ext/faiss/utils.h +2 -13
data/lib/faiss.rb +0 -5
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +24 -10
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/Index2Layer.cpp CHANGED Viewed

@@ -9,11 +9,12 @@
 #include <faiss/Index2Layer.h>
+#include <faiss/impl/platform_macros.h>
+#include <stdint.h>
+#include <cassert>
 #include <cinttypes>
 #include <cmath>
 #include <cstdio>
-#include <cassert>
-#include <stdint.h>
 #ifdef __SSE3__
 #include <immintrin.h>
@@ -23,12 +24,11 @@
 #include <faiss/IndexIVFPQ.h>
-#include <faiss/impl/FaissAssert.h>
-#include <faiss/utils/utils.h>
-#include <faiss/impl/AuxIndexStructures.h>
 #include <faiss/IndexFlat.h>
+#include <faiss/impl/AuxIndexStructures.h>
+#include <faiss/impl/FaissAssert.h>
 #include <faiss/utils/distances.h>
+#include <faiss/utils/utils.h>
 /*
 #include <faiss/utils/Heap.h>
@@ -40,22 +40,21 @@
 */
 namespace faiss {
 /*************************************
  * Index2Layer implementation
  *************************************/
-Index2Layer::Index2Layer (Index * quantizer, size_t nlist,
-                          int M, int nbit,
-                          MetricType metric):
-    Index (quantizer->d, metric),
-    q1 (quantizer, nlist),
-    pq (quantizer->d, M, nbit)
-{
+Index2Layer::Index2Layer(
+        Index* quantizer,
+        size_t nlist,
+        int M,
+        int nbit,
+        MetricType metric)
+        : Index(quantizer->d, metric),
+          q1(quantizer, nlist),
+          pq(quantizer->d, M, nbit) {
     is_trained = false;
     for (int nbyte = 0; nbyte < 7; nbyte++) {
         if ((1L << (8 * nbyte)) >= nlist) {
@@ -67,122 +66,125 @@ Index2Layer::Index2Layer (Index * quantizer, size_t nlist,
     code_size = code_size_1 + code_size_2;
 }
-Index2Layer::Index2Layer ()
-{
+Index2Layer::Index2Layer() {
     code_size = code_size_1 = code_size_2 = 0;
 }
-Index2Layer::~Index2Layer ()
-{}
+Index2Layer::~Index2Layer() {}
-void Index2Layer::train(idx_t n, const float* x)
-{
+void Index2Layer::train(idx_t n, const float* x) {
     if (verbose) {
-        printf ("training level-1 quantizer %" PRId64 " vectors in %dD\n",
-                n, d);
+        printf("training level-1 quantizer %" PRId64 " vectors in %dD\n", n, d);
     }
-    q1.train_q1 (n, x, verbose, metric_type);
+    q1.train_q1(n, x, verbose, metric_type);
     if (verbose) {
         printf("computing residuals\n");
     }
-    const float * x_in = x;
+    const float* x_in = x;
-    x = fvecs_maybe_subsample (
-         d, (size_t*)&n, pq.cp.max_points_per_centroid * pq.ksub,
-         x, verbose, pq.cp.seed);
+    x = fvecs_maybe_subsample(
+            d,
+            (size_t*)&n,
+            pq.cp.max_points_per_centroid * pq.ksub,
+            x,
+            verbose,
+            pq.cp.seed);
-    ScopeDeleter<float> del_x (x_in == x ? nullptr : x);
+    ScopeDeleter<float> del_x(x_in == x ? nullptr : x);
     std::vector<idx_t> assign(n); // assignement to coarse centroids
-    q1.quantizer->assign (n, x, assign.data());
+    q1.quantizer->assign(n, x, assign.data());
     std::vector<float> residuals(n * d);
     for (idx_t i = 0; i < n; i++) {
-        q1.quantizer->compute_residual (
-           x + i * d, residuals.data() + i * d, assign[i]);
+        q1.quantizer->compute_residual(
+                x + i * d, residuals.data() + i * d, assign[i]);
     }
     if (verbose)
-        printf ("training %zdx%zd product quantizer on %" PRId64 " vectors in %dD\n",
-                pq.M, pq.ksub, n, d);
+        printf("training %zdx%zd product quantizer on %" PRId64
+               " vectors in %dD\n",
+               pq.M,
+               pq.ksub,
+               n,
+               d);
     pq.verbose = verbose;
-    pq.train (n, residuals.data());
+    pq.train(n, residuals.data());
     is_trained = true;
 }
-void Index2Layer::add(idx_t n, const float* x)
-{
+void Index2Layer::add(idx_t n, const float* x) {
     idx_t bs = 32768;
     if (n > bs) {
         for (idx_t i0 = 0; i0 < n; i0 += bs) {
             idx_t i1 = std::min(i0 + bs, n);
             if (verbose) {
-                printf("Index2Layer::add: adding %" PRId64 ":%" PRId64 " / %" PRId64 "\n",
-                       i0, i1, n);
+                printf("Index2Layer::add: adding %" PRId64 ":%" PRId64
+                       " / %" PRId64 "\n",
+                       i0,
+                       i1,
+                       n);
             }
-            add (i1 - i0, x + i0 * d);
+            add(i1 - i0, x + i0 * d);
         }
         return;
     }
-    std::vector<idx_t> codes1 (n);
-    q1.quantizer->assign (n, x, codes1.data());
+    std::vector<idx_t> codes1(n);
+    q1.quantizer->assign(n, x, codes1.data());
     std::vector<float> residuals(n * d);
     for (idx_t i = 0; i < n; i++) {
-        q1.quantizer->compute_residual (
-            x + i * d, residuals.data() + i * d, codes1[i]);
+        q1.quantizer->compute_residual(
+                x + i * d, residuals.data() + i * d, codes1[i]);
     }
-    std::vector<uint8_t> codes2 (n * code_size_2);
+    std::vector<uint8_t> codes2(n * code_size_2);
-    pq.compute_codes (residuals.data(), codes2.data(), n);
+    pq.compute_codes(residuals.data(), codes2.data(), n);
-    codes.resize ((ntotal + n) * code_size);
-    uint8_t *wp = &codes[ntotal * code_size];
+    codes.resize((ntotal + n) * code_size);
+    uint8_t* wp = &codes[ntotal * code_size];
     {
         int i = 0x11223344;
-        const char *ip = (char*)&i;
-        FAISS_THROW_IF_NOT_MSG (ip[0] == 0x44,
-                                "works only on a little-endian CPU");
+        const char* ip = (char*)&i;
+        FAISS_THROW_IF_NOT_MSG(
+                ip[0] == 0x44, "works only on a little-endian CPU");
     }
     // copy to output table
     for (idx_t i = 0; i < n; i++) {
-        memcpy (wp, &codes1[i], code_size_1);
+        memcpy(wp, &codes1[i], code_size_1);
         wp += code_size_1;
-        memcpy (wp, &codes2[i * code_size_2], code_size_2);
+        memcpy(wp, &codes2[i * code_size_2], code_size_2);
         wp += code_size_2;
     }
     ntotal += n;
 }
 void Index2Layer::search(
-    idx_t /*n*/,
-    const float* /*x*/,
-    idx_t /*k*/,
-    float* /*distances*/,
-    idx_t* /*labels*/) const {
-  FAISS_THROW_MSG("not implemented");
+        idx_t /*n*/,
+        const float* /*x*/,
+        idx_t /*k*/,
+        float* /*distances*/,
+        idx_t* /*labels*/) const {
+    FAISS_THROW_MSG("not implemented");
 }
-void Index2Layer::reconstruct_n(idx_t i0, idx_t ni, float* recons) const
-{
+void Index2Layer::reconstruct_n(idx_t i0, idx_t ni, float* recons) const {
     std::vector<float> recons1(d);
-    FAISS_THROW_IF_NOT (i0 >= 0 && i0 + ni <= ntotal);
-    const uint8_t *rp = &codes[i0 * code_size];
+    FAISS_THROW_IF_NOT(i0 >= 0 && i0 + ni <= ntotal);
+    const uint8_t* rp = &codes[i0 * code_size];
     for (idx_t i = 0; i < ni; i++) {
         idx_t key = 0;
-        memcpy (&key, rp, code_size_1);
-        q1.quantizer->reconstruct (key, recons1.data());
+        memcpy(&key, rp, code_size_1);
+        q1.quantizer->reconstruct(key, recons1.data());
         rp += code_size_1;
-        pq.decode (rp, recons);
+        pq.decode(rp, recons);
         for (idx_t j = 0; j < d; j++) {
             recons[j] += recons1[j];
         }
@@ -191,53 +193,44 @@ void Index2Layer::reconstruct_n(idx_t i0, idx_t ni, float* recons) const
     }
 }
-void Index2Layer::transfer_to_IVFPQ (IndexIVFPQ & other) const
-{
-    FAISS_THROW_IF_NOT (other.nlist == q1.nlist);
-    FAISS_THROW_IF_NOT (other.code_size == code_size_2);
-    FAISS_THROW_IF_NOT (other.ntotal == 0);
+void Index2Layer::transfer_to_IVFPQ(IndexIVFPQ& other) const {
+    FAISS_THROW_IF_NOT(other.nlist == q1.nlist);
+    FAISS_THROW_IF_NOT(other.code_size == code_size_2);
+    FAISS_THROW_IF_NOT(other.ntotal == 0);
-    const uint8_t *rp = codes.data();
+    const uint8_t* rp = codes.data();
     for (idx_t i = 0; i < ntotal; i++) {
         idx_t key = 0;
-        memcpy (&key, rp, code_size_1);
+        memcpy(&key, rp, code_size_1);
         rp += code_size_1;
-        other.invlists->add_entry (key, i, rp);
+        other.invlists->add_entry(key, i, rp);
         rp += code_size_2;
     }
     other.ntotal = ntotal;
 }
-void Index2Layer::reconstruct(idx_t key, float* recons) const
-{
-    reconstruct_n (key, 1, recons);
+void Index2Layer::reconstruct(idx_t key, float* recons) const {
+    reconstruct_n(key, 1, recons);
 }
-void Index2Layer::reset()
-{
+void Index2Layer::reset() {
     ntotal = 0;
-    codes.clear ();
+    codes.clear();
 }
 namespace {
 struct Distance2Level : DistanceComputer {
     size_t d;
     const Index2Layer& storage;
     std::vector<float> buf;
-    const float *q;
+    const float* q;
     const float *pq_l1_tab, *pq_l2_tab;
-    explicit Distance2Level(const Index2Layer& storage)
-        : storage(storage) {
+    explicit Distance2Level(const Index2Layer& storage) : storage(storage) {
         d = storage.d;
         FAISS_ASSERT(storage.pq.dsub == 4);
         pq_l2_tab = storage.pq.centroids.data();
@@ -250,67 +243,64 @@ struct Distance2Level : DistanceComputer {
         return fvec_L2sqr(buf.data() + d, buf.data(), d);
     }
-    void set_query(const float *x) override {
+    void set_query(const float* x) override {
         q = x;
     }
 };
 // well optimized for xNN+PQNN
 struct DistanceXPQ4 : Distance2Level {
     int M, k;
     explicit DistanceXPQ4(const Index2Layer& storage)
-        : Distance2Level (storage) {
-        const IndexFlat *quantizer =
-            dynamic_cast<IndexFlat*> (storage.q1.quantizer);
+            : Distance2Level(storage) {
+        const IndexFlat* quantizer =
+                dynamic_cast<IndexFlat*>(storage.q1.quantizer);
         FAISS_ASSERT(quantizer);
         M = storage.pq.M;
         pq_l1_tab = quantizer->xb.data();
     }
-    float operator () (idx_t i) override {
+    float operator()(idx_t i) override {
 #ifdef __SSE3__
-        const uint8_t *code = storage.codes.data() + i * storage.code_size;
+        const uint8_t* code = storage.codes.data() + i * storage.code_size;
         long key = 0;
-        memcpy (&key, code, storage.code_size_1);
+        memcpy(&key, code, storage.code_size_1);
         code += storage.code_size_1;
         // walking pointers
-        const float *qa = q;
-        const __m128 *l1_t = (const __m128 *)(pq_l1_tab + d * key);
-        const __m128 *pq_l2_t = (const __m128 *)pq_l2_tab;
+        const float* qa = q;
+        const __m128* l1_t = (const __m128*)(pq_l1_tab + d * key);
+        const __m128* pq_l2_t = (const __m128*)pq_l2_tab;
         __m128 accu = _mm_setzero_ps();
         for (int m = 0; m < M; m++) {
             __m128 qi = _mm_loadu_ps(qa);
-            __m128 recons = l1_t[m] + pq_l2_t[*code++];
-            __m128 diff = qi - recons;
-            accu += diff * diff;
+            __m128 recons = _mm_add_ps(l1_t[m], pq_l2_t[*code++]);
+            __m128 diff = _mm_sub_ps(qi, recons);
+            accu = _mm_add_ps(accu, _mm_mul_ps(diff, diff));
             pq_l2_t += 256;
             qa += 4;
         }
-        accu = _mm_hadd_ps (accu, accu);
-        accu = _mm_hadd_ps (accu, accu);
-        return  _mm_cvtss_f32 (accu);
+        accu = _mm_hadd_ps(accu, accu);
+        accu = _mm_hadd_ps(accu, accu);
+        return _mm_cvtss_f32(accu);
 #else
         FAISS_THROW_MSG("not implemented for non-x64 platforms");
 #endif
     }
 };
 // well optimized for 2xNN+PQNN
 struct Distance2xXPQ4 : Distance2Level {
     int M_2, mi_nbits;
     explicit Distance2xXPQ4(const Index2Layer& storage)
-        : Distance2Level(storage) {
-        const MultiIndexQuantizer *mi =
-            dynamic_cast<MultiIndexQuantizer*> (storage.q1.quantizer);
+            : Distance2Level(storage) {
+        const MultiIndexQuantizer* mi =
+                dynamic_cast<MultiIndexQuantizer*>(storage.q1.quantizer);
         FAISS_ASSERT(mi);
         FAISS_ASSERT(storage.pq.M % 2 == 0);
@@ -319,59 +309,55 @@ struct Distance2xXPQ4 : Distance2Level {
         pq_l1_tab = mi->pq.centroids.data();
     }
-    float operator () (idx_t i) override {
-        const uint8_t *code = storage.codes.data() + i * storage.code_size;
+    float operator()(idx_t i) override {
+        const uint8_t* code = storage.codes.data() + i * storage.code_size;
         long key01 = 0;
-        memcpy (&key01, code, storage.code_size_1);
+        memcpy(&key01, code, storage.code_size_1);
         code += storage.code_size_1;
 #ifdef __SSE3__
         // walking pointers
-        const float *qa = q;
-        const __m128 *pq_l1_t = (const __m128 *)pq_l1_tab;
-        const __m128 *pq_l2_t = (const __m128 *)pq_l2_tab;
+        const float* qa = q;
+        const __m128* pq_l1_t = (const __m128*)pq_l1_tab;
+        const __m128* pq_l2_t = (const __m128*)pq_l2_tab;
         __m128 accu = _mm_setzero_ps();
         for (int mi_m = 0; mi_m < 2; mi_m++) {
             long l1_idx = key01 & ((1L << mi_nbits) - 1);
-            const __m128 * pq_l1 = pq_l1_t + M_2 * l1_idx;
+            const __m128* pq_l1 = pq_l1_t + M_2 * l1_idx;
             for (int m = 0; m < M_2; m++) {
                 __m128 qi = _mm_loadu_ps(qa);
-                __m128 recons = pq_l1[m] + pq_l2_t[*code++];
-                __m128 diff = qi - recons;
-                accu += diff * diff;
+                __m128 recons = _mm_add_ps(pq_l1[m], pq_l2_t[*code++]);
+                __m128 diff = _mm_sub_ps(qi, recons);
+                accu = _mm_add_ps(accu, _mm_mul_ps(diff, diff));
                 pq_l2_t += 256;
                 qa += 4;
             }
             pq_l1_t += M_2 << mi_nbits;
             key01 >>= mi_nbits;
         }
-        accu = _mm_hadd_ps (accu, accu);
-        accu = _mm_hadd_ps (accu, accu);
-        return  _mm_cvtss_f32 (accu);
+        accu = _mm_hadd_ps(accu, accu);
+        accu = _mm_hadd_ps(accu, accu);
+        return _mm_cvtss_f32(accu);
 #else
         FAISS_THROW_MSG("not implemented for non-x64 platforms");
 #endif
     }
 };
+} // namespace
-}  // namespace
-DistanceComputer * Index2Layer::get_distance_computer() const {
+DistanceComputer* Index2Layer::get_distance_computer() const {
 #ifdef __SSE3__
-    const MultiIndexQuantizer *mi =
-        dynamic_cast<MultiIndexQuantizer*> (q1.quantizer);
+    const MultiIndexQuantizer* mi =
+            dynamic_cast<MultiIndexQuantizer*>(q1.quantizer);
     if (mi && pq.M % 2 == 0 && pq.dsub == 4) {
         return new Distance2xXPQ4(*this);
     }
-    const IndexFlat *fl =
-        dynamic_cast<IndexFlat*> (q1.quantizer);
+    const IndexFlat* fl = dynamic_cast<IndexFlat*>(q1.quantizer);
     if (fl && pq.dsub == 4) {
         return new DistanceXPQ4(*this);
@@ -381,57 +367,46 @@ DistanceComputer * Index2Layer::get_distance_computer() const {
     return Index::get_distance_computer();
 }
 /* The standalone codec interface */
-size_t Index2Layer::sa_code_size () const
-{
+size_t Index2Layer::sa_code_size() const {
     return code_size;
 }
-void Index2Layer::sa_encode (idx_t n, const float *x, uint8_t *bytes) const
-{
-    FAISS_THROW_IF_NOT (is_trained);
-    std::unique_ptr<int64_t []> list_nos (new int64_t [n]);
-    q1.quantizer->assign (n, x, list_nos.get());
+void Index2Layer::sa_encode(idx_t n, const float* x, uint8_t* bytes) const {
+    FAISS_THROW_IF_NOT(is_trained);
+    std::unique_ptr<int64_t[]> list_nos(new int64_t[n]);
+    q1.quantizer->assign(n, x, list_nos.get());
     std::vector<float> residuals(n * d);
     for (idx_t i = 0; i < n; i++) {
-        q1.quantizer->compute_residual (
-            x + i * d, residuals.data() + i * d, list_nos[i]);
+        q1.quantizer->compute_residual(
+                x + i * d, residuals.data() + i * d, list_nos[i]);
     }
-    pq.compute_codes (residuals.data(), bytes, n);
+    pq.compute_codes(residuals.data(), bytes, n);
     for (idx_t i = n - 1; i >= 0; i--) {
-        uint8_t * code = bytes + i * code_size;
-        memmove (code + code_size_1,
-                 bytes + i * code_size_2, code_size_2);
-        q1.encode_listno (list_nos[i], code);
+        uint8_t* code = bytes + i * code_size;
+        memmove(code + code_size_1, bytes + i * code_size_2, code_size_2);
+        q1.encode_listno(list_nos[i], code);
     }
 }
-void Index2Layer::sa_decode (idx_t n, const uint8_t *bytes, float *x) const
-{
+void Index2Layer::sa_decode(idx_t n, const uint8_t* bytes, float* x) const {
 #pragma omp parallel
     {
-        std::vector<float> residual (d);
+        std::vector<float> residual(d);
 #pragma omp for
         for (idx_t i = 0; i < n; i++) {
-            const uint8_t *code = bytes + i * code_size;
-            int64_t list_no = q1.decode_listno (code);
-            float *xi = x + i * d;
-            pq.decode (code + code_size_1, xi);
-            q1.quantizer->reconstruct (list_no, residual.data());
+            const uint8_t* code = bytes + i * code_size;
+            int64_t list_no = q1.decode_listno(code);
+            float* xi = x + i * d;
+            pq.decode(code + code_size_1, xi);
+            q1.quantizer->reconstruct(list_no, residual.data());
             for (int j = 0; j < d; j++) {
                 xi[j] += residual[j];
             }
         }
     }
 }
 } // namespace faiss