RubyGems - faiss - Versions diffs - 0.1.7 → 0.2.3 - Mend

faiss 0.1.7 → 0.2.3

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +18 -0
data/README.md +7 -7
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +8 -2
data/ext/faiss/index.cpp +102 -69
data/ext/faiss/index_binary.cpp +24 -30
data/ext/faiss/kmeans.cpp +20 -16
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +13 -14
data/ext/faiss/product_quantizer.cpp +23 -24
data/ext/faiss/utils.cpp +10 -37
data/ext/faiss/utils.h +2 -13
data/lib/faiss/version.rb +1 -1
data/lib/faiss.rb +0 -5
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +26 -12
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/utils/hamming-inl.h CHANGED Viewed

@@ -7,15 +7,15 @@
 namespace faiss {
+extern const uint8_t hamdis_tab_ham_bytes[256];
-inline BitstringWriter::BitstringWriter(uint8_t *code, size_t code_size):
-    code (code), code_size (code_size), i(0)
-{
-    memset (code, 0, code_size);
+inline BitstringWriter::BitstringWriter(uint8_t* code, size_t code_size)
+        : code(code), code_size(code_size), i(0) {
+    memset(code, 0, code_size);
 }
 inline void BitstringWriter::write(uint64_t x, int nbit) {
-    assert (code_size * 8 >= nbit + i);
+    assert(code_size * 8 >= nbit + i);
     // nb of available bits in i / 8
     int na = 8 - (i & 7);
@@ -35,13 +35,11 @@ inline void BitstringWriter::write(uint64_t x, int nbit) {
     }
 }
-inline BitstringReader::BitstringReader(const uint8_t *code, size_t code_size):
-    code (code), code_size (code_size), i(0)
-{}
+inline BitstringReader::BitstringReader(const uint8_t* code, size_t code_size)
+        : code(code), code_size(code_size), i(0) {}
 inline uint64_t BitstringReader::read(int nbit) {
-    assert (code_size * 8 >= nbit + i);
+    assert(code_size * 8 >= nbit + i);
     // nb of available bits in i / 8
     int na = 8 - (i & 7);
     // get available bits in current byte
@@ -67,7 +65,6 @@ inline uint64_t BitstringReader::read(int nbit) {
     }
 }
 /******************************************************************
  * The HammingComputer series of classes compares a single code of
  * size 4 to 32 to incoming codes. They are intended for use as a
@@ -76,68 +73,64 @@ inline uint64_t BitstringReader::read(int nbit) {
  * hamming() functions and put the a0, a1, ... in registers.
  ******************************************************************/
 struct HammingComputer4 {
     uint32_t a0;
-    HammingComputer4 () {}
+    HammingComputer4() {}
-    HammingComputer4 (const uint8_t *a, int code_size) {
-        set (a, code_size);
+    HammingComputer4(const uint8_t* a, int code_size) {
+        set(a, code_size);
     }
-    void set (const uint8_t *a, int code_size) {
-        assert (code_size == 4);
-        a0 = *(uint32_t *)a;
+    void set(const uint8_t* a, int code_size) {
+        assert(code_size == 4);
+        a0 = *(uint32_t*)a;
     }
-    inline int hamming (const uint8_t *b) const {
-        return popcount64 (*(uint32_t *)b ^ a0);
+    inline int hamming(const uint8_t* b) const {
+        return popcount64(*(uint32_t*)b ^ a0);
     }
 };
 struct HammingComputer8 {
     uint64_t a0;
-    HammingComputer8 () {}
+    HammingComputer8() {}
-    HammingComputer8 (const uint8_t *a, int code_size) {
-        set (a, code_size);
+    HammingComputer8(const uint8_t* a, int code_size) {
+        set(a, code_size);
     }
-    void set (const uint8_t *a, int code_size) {
-        assert (code_size == 8);
-        a0 = *(uint64_t *)a;
+    void set(const uint8_t* a, int code_size) {
+        assert(code_size == 8);
+        a0 = *(uint64_t*)a;
     }
-    inline int hamming (const uint8_t *b) const {
-        return popcount64 (*(uint64_t *)b ^ a0);
+    inline int hamming(const uint8_t* b) const {
+        return popcount64(*(uint64_t*)b ^ a0);
     }
 };
 struct HammingComputer16 {
     uint64_t a0, a1;
-    HammingComputer16 () {}
+    HammingComputer16() {}
-    HammingComputer16 (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputer16(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        assert (code_size == 16);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1];
+    void set(const uint8_t* a8, int code_size) {
+        assert(code_size == 16);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return popcount64 (b[0] ^ a0) + popcount64 (b[1] ^ a1);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return popcount64(b[0] ^ a0) + popcount64(b[1] ^ a1);
     }
 };
 // when applied to an array, 1/2 of the 64-bit accesses are unaligned.
@@ -146,150 +139,212 @@ struct HammingComputer20 {
     uint64_t a0, a1;
     uint32_t a2;
-    HammingComputer20 () {}
+    HammingComputer20() {}
-    HammingComputer20 (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputer20(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        assert (code_size == 20);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1]; a2 = a[2];
+    void set(const uint8_t* a8, int code_size) {
+        assert(code_size == 20);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
+        a2 = a[2];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return popcount64 (b[0] ^ a0) + popcount64 (b[1] ^ a1) +
-            popcount64 (*(uint32_t*)(b + 2) ^ a2);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return popcount64(b[0] ^ a0) + popcount64(b[1] ^ a1) +
+                popcount64(*(uint32_t*)(b + 2) ^ a2);
     }
 };
 struct HammingComputer32 {
     uint64_t a0, a1, a2, a3;
-    HammingComputer32 () {}
+    HammingComputer32() {}
-    HammingComputer32 (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputer32(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        assert (code_size == 32);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1]; a2 = a[2]; a3 = a[3];
+    void set(const uint8_t* a8, int code_size) {
+        assert(code_size == 32);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
+        a2 = a[2];
+        a3 = a[3];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return popcount64 (b[0] ^ a0) + popcount64 (b[1] ^ a1) +
-            popcount64 (b[2] ^ a2) + popcount64 (b[3] ^ a3);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return popcount64(b[0] ^ a0) + popcount64(b[1] ^ a1) +
+                popcount64(b[2] ^ a2) + popcount64(b[3] ^ a3);
     }
 };
 struct HammingComputer64 {
     uint64_t a0, a1, a2, a3, a4, a5, a6, a7;
-    HammingComputer64 () {}
+    HammingComputer64() {}
-    HammingComputer64 (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputer64(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        assert (code_size == 64);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1]; a2 = a[2]; a3 = a[3];
-        a4 = a[4]; a5 = a[5]; a6 = a[6]; a7 = a[7];
+    void set(const uint8_t* a8, int code_size) {
+        assert(code_size == 64);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
+        a2 = a[2];
+        a3 = a[3];
+        a4 = a[4];
+        a5 = a[5];
+        a6 = a[6];
+        a7 = a[7];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return popcount64 (b[0] ^ a0) + popcount64 (b[1] ^ a1) +
-            popcount64 (b[2] ^ a2) + popcount64 (b[3] ^ a3) +
-            popcount64 (b[4] ^ a4) + popcount64 (b[5] ^ a5) +
-            popcount64 (b[6] ^ a6) + popcount64 (b[7] ^ a7);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return popcount64(b[0] ^ a0) + popcount64(b[1] ^ a1) +
+                popcount64(b[2] ^ a2) + popcount64(b[3] ^ a3) +
+                popcount64(b[4] ^ a4) + popcount64(b[5] ^ a5) +
+                popcount64(b[6] ^ a6) + popcount64(b[7] ^ a7);
     }
 };
-// very inefficient...
 struct HammingComputerDefault {
-    const uint8_t *a;
-    int n;
+    const uint8_t* a8;
+    int quotient8;
+    int remainder8;
-    HammingComputerDefault () {}
+    HammingComputerDefault() {}
-    HammingComputerDefault (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputerDefault(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        a =  a8;
-        n = code_size;
+    void set(const uint8_t* a8, int code_size) {
+        this->a8 = a8;
+        quotient8 = code_size / 8;
+        remainder8 = code_size % 8;
     }
-    int hamming (const uint8_t *b8) const {
+    int hamming(const uint8_t* b8) const {
         int accu = 0;
-        for (int i = 0; i < n; i++)
-            accu += popcount64 (a[i] ^ b8[i]);
+        const uint64_t* a64 = reinterpret_cast<const uint64_t*>(a8);
+        const uint64_t* b64 = reinterpret_cast<const uint64_t*>(b8);
+        int i = 0, len = quotient8;
+        switch (len & 7) {
+            default:
+                while (len > 7) {
+                    len -= 8;
+                    accu += popcount64(a64[i] ^ b64[i]);
+                    i++;
+                    case 7:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 6:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 5:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 4:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 3:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 2:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                    case 1:
+                        accu += popcount64(a64[i] ^ b64[i]);
+                        i++;
+                }
+        }
+        if (remainder8) {
+            const uint8_t* a = a8 + 8 * quotient8;
+            const uint8_t* b = b8 + 8 * quotient8;
+            switch (remainder8) {
+                case 7:
+                    accu += hamdis_tab_ham_bytes[a[6] ^ b[6]];
+                case 6:
+                    accu += hamdis_tab_ham_bytes[a[5] ^ b[5]];
+                case 5:
+                    accu += hamdis_tab_ham_bytes[a[4] ^ b[4]];
+                case 4:
+                    accu += hamdis_tab_ham_bytes[a[3] ^ b[3]];
+                case 3:
+                    accu += hamdis_tab_ham_bytes[a[2] ^ b[2]];
+                case 2:
+                    accu += hamdis_tab_ham_bytes[a[1] ^ b[1]];
+                case 1:
+                    accu += hamdis_tab_ham_bytes[a[0] ^ b[0]];
+                default:
+                    break;
+            }
+        }
         return accu;
     }
 };
+// more inefficient than HammingComputerDefault (obsolete)
 struct HammingComputerM8 {
-    const uint64_t *a;
+    const uint64_t* a;
     int n;
-    HammingComputerM8 () {}
+    HammingComputerM8() {}
-    HammingComputerM8 (const uint8_t *a8, int code_size) {
-        set (a8, code_size);
+    HammingComputerM8(const uint8_t* a8, int code_size) {
+        set(a8, code_size);
     }
-    void set (const uint8_t *a8, int code_size) {
-        assert (code_size % 8 == 0);
-        a =  (uint64_t *)a8;
+    void set(const uint8_t* a8, int code_size) {
+        assert(code_size % 8 == 0);
+        a = (uint64_t*)a8;
         n = code_size / 8;
     }
-    int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
+    int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
         int accu = 0;
         for (int i = 0; i < n; i++)
-            accu += popcount64 (a[i] ^ b[i]);
+            accu += popcount64(a[i] ^ b[i]);
         return accu;
     }
 };
-// even more inefficient!
+// more inefficient than HammingComputerDefault (obsolete)
 struct HammingComputerM4 {
-    const uint32_t *a;
+    const uint32_t* a;
     int n;
-    HammingComputerM4 () {}
+    HammingComputerM4() {}
-    HammingComputerM4 (const uint8_t *a4, int code_size) {
-        set (a4, code_size);
+    HammingComputerM4(const uint8_t* a4, int code_size) {
+        set(a4, code_size);
     }
-    void set (const uint8_t *a4, int code_size) {
-        assert (code_size % 4 == 0);
-        a =  (uint32_t *)a4;
+    void set(const uint8_t* a4, int code_size) {
+        assert(code_size % 4 == 0);
+        a = (uint32_t*)a4;
         n = code_size / 4;
     }
-    int hamming (const uint8_t *b8) const {
-        const uint32_t *b = (uint32_t *)b8;
+    int hamming(const uint8_t* b8) const {
+        const uint32_t* b = (uint32_t*)b8;
         int accu = 0;
         for (int i = 0; i < n; i++)
-             accu += popcount64 (a[i] ^ b[i]);
+            accu += popcount64(a[i] ^ b[i]);
         return accu;
     }
 };
 /***************************************************************************
@@ -297,17 +352,17 @@ struct HammingComputerM4 {
  **************************************************************************/
 // default template
-template<int CODE_SIZE>
-struct HammingComputer: HammingComputerM8 {
-    HammingComputer (const uint8_t *a, int code_size):
-    HammingComputerM8(a, code_size) {}
+template <int CODE_SIZE>
+struct HammingComputer : HammingComputerDefault {
+    HammingComputer(const uint8_t* a, int code_size)
+            : HammingComputerDefault(a, code_size) {}
 };
-#define SPECIALIZED_HC(CODE_SIZE)                     \
-    template<> struct HammingComputer<CODE_SIZE>:     \
-            HammingComputer ## CODE_SIZE {            \
-        HammingComputer (const uint8_t *a):           \
-        HammingComputer ## CODE_SIZE(a, CODE_SIZE) {} \
+#define SPECIALIZED_HC(CODE_SIZE)                                    \
+    template <>                                                      \
+    struct HammingComputer<CODE_SIZE> : HammingComputer##CODE_SIZE { \
+        HammingComputer(const uint8_t* a)                            \
+                : HammingComputer##CODE_SIZE(a, CODE_SIZE) {}        \
     }
 SPECIALIZED_HC(4);
@@ -319,105 +374,98 @@ SPECIALIZED_HC(64);
 #undef SPECIALIZED_HC
 /***************************************************************************
  * generalized Hamming = number of bytes that are different between
  * two codes.
  ***************************************************************************/
-inline int generalized_hamming_64 (uint64_t a) {
+inline int generalized_hamming_64(uint64_t a) {
     a |= a >> 1;
     a |= a >> 2;
     a |= a >> 4;
     a &= 0x0101010101010101UL;
-    return popcount64 (a);
+    return popcount64(a);
 }
 struct GenHammingComputer8 {
     uint64_t a0;
-    GenHammingComputer8 (const uint8_t *a, int code_size) {
-        assert (code_size == 8);
-        a0 = *(uint64_t *)a;
+    GenHammingComputer8(const uint8_t* a, int code_size) {
+        assert(code_size == 8);
+        a0 = *(uint64_t*)a;
     }
-    inline int hamming (const uint8_t *b) const {
-        return generalized_hamming_64 (*(uint64_t *)b ^ a0);
+    inline int hamming(const uint8_t* b) const {
+        return generalized_hamming_64(*(uint64_t*)b ^ a0);
     }
 };
 struct GenHammingComputer16 {
     uint64_t a0, a1;
-    GenHammingComputer16 (const uint8_t *a8, int code_size) {
-        assert (code_size == 16);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1];
+    GenHammingComputer16(const uint8_t* a8, int code_size) {
+        assert(code_size == 16);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return generalized_hamming_64 (b[0] ^ a0) +
-            generalized_hamming_64 (b[1] ^ a1);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return generalized_hamming_64(b[0] ^ a0) +
+                generalized_hamming_64(b[1] ^ a1);
     }
 };
 struct GenHammingComputer32 {
     uint64_t a0, a1, a2, a3;
-    GenHammingComputer32 (const uint8_t *a8, int code_size) {
-        assert (code_size == 32);
-        const uint64_t *a = (uint64_t *)a8;
-        a0 = a[0]; a1 = a[1]; a2 = a[2]; a3 = a[3];
+    GenHammingComputer32(const uint8_t* a8, int code_size) {
+        assert(code_size == 32);
+        const uint64_t* a = (uint64_t*)a8;
+        a0 = a[0];
+        a1 = a[1];
+        a2 = a[2];
+        a3 = a[3];
     }
-    inline int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
-        return generalized_hamming_64 (b[0] ^ a0) +
-            generalized_hamming_64 (b[1] ^ a1) +
-            generalized_hamming_64 (b[2] ^ a2) +
-            generalized_hamming_64 (b[3] ^ a3);
+    inline int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
+        return generalized_hamming_64(b[0] ^ a0) +
+                generalized_hamming_64(b[1] ^ a1) +
+                generalized_hamming_64(b[2] ^ a2) +
+                generalized_hamming_64(b[3] ^ a3);
     }
 };
 struct GenHammingComputerM8 {
-    const uint64_t *a;
+    const uint64_t* a;
     int n;
-    GenHammingComputerM8 (const uint8_t *a8, int code_size) {
-        assert (code_size % 8 == 0);
-        a =  (uint64_t *)a8;
+    GenHammingComputerM8(const uint8_t* a8, int code_size) {
+        assert(code_size % 8 == 0);
+        a = (uint64_t*)a8;
         n = code_size / 8;
     }
-    int hamming (const uint8_t *b8) const {
-        const uint64_t *b = (uint64_t *)b8;
+    int hamming(const uint8_t* b8) const {
+        const uint64_t* b = (uint64_t*)b8;
         int accu = 0;
         for (int i = 0; i < n; i++)
-            accu += generalized_hamming_64 (a[i] ^ b[i]);
+            accu += generalized_hamming_64(a[i] ^ b[i]);
         return accu;
     }
 };
 /** generalized Hamming distances (= count number of code bytes that
     are the same) */
-void generalized_hammings_knn_hc (
-        int_maxheap_array_t * ha,
-        const uint8_t * a,
-        const uint8_t * b,
+void generalized_hammings_knn_hc(
+        int_maxheap_array_t* ha,
+        const uint8_t* a,
+        const uint8_t* b,
         size_t nb,
         size_t code_size,
         int ordered = true);
 /** This class maintains a list of best distances seen so far.
  *
  * Since the distances are in a limited range (0 to nbit), the
@@ -425,46 +473,49 @@ void generalized_hammings_knn_hc (
  * in only the n-first lists, such that the sum of sizes of the
  * n lists is below k.
  */
-template<class HammingComputer>
+template <class HammingComputer>
 struct HCounterState {
-  int *counters;
-  int64_t *ids_per_dis;
-  HammingComputer hc;
-  int thres;
-  int count_lt;
-  int count_eq;
-  int k;
- HCounterState(int *counters, int64_t *ids_per_dis,
-               const uint8_t *x, int d, int k)
- : counters(counters),
-        ids_per_dis(ids_per_dis),
-        hc(x, d / 8),
-        thres(d + 1),
-        count_lt(0),
-        count_eq(0),
-        k(k) {}
-  void update_counter(const uint8_t *y, size_t j) {
-    int32_t dis = hc.hamming(y);
-    if (dis <= thres) {
-      if (dis < thres) {
-        ids_per_dis[dis * k + counters[dis]++] = j;
-        ++count_lt;
-        while (count_lt == k && thres > 0) {
-          --thres;
-          count_eq = counters[thres];
-          count_lt -= count_eq;
+    int* counters;
+    int64_t* ids_per_dis;
+    HammingComputer hc;
+    int thres;
+    int count_lt;
+    int count_eq;
+    int k;
+    HCounterState(
+            int* counters,
+            int64_t* ids_per_dis,
+            const uint8_t* x,
+            int d,
+            int k)
+            : counters(counters),
+              ids_per_dis(ids_per_dis),
+              hc(x, d / 8),
+              thres(d + 1),
+              count_lt(0),
+              count_eq(0),
+              k(k) {}
+    void update_counter(const uint8_t* y, size_t j) {
+        int32_t dis = hc.hamming(y);
+        if (dis <= thres) {
+            if (dis < thres) {
+                ids_per_dis[dis * k + counters[dis]++] = j;
+                ++count_lt;
+                while (count_lt == k && thres > 0) {
+                    --thres;
+                    count_eq = counters[thres];
+                    count_lt -= count_eq;
+                }
+            } else if (count_eq < k) {
+                ids_per_dis[dis * k + count_eq++] = j;
+                counters[dis] = count_eq;
+            }
         }
-      } else if (count_eq < k) {
-        ids_per_dis[dis * k + count_eq++] = j;
-        counters[dis] = count_eq;
-      }
     }
-  }
 };
 } // namespace faiss