RubyGems - faiss - Versions diffs - 0.2.0 → 0.2.4 - Mend

faiss 0.2.0 → 0.2.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (215) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/LICENSE.txt +1 -1
data/README.md +7 -7
data/ext/faiss/extconf.rb +6 -3
data/ext/faiss/numo.hpp +4 -4
data/ext/faiss/utils.cpp +1 -1
data/ext/faiss/utils.h +1 -1
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +365 -194
data/vendor/faiss/faiss/Clustering.h +102 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +126 -224
data/vendor/faiss/faiss/Index2Layer.h +22 -36
data/vendor/faiss/faiss/IndexAdditiveQuantizer.cpp +407 -0
data/vendor/faiss/faiss/IndexAdditiveQuantizer.h +195 -0
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +115 -176
data/vendor/faiss/faiss/IndexFlat.h +42 -59
data/vendor/faiss/faiss/IndexFlatCodes.cpp +67 -0
data/vendor/faiss/faiss/IndexFlatCodes.h +47 -0
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +545 -453
data/vendor/faiss/faiss/IndexIVF.h +169 -118
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.cpp +316 -0
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.h +121 -0
data/vendor/faiss/faiss/IndexIVFFlat.cpp +247 -252
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +459 -517
data/vendor/faiss/faiss/IndexIVFPQ.h +75 -67
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +163 -150
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +38 -25
data/vendor/faiss/faiss/IndexLSH.cpp +66 -113
data/vendor/faiss/faiss/IndexLSH.h +20 -38
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +229 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +301 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +387 -495
data/vendor/faiss/faiss/IndexPQ.h +64 -82
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +139 -127
data/vendor/faiss/faiss/IndexRefine.h +32 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +111 -172
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -59
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +654 -475
data/vendor/faiss/faiss/VectorTransform.h +64 -89
data/vendor/faiss/faiss/clone_index.cpp +78 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +198 -171
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIcmEncoder.h +60 -0
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +503 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +175 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +606 -617
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +855 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +244 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +679 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +758 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +188 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +647 -707
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +631 -480
data/vendor/faiss/faiss/impl/index_write.cpp +547 -407
data/vendor/faiss/faiss/impl/io.cpp +76 -95
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +60 -29
data/vendor/faiss/faiss/impl/kmeans1d.cpp +301 -0
data/vendor/faiss/faiss/impl/kmeans1d.h +48 -0
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +619 -397
data/vendor/faiss/faiss/index_factory.h +8 -6
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +305 -312
data/vendor/faiss/faiss/utils/distances.h +170 -122
data/vendor/faiss/faiss/utils/distances_simd.cpp +498 -508
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +54 -49
metadata +29 -4

data/vendor/faiss/faiss/impl/AdditiveQuantizer.h ADDED Viewed

@@ -0,0 +1,175 @@
+/**
+ * Copyright (c) Facebook, Inc. and its affiliates.
+ *
+ * This source code is licensed under the MIT license found in the
+ * LICENSE file in the root directory of this source tree.
+ */
+#pragma once
+#include <cstdint>
+#include <vector>
+#include <faiss/Index.h>
+#include <faiss/IndexFlat.h>
+namespace faiss {
+/** Abstract structure for additive quantizers
+ *
+ * Different from the product quantizer in which the decoded vector is the
+ * concatenation of M sub-vectors, additive quantizers sum M sub-vectors
+ * to get the decoded vector.
+ */
+struct AdditiveQuantizer {
+    size_t d;                     ///< size of the input vectors
+    size_t M;                     ///< number of codebooks
+    std::vector<size_t> nbits;    ///< bits for each step
+    std::vector<float> codebooks; ///< codebooks
+    // derived values
+    std::vector<uint64_t> codebook_offsets;
+    size_t code_size;           ///< code size in bytes
+    size_t tot_bits;            ///< total number of bits
+    size_t total_codebook_size; ///< size of the codebook in vectors
+    bool only_8bit;             ///< are all nbits = 8 (use faster decoder)
+    bool verbose;    ///< verbose during training?
+    bool is_trained; ///< is trained or not
+    IndexFlat1D qnorm; ///< store and search norms
+    uint32_t encode_qcint(
+            float x) const; ///< encode norm by non-uniform scalar quantization
+    float decode_qcint(uint32_t c)
+            const; ///< decode norm by non-uniform scalar quantization
+    /// Encodes how search is performed and how vectors are encoded
+    enum Search_type_t {
+        ST_decompress,    ///< decompress database vector
+        ST_LUT_nonorm,    ///< use a LUT, don't include norms (OK for IP or
+                          ///< normalized vectors)
+        ST_norm_from_LUT, ///< compute the norms from the look-up tables (cost
+                          ///< is in O(M^2))
+        ST_norm_float, ///< use a LUT, and store float32 norm with the vectors
+        ST_norm_qint8, ///< use a LUT, and store 8bit-quantized norm
+        ST_norm_qint4,
+        ST_norm_cqint8, ///< use a LUT, and store non-uniform quantized norm
+        ST_norm_cqint4,
+    };
+    AdditiveQuantizer(
+            size_t d,
+            const std::vector<size_t>& nbits,
+            Search_type_t search_type = ST_decompress);
+    AdditiveQuantizer();
+    ///< compute derived values when d, M and nbits have been set
+    void set_derived_values();
+    ///< Train the additive quantizer
+    virtual void train(size_t n, const float* x) = 0;
+    /** Encode a set of vectors
+     *
+     * @param x      vectors to encode, size n * d
+     * @param codes  output codes, size n * code_size
+     */
+    virtual void compute_codes(const float* x, uint8_t* codes, size_t n)
+            const = 0;
+    /** pack a series of code to bit-compact format
+     *
+     * @param codes        codes to be packed, size n * code_size
+     * @param packed_codes output bit-compact codes
+     * @param ld_codes     leading dimension of codes
+     * @param norms        norms of the vectors (size n). Will be computed if
+     *                     needed but not provided
+     */
+    void pack_codes(
+            size_t n,
+            const int32_t* codes,
+            uint8_t* packed_codes,
+            int64_t ld_codes = -1,
+            const float* norms = nullptr) const;
+    /** Decode a set of vectors
+     *
+     * @param codes  codes to decode, size n * code_size
+     * @param x      output vectors, size n * d
+     */
+    void decode(const uint8_t* codes, float* x, size_t n) const;
+    /** Decode a set of vectors in non-packed format
+     *
+     * @param codes  codes to decode, size n * ld_codes
+     * @param x      output vectors, size n * d
+     */
+    void decode_unpacked(
+            const int32_t* codes,
+            float* x,
+            size_t n,
+            int64_t ld_codes = -1) const;
+    /****************************************************************************
+     * Search functions in an external set of codes.
+     ****************************************************************************/
+    /// Also determines what's in the codes
+    Search_type_t search_type;
+    /// min/max for quantization of norms
+    float norm_min, norm_max;
+    template <bool is_IP, Search_type_t effective_search_type>
+    float compute_1_distance_LUT(const uint8_t* codes, const float* LUT) const;
+    /*
+        float compute_1_L2sqr(const uint8_t* codes, const float* LUT);
+    */
+    /****************************************************************************
+     * Support for exhaustive distance computations with all the centroids.
+     * Hence, the number of these centroids should not be too large.
+     ****************************************************************************/
+    using idx_t = Index::idx_t;
+    /// decoding function for a code in a 64-bit word
+    void decode_64bit(idx_t n, float* x) const;
+    /** Compute inner-product look-up tables. Used in the centroid search
+     * functions.
+     *
+     * @param xq     query vector, size (n, d)
+     * @param LUT    look-up table, size (n, total_codebook_size)
+     */
+    void compute_LUT(size_t n, const float* xq, float* LUT) const;
+    /// exact IP search
+    void knn_centroids_inner_product(
+            idx_t n,
+            const float* xq,
+            idx_t k,
+            float* distances,
+            idx_t* labels) const;
+    /** For L2 search we need the L2 norms of the centroids
+     *
+     * @param norms    output norms table, size total_codebook_size
+     */
+    void compute_centroid_norms(float* norms) const;
+    /** Exact L2 search, with precomputed norms */
+    void knn_centroids_L2(
+            idx_t n,
+            const float* xq,
+            idx_t k,
+            float* distances,
+            idx_t* labels,
+            const float* centroid_norms) const;
+    virtual ~AdditiveQuantizer();
+};
+}; // namespace faiss

data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp CHANGED Viewed

@@ -14,18 +14,16 @@
 #include <faiss/impl/FaissAssert.h>
 namespace faiss {
 /***********************************************************************
  * RangeSearchResult
  ***********************************************************************/
-RangeSearchResult::RangeSearchResult (idx_t nq, bool alloc_lims): nq (nq) {
+RangeSearchResult::RangeSearchResult(idx_t nq, bool alloc_lims) : nq(nq) {
     if (alloc_lims) {
-        lims = new size_t [nq + 1];
-        memset (lims, 0, sizeof(*lims) * (nq + 1));
+        lims = new size_t[nq + 1];
+        memset(lims, 0, sizeof(*lims) * (nq + 1));
     } else {
         lims = nullptr;
     }
@@ -36,145 +34,129 @@ RangeSearchResult::RangeSearchResult (idx_t nq, bool alloc_lims): nq (nq) {
 /// called when lims contains the nb of elements result entries
 /// for each query
-void RangeSearchResult::do_allocation () {
+void RangeSearchResult::do_allocation() {
+    // works only if all the partial results are aggregated
+    // simulatenously
+    FAISS_THROW_IF_NOT(labels == nullptr && distances == nullptr);
     size_t ofs = 0;
     for (int i = 0; i < nq; i++) {
         size_t n = lims[i];
-        lims [i] = ofs;
+        lims[i] = ofs;
         ofs += n;
     }
-    lims [nq] = ofs;
-    labels = new idx_t [ofs];
-    distances = new float [ofs];
+    lims[nq] = ofs;
+    labels = new idx_t[ofs];
+    distances = new float[ofs];
 }
-RangeSearchResult::~RangeSearchResult () {
-    delete [] labels;
-    delete [] distances;
-    delete [] lims;
+RangeSearchResult::~RangeSearchResult() {
+    delete[] labels;
+    delete[] distances;
+    delete[] lims;
 }
 /***********************************************************************
  * BufferList
  ***********************************************************************/
-BufferList::BufferList (size_t buffer_size):
-    buffer_size (buffer_size)
-{
+BufferList::BufferList(size_t buffer_size) : buffer_size(buffer_size) {
     wp = buffer_size;
 }
-BufferList::~BufferList ()
-{
+BufferList::~BufferList() {
     for (int i = 0; i < buffers.size(); i++) {
-        delete [] buffers[i].ids;
-        delete [] buffers[i].dis;
+        delete[] buffers[i].ids;
+        delete[] buffers[i].dis;
     }
 }
-void BufferList::add (idx_t id, float dis) {
+void BufferList::add(idx_t id, float dis) {
     if (wp == buffer_size) { // need new buffer
         append_buffer();
     }
-    Buffer & buf = buffers.back();
-    buf.ids [wp] = id;
-    buf.dis [wp] = dis;
+    Buffer& buf = buffers.back();
+    buf.ids[wp] = id;
+    buf.dis[wp] = dis;
     wp++;
 }
-void BufferList::append_buffer ()
-{
-    Buffer buf = {new idx_t [buffer_size], new float [buffer_size]};
-    buffers.push_back (buf);
+void BufferList::append_buffer() {
+    Buffer buf = {new idx_t[buffer_size], new float[buffer_size]};
+    buffers.push_back(buf);
     wp = 0;
 }
 /// copy elemnts ofs:ofs+n-1 seen as linear data in the buffers to
 /// tables dest_ids, dest_dis
-void BufferList::copy_range (size_t ofs, size_t n,
-                             idx_t * dest_ids, float *dest_dis)
-{
+void BufferList::copy_range(
+        size_t ofs,
+        size_t n,
+        idx_t* dest_ids,
+        float* dest_dis) {
     size_t bno = ofs / buffer_size;
     ofs -= bno * buffer_size;
     while (n > 0) {
         size_t ncopy = ofs + n < buffer_size ? n : buffer_size - ofs;
-        Buffer buf = buffers [bno];
-        memcpy (dest_ids, buf.ids + ofs, ncopy * sizeof(*dest_ids));
-        memcpy (dest_dis, buf.dis + ofs, ncopy * sizeof(*dest_dis));
+        Buffer buf = buffers[bno];
+        memcpy(dest_ids, buf.ids + ofs, ncopy * sizeof(*dest_ids));
+        memcpy(dest_dis, buf.dis + ofs, ncopy * sizeof(*dest_dis));
         dest_ids += ncopy;
         dest_dis += ncopy;
         ofs = 0;
-        bno ++;
+        bno++;
         n -= ncopy;
     }
 }
 /***********************************************************************
  * RangeSearchPartialResult
  ***********************************************************************/
-void RangeQueryResult::add (float dis, idx_t id) {
+void RangeQueryResult::add(float dis, idx_t id) {
     nres++;
-    pres->add (id, dis);
+    pres->add(id, dis);
 }
-RangeSearchPartialResult::RangeSearchPartialResult (RangeSearchResult * res_in):
-    BufferList(res_in->buffer_size),
-    res(res_in)
-{}
+RangeSearchPartialResult::RangeSearchPartialResult(RangeSearchResult* res_in)
+        : BufferList(res_in->buffer_size), res(res_in) {}
 /// begin a new result
-RangeQueryResult &
-    RangeSearchPartialResult::new_result (idx_t qno)
-{
+RangeQueryResult& RangeSearchPartialResult::new_result(idx_t qno) {
     RangeQueryResult qres = {qno, 0, this};
-    queries.push_back (qres);
+    queries.push_back(qres);
     return queries.back();
 }
-void RangeSearchPartialResult::finalize ()
-{
-    set_lims ();
+void RangeSearchPartialResult::finalize() {
+    set_lims();
 #pragma omp barrier
 #pragma omp single
-    res->do_allocation ();
+    res->do_allocation();
 #pragma omp barrier
-    copy_result ();
+    copy_result();
 }
 /// called by range_search before do_allocation
-void RangeSearchPartialResult::set_lims ()
-{
+void RangeSearchPartialResult::set_lims() {
     for (int i = 0; i < queries.size(); i++) {
-        RangeQueryResult & qres = queries[i];
+        RangeQueryResult& qres = queries[i];
         res->lims[qres.qno] = qres.nres;
     }
 }
 /// called by range_search after do_allocation
-void RangeSearchPartialResult::copy_result (bool incremental)
-{
+void RangeSearchPartialResult::copy_result(bool incremental) {
     size_t ofs = 0;
     for (int i = 0; i < queries.size(); i++) {
-        RangeQueryResult & qres = queries[i];
+        RangeQueryResult& qres = queries[i];
-        copy_range (ofs, qres.nres,
-                    res->labels + res->lims[qres.qno],
-                    res->distances + res->lims[qres.qno]);
+        copy_range(
+                ofs,
+                qres.nres,
+                res->labels + res->lims[qres.qno],
+                res->distances + res->lims[qres.qno]);
         if (incremental) {
             res->lims[qres.qno] += qres.nres;
         }
@@ -182,26 +164,28 @@ void RangeSearchPartialResult::copy_result (bool incremental)
     }
 }
-void RangeSearchPartialResult::merge (std::vector <RangeSearchPartialResult *> &
-                                      partial_results, bool do_delete)
-{
+void RangeSearchPartialResult::merge(
+        std::vector<RangeSearchPartialResult*>& partial_results,
+        bool do_delete) {
     int npres = partial_results.size();
-    if (npres == 0) return;
-    RangeSearchResult *result = partial_results[0]->res;
+    if (npres == 0)
+        return;
+    RangeSearchResult* result = partial_results[0]->res;
     size_t nx = result->nq;
     // count
-    for (const RangeSearchPartialResult * pres : partial_results) {
-        if (!pres) continue;
-        for (const RangeQueryResult &qres : pres->queries) {
+    for (const RangeSearchPartialResult* pres : partial_results) {
+        if (!pres)
+            continue;
+        for (const RangeQueryResult& qres : pres->queries) {
             result->lims[qres.qno] += qres.nres;
         }
     }
-    result->do_allocation ();
+    result->do_allocation();
     for (int j = 0; j < npres; j++) {
-        if (!partial_results[j]) continue;
-        partial_results[j]->copy_result (true);
+        if (!partial_results[j])
+            continue;
+        partial_results[j]->copy_result(true);
         if (do_delete) {
             delete partial_results[j];
             partial_results[j] = nullptr;
@@ -210,22 +194,19 @@ void RangeSearchPartialResult::merge (std::vector <RangeSearchPartialResult *> &
     // reset the limits
     for (size_t i = nx; i > 0; i--) {
-        result->lims [i] = result->lims [i - 1];
+        result->lims[i] = result->lims[i - 1];
     }
-    result->lims [0] = 0;
+    result->lims[0] = 0;
 }
 /***********************************************************************
  * IDSelectorRange
  ***********************************************************************/
-IDSelectorRange::IDSelectorRange (idx_t imin, idx_t imax):
-    imin (imin), imax (imax)
-{
-}
+IDSelectorRange::IDSelectorRange(idx_t imin, idx_t imax)
+        : imin(imin), imax(imax) {}
-bool IDSelectorRange::is_member (idx_t id) const
-{
+bool IDSelectorRange::is_member(idx_t id) const {
     return id >= imin && id < imax;
 }
@@ -233,33 +214,29 @@ bool IDSelectorRange::is_member (idx_t id) const
  * IDSelectorArray
  ***********************************************************************/
-IDSelectorArray::IDSelectorArray (size_t n, const idx_t *ids):
-   n (n), ids(ids)
-{
-}
+IDSelectorArray::IDSelectorArray(size_t n, const idx_t* ids) : n(n), ids(ids) {}
-bool IDSelectorArray::is_member (idx_t id) const
-{
+bool IDSelectorArray::is_member(idx_t id) const {
     for (idx_t i = 0; i < n; i++) {
-        if (ids[i] == id) return true;
+        if (ids[i] == id)
+            return true;
     }
     return false;
 }
 /***********************************************************************
  * IDSelectorBatch
  ***********************************************************************/
-IDSelectorBatch::IDSelectorBatch (size_t n, const idx_t *indices)
-{
+IDSelectorBatch::IDSelectorBatch(size_t n, const idx_t* indices) {
     nbits = 0;
-    while (n > (1L << nbits)) nbits++;
+    while (n > (1L << nbits))
+        nbits++;
     nbits += 5;
     // for n = 1M, nbits = 25 is optimal, see P56659518
     mask = (1L << nbits) - 1;
-    bloom.resize (1UL << (nbits - 3), 0);
+    bloom.resize(1UL << (nbits - 3), 0);
     for (long i = 0; i < n; i++) {
         Index::idx_t id = indices[i];
         set.insert(id);
@@ -268,39 +245,36 @@ IDSelectorBatch::IDSelectorBatch (size_t n, const idx_t *indices)
     }
 }
-bool IDSelectorBatch::is_member (idx_t i) const
-{
+bool IDSelectorBatch::is_member(idx_t i) const {
     long im = i & mask;
-    if(!(bloom[im>>3] & (1 << (im & 7)))) {
+    if (!(bloom[im >> 3] & (1 << (im & 7)))) {
         return 0;
     }
     return set.count(i);
 }
 /***********************************************************
  * Interrupt callback
  ***********************************************************/
 std::unique_ptr<InterruptCallback> InterruptCallback::instance;
 std::mutex InterruptCallback::lock;
-void InterruptCallback::clear_instance () {
-    delete instance.release ();
+void InterruptCallback::clear_instance() {
+    delete instance.release();
 }
-void InterruptCallback::check () {
+void InterruptCallback::check() {
     if (!instance.get()) {
         return;
     }
-    if (instance->want_interrupt ()) {
-        FAISS_THROW_MSG ("computation interrupted");
+    if (instance->want_interrupt()) {
+        FAISS_THROW_MSG("computation interrupted");
     }
 }
-bool InterruptCallback::is_interrupted () {
+bool InterruptCallback::is_interrupted() {
     if (!instance.get()) {
         return false;
     }
@@ -308,8 +282,7 @@ bool InterruptCallback::is_interrupted () {
     return instance->want_interrupt();
 }
-size_t InterruptCallback::get_period_hint (size_t flops) {
+size_t InterruptCallback::get_period_hint(size_t flops) {
     if (!instance.get()) {
         return 1L << 30; // never check
     }
@@ -317,7 +290,4 @@ size_t InterruptCallback::get_period_hint (size_t flops) {
     return std::max((size_t)10 * 10 * 1000 * 1000 / (flops + 1), (size_t)1);
 }
 } // namespace faiss