RubyGems - faiss - Versions diffs - 0.2.0 → 0.2.4 - Mend

faiss 0.2.0 → 0.2.4

Files changed (215) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/LICENSE.txt +1 -1
data/README.md +7 -7
data/ext/faiss/extconf.rb +6 -3
data/ext/faiss/numo.hpp +4 -4
data/ext/faiss/utils.cpp +1 -1
data/ext/faiss/utils.h +1 -1
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +365 -194
data/vendor/faiss/faiss/Clustering.h +102 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +126 -224
data/vendor/faiss/faiss/Index2Layer.h +22 -36
data/vendor/faiss/faiss/IndexAdditiveQuantizer.cpp +407 -0
data/vendor/faiss/faiss/IndexAdditiveQuantizer.h +195 -0
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +115 -176
data/vendor/faiss/faiss/IndexFlat.h +42 -59
data/vendor/faiss/faiss/IndexFlatCodes.cpp +67 -0
data/vendor/faiss/faiss/IndexFlatCodes.h +47 -0
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +545 -453
data/vendor/faiss/faiss/IndexIVF.h +169 -118
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.cpp +316 -0
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.h +121 -0
data/vendor/faiss/faiss/IndexIVFFlat.cpp +247 -252
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +459 -517
data/vendor/faiss/faiss/IndexIVFPQ.h +75 -67
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +163 -150
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +38 -25
data/vendor/faiss/faiss/IndexLSH.cpp +66 -113
data/vendor/faiss/faiss/IndexLSH.h +20 -38
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +229 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +301 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +387 -495
data/vendor/faiss/faiss/IndexPQ.h +64 -82
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +139 -127
data/vendor/faiss/faiss/IndexRefine.h +32 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +111 -172
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -59
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +654 -475
data/vendor/faiss/faiss/VectorTransform.h +64 -89
data/vendor/faiss/faiss/clone_index.cpp +78 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +198 -171
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIcmEncoder.h +60 -0
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +503 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +175 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +606 -617
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +855 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +244 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +679 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +758 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +188 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +647 -707
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +631 -480
data/vendor/faiss/faiss/impl/index_write.cpp +547 -407
data/vendor/faiss/faiss/impl/io.cpp +76 -95
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +60 -29
data/vendor/faiss/faiss/impl/kmeans1d.cpp +301 -0
data/vendor/faiss/faiss/impl/kmeans1d.h +48 -0
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +619 -397
data/vendor/faiss/faiss/index_factory.h +8 -6
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +305 -312
data/vendor/faiss/faiss/utils/distances.h +170 -122
data/vendor/faiss/faiss/utils/distances_simd.cpp +498 -508
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +54 -49
metadata +29 -4

data/vendor/faiss/faiss/utils/partitioning.h CHANGED Viewed

@@ -7,7 +7,6 @@
 #pragma once
 #include <stdint.h>
 #include <stdio.h>
@@ -15,23 +14,27 @@
 namespace faiss {
 /** partitions the table into 0:q and q:n where all elements above q are >= all
  * elements below q (for C = CMax, for CMin comparisons are reversed)
  *
  * Returns the partition threshold. The elements q:n are destroyed on output.
  */
-template<class C>
+template <class C>
 typename C::T partition_fuzzy(
-    typename C::T *vals, typename C::TI * ids, size_t n,
-    size_t q_min, size_t q_max, size_t * q_out);
+        typename C::T* vals,
+        typename C::TI* ids,
+        size_t n,
+        size_t q_min,
+        size_t q_max,
+        size_t* q_out);
 /** simplified interface for when the parition is not fuzzy */
-template<class C>
+template <class C>
 inline typename C::T partition(
-    typename C::T *vals, typename C::TI * ids, size_t n,
-    size_t q)
-{
+        typename C::T* vals,
+        typename C::TI* ids,
+        size_t n,
+        size_t q) {
     return partition_fuzzy<C>(vals, ids, n, q, q, nullptr);
 }
@@ -41,29 +44,31 @@ inline typename C::T partition(
  * values outside the range are ignored.
  * the data table should be aligned on 32 bytes */
 void simd_histogram_8(
-    const uint16_t *data, int n,
-    uint16_t min, int shift,
-    int *hist);
+        const uint16_t* data,
+        int n,
+        uint16_t min,
+        int shift,
+        int* hist);
 /** same for 16-bin histogram */
 void simd_histogram_16(
-    const uint16_t *data, int n,
-    uint16_t min, int shift,
-    int *hist);
+        const uint16_t* data,
+        int n,
+        uint16_t min,
+        int shift,
+        int* hist);
 struct PartitionStats {
     uint64_t bissect_cycles;
     uint64_t compress_cycles;
-    PartitionStats () {reset (); }
-    void reset ();
+    PartitionStats() {
+        reset();
+    }
+    void reset();
 };
 // global var that collects them all
 FAISS_API extern PartitionStats partition_stats;
 } // namespace faiss

data/vendor/faiss/faiss/utils/quantize_lut.cpp CHANGED Viewed

@@ -5,150 +5,157 @@
  * LICENSE file in the root directory of this source tree.
  */
 #include <faiss/utils/quantize_lut.h>
+#include <algorithm>
 #include <cmath>
 #include <cstring>
 #include <vector>
-#include <algorithm>
 #include <faiss/impl/FaissAssert.h>
 namespace faiss {
 namespace quantize_lut {
 /******************************************************
  * Quantize look-up tables
  ******************************************************/
 namespace {
-float round_uint8_and_mul(float *tab, size_t n) {
+float round_uint8_and_mul(float* tab, size_t n) {
     float max = 0;
-    for(int i = 0; i < n; i++) {
-        if(fabs(tab[i]) > max) {
+    for (int i = 0; i < n; i++) {
+        if (fabs(tab[i]) > max) {
             max = fabs(tab[i]);
         }
     }
     float multiplier = 127 / max;
-    for(int i = 0; i < n; i++) {
+    for (int i = 0; i < n; i++) {
         tab[i] = floorf(tab[i] * multiplier + 128);
     }
     return multiplier;
 }
 // there can be NaNs in tables, they should be ignored
-float tab_min(const float *tab, size_t n) {
+float tab_min(const float* tab, size_t n) {
     float min = HUGE_VAL;
-    for(int i = 0; i < n; i++) {
-        if (tab[i] < min) min = tab[i];
+    for (int i = 0; i < n; i++) {
+        if (tab[i] < min)
+            min = tab[i];
     }
     return min;
 }
-float tab_max(const float *tab, size_t n) {
+float tab_max(const float* tab, size_t n) {
     float max = -HUGE_VAL;
-    for(int i = 0; i < n; i++) {
-        if (tab[i] > max) max = tab[i];
+    for (int i = 0; i < n; i++) {
+        if (tab[i] > max)
+            max = tab[i];
     }
     return max;
 }
-void round_tab(float *tab, size_t n, float a, float bi) {
-    for(int i = 0; i < n; i++) {
+void round_tab(float* tab, size_t n, float a, float bi) {
+    for (int i = 0; i < n; i++) {
         tab[i] = floorf((tab[i] - bi) * a + 0.5);
     }
 }
-template<typename T>
-void round_tab(const float *tab, size_t n, float a, float bi, T *tab_out) {
-    for(int i = 0; i < n; i++) {
+template <typename T>
+void round_tab(const float* tab, size_t n, float a, float bi, T* tab_out) {
+    for (int i = 0; i < n; i++) {
         tab_out[i] = (T)floorf((tab[i] - bi) * a + 0.5);
     }
 }
 } // anonymous namespace
 void round_uint8_per_column(
-        float *tab, size_t n, size_t d,
-        float *a_out, float *b_out)
-{
+        float* tab,
+        size_t n,
+        size_t d,
+        float* a_out,
+        float* b_out) {
     float max_span = 0;
     std::vector<float> mins(n);
-    for(int i = 0; i < n; i++) {
+    for (int i = 0; i < n; i++) {
         mins[i] = tab_min(tab + i * d, d);
         float span = tab_max(tab + i * d, d) - mins[i];
-        if(span > max_span) {
+        if (span > max_span) {
             max_span = span;
         }
     }
     float a = 255 / max_span;
     float b = 0;
-    for(int i = 0; i < n; i++) {
+    for (int i = 0; i < n; i++) {
         b += mins[i];
         round_tab(tab + i * d, d, a, mins[i]);
     }
-    if (a_out) *a_out = a;
-    if (b_out) *b_out = b;
+    if (a_out)
+        *a_out = a;
+    if (b_out)
+        *b_out = b;
 }
 void round_uint8_per_column_multi(
-        float *tab, size_t m, size_t n, size_t d,
-        float *a_out, float *b_out)
-{
+        float* tab,
+        size_t m,
+        size_t n,
+        size_t d,
+        float* a_out,
+        float* b_out) {
     float max_span = 0;
     std::vector<float> mins(n);
-    for(int i = 0; i < n; i++) {
+    for (int i = 0; i < n; i++) {
         float min_i = HUGE_VAL;
         float max_i = -HUGE_VAL;
-        for(int j = 0; j < m; j++) {
+        for (int j = 0; j < m; j++) {
             min_i = std::min(min_i, tab_min(tab + (j * n + i) * d, d));
             max_i = std::max(max_i, tab_max(tab + (j * n + i) * d, d));
         }
         mins[i] = min_i;
         float span = max_i - min_i;
-        if(span > max_span) {
+        if (span > max_span) {
             max_span = span;
         }
     }
     float a = 255 / max_span;
     float b = 0;
-    for(int i = 0; i < n; i++) {
+    for (int i = 0; i < n; i++) {
         b += mins[i];
-        for(int j = 0; j < m; j++) {
+        for (int j = 0; j < m; j++) {
             round_tab(tab + (j * n + i) * d, d, a, mins[i]);
         }
     }
-    if (a_out) *a_out = a;
-    if (b_out) *b_out = b;
+    if (a_out)
+        *a_out = a;
+    if (b_out)
+        *b_out = b;
 }
 // translation of
 // https://github.com/fairinternal/faiss_improvements/blob/7122c3cc6ddb0a371d8aa6f1309cd8bcf2335e61/LUT_quantization.ipynb
 void quantize_LUT_and_bias(
-        size_t nprobe, size_t M, size_t ksub,
+        size_t nprobe,
+        size_t M,
+        size_t ksub,
         bool lut_is_3d,
-        const float *LUT,
-        const float *bias,
-        uint8_t *LUTq, size_t M2,
-        uint16_t *biasq,
-        float *a_out, float *b_out)
-{
+        const float* LUT,
+        const float* bias,
+        uint8_t* LUTq,
+        size_t M2,
+        uint16_t* biasq,
+        float* a_out,
+        float* b_out) {
     float a, b;
     if (!bias) {
         FAISS_THROW_IF_NOT(!lut_is_3d);
         std::vector<float> mins(M);
         float max_span_LUT = -HUGE_VAL, max_span_dis = 0;
         b = 0;
-        for(int i = 0; i < M; i++) {
+        for (int i = 0; i < M; i++) {
             mins[i] = tab_min(LUT + i * ksub, ksub);
             float span = tab_max(LUT + i * ksub, ksub) - mins[i];
             max_span_LUT = std::max(max_span_LUT, span);
@@ -157,7 +164,7 @@ void quantize_LUT_and_bias(
         }
         a = std::min(255 / max_span_LUT, 65535 / max_span_dis);
-        for(int i = 0; i < M; i++) {
+        for (int i = 0; i < M; i++) {
             round_tab(LUT + i * ksub, ksub, a, mins[i], LUTq + i * ksub);
         }
         memset(LUTq + M * ksub, 0, ksub * (M2 - M));
@@ -168,7 +175,7 @@ void quantize_LUT_and_bias(
         float bias_max = tab_max(bias, nprobe);
         max_span_dis = bias_max - bias_min;
         b = 0;
-        for(int i = 0; i < M; i++) {
+        for (int i = 0; i < M; i++) {
             mins[i] = tab_min(LUT + i * ksub, ksub);
             float span = tab_max(LUT + i * ksub, ksub) - mins[i];
             max_span_LUT = std::max(max_span_LUT, span);
@@ -178,7 +185,7 @@ void quantize_LUT_and_bias(
         a = std::min(255 / max_span_LUT, 65535 / max_span_dis);
         b += bias_min;
-        for(int i = 0; i < M; i++) {
+        for (int i = 0; i < M; i++) {
             round_tab(LUT + i * ksub, ksub, a, mins[i], LUTq + i * ksub);
         }
         memset(LUTq + M * ksub, 0, ksub * (M2 - M));
@@ -196,7 +203,7 @@ void quantize_LUT_and_bias(
         for (int j = 0; j < nprobe; j++) {
             float max_span_dis_j = bias[j] - bias_min;
             float b2j = bias[j];
-            for(int i = 0; i < M; i++) {
+            for (int i = 0; i < M; i++) {
                 mins[ij] = tab_min(LUT + ij * ksub, ksub);
                 float span = tab_max(LUT + ij * ksub, ksub) - mins[ij];
                 max_span_LUT = std::max(max_span_LUT, span);
@@ -214,9 +221,11 @@ void quantize_LUT_and_bias(
         ij = 0;
         size_t ij_2 = 0;
         for (int j = 0; j < nprobe; j++) {
-            for(int i = 0; i < M; i++) {
-                round_tab(LUT + ij * ksub, ksub, a, mins[ij], LUTq + ij_2 * ksub);
-                ij++; ij_2++;
+            for (int i = 0; i < M; i++) {
+                round_tab(
+                        LUT + ij * ksub, ksub, a, mins[ij], LUTq + ij_2 * ksub);
+                ij++;
+                ij_2++;
             }
             memset(LUTq + ij_2 * ksub, 0, ksub * (M2 - M));
             ij_2 += M2 - M;
@@ -227,11 +236,11 @@ void quantize_LUT_and_bias(
     } else { // !biasq
         // then we integrate the bias into the LUTs
         std::vector<float> LUT2_storage(nprobe * M * ksub);
-        float *LUT2 = LUT2_storage.data();
+        float* LUT2 = LUT2_storage.data();
         size_t ijc = 0;
         for (int j = 0; j < nprobe; j++) {
             float bias_j = bias[j] / M;
-            for(int i = 0; i < M; i++) {
+            for (int i = 0; i < M; i++) {
                 for (int c = 0; c < ksub; c++) {
                     LUT2[ijc] = LUT[ijc] + bias_j;
                     ijc++;
@@ -241,7 +250,7 @@ void quantize_LUT_and_bias(
         std::vector<float> mins(M, HUGE_VAL), maxs(M, -HUGE_VAL);
         size_t ij = 0;
         for (int j = 0; j < nprobe; j++) {
-            for(int i = 0; i < M; i++) {
+            for (int i = 0; i < M; i++) {
                 mins[i] = std::min(mins[i], tab_min(LUT2 + ij * ksub, ksub));
                 maxs[i] = std::max(maxs[i], tab_max(LUT2 + ij * ksub, ksub));
                 ij++;
@@ -250,7 +259,7 @@ void quantize_LUT_and_bias(
         float max_span = -HUGE_VAL;
         b = 0;
-        for(int i = 0; i < M; i++) {
+        for (int i = 0; i < M; i++) {
             float span = maxs[i] - mins[i];
             max_span = std::max(max_span, span);
             b += mins[i];
@@ -259,19 +268,22 @@ void quantize_LUT_and_bias(
         ij = 0;
         size_t ij_2 = 0;
         for (int j = 0; j < nprobe; j++) {
-            for(int i = 0; i < M; i++) {
-                round_tab(LUT2 + ij * ksub, ksub, a, mins[i], LUTq + ij_2 * ksub);
-                ij++; ij_2++;
+            for (int i = 0; i < M; i++) {
+                round_tab(
+                        LUT2 + ij * ksub, ksub, a, mins[i], LUTq + ij_2 * ksub);
+                ij++;
+                ij_2++;
             }
             memset(LUTq + ij_2 * ksub, 0, ksub * (M2 - M));
             ij_2 += M2 - M;
         }
     }
-    if (a_out) *a_out = a;
-    if (b_out) *b_out = b;
+    if (a_out)
+        *a_out = a;
+    if (b_out)
+        *b_out = b;
 }
 } // namespace quantize_lut
 } // namespace faiss

data/vendor/faiss/faiss/utils/quantize_lut.h CHANGED Viewed

@@ -5,12 +5,10 @@
  * LICENSE file in the root directory of this source tree.
  */
 #pragma once
-#include <cstdio>
 #include <cstdint>
+#include <cstdio>
 namespace faiss {
@@ -32,19 +30,23 @@ namespace quantize_lut {
  * @param tab input/output, size (n, d)
  */
 void round_uint8_per_column(
-        float *tab, size_t n, size_t d,
-        float *a_out = nullptr,
-        float *b_out = nullptr
-);
+        float* tab,
+        size_t n,
+        size_t d,
+        float* a_out = nullptr,
+        float* b_out = nullptr);
 /* affine quantizer, a and b are the affine coefficients
  *
  * @param tab input/output, size (m, n, d)
  */
 void round_uint8_per_column_multi(
-        float *tab, size_t m, size_t n, size_t d,
-        float *a_out = nullptr, float *b_out = nullptr);
+        float* tab,
+        size_t m,
+        size_t n,
+        size_t d,
+        float* a_out = nullptr,
+        float* b_out = nullptr);
 /** LUT quantization to uint8 and bias to uint16.
  *
@@ -63,18 +65,18 @@ void round_uint8_per_column_multi(
  */
 void quantize_LUT_and_bias(
-        size_t nprobe, size_t M, size_t ksub,
+        size_t nprobe,
+        size_t M,
+        size_t ksub,
         bool lut_is_3d,
-        const float *LUT,
-        const float *bias,
-        uint8_t *LUTq, size_t M2,
-        uint16_t *biasq,
-        float *a_out = nullptr, float *b_out = nullptr
-);
+        const float* LUT,
+        const float* bias,
+        uint8_t* LUTq,
+        size_t M2,
+        uint16_t* biasq,
+        float* a_out = nullptr,
+        float* b_out = nullptr);
 } // namespace quantize_lut
 } // namespace faiss

data/vendor/faiss/faiss/utils/random.cpp CHANGED Viewed

@@ -15,79 +15,67 @@ namespace faiss {
  * Random data generation functions
  **************************************************/
-RandomGenerator::RandomGenerator (int64_t seed)
-    : mt((unsigned int)seed) {}
+RandomGenerator::RandomGenerator(int64_t seed) : mt((unsigned int)seed) {}
-int RandomGenerator::rand_int ()
-{
+int RandomGenerator::rand_int() {
     return mt() & 0x7fffffff;
 }
-int64_t RandomGenerator::rand_int64 ()
-{
+int64_t RandomGenerator::rand_int64() {
     return int64_t(rand_int()) | int64_t(rand_int()) << 31;
 }
-int RandomGenerator::rand_int (int max)
-{
+int RandomGenerator::rand_int(int max) {
     return mt() % max;
 }
-float RandomGenerator::rand_float ()
-{
+float RandomGenerator::rand_float() {
     return mt() / float(mt.max());
 }
-double RandomGenerator::rand_double ()
-{
+double RandomGenerator::rand_double() {
     return mt() / double(mt.max());
 }
 /***********************************************************************
  * Random functions in this C file only exist because Torch
  *  counterparts are slow and not multi-threaded.  Typical use is for
  *  more than 1-100 billion values. */
 /* Generate a set of random floating point values such that x[i] in [0,1]
    multi-threading. For this reason, we rely on re-entreant functions.  */
-void float_rand (float * x, size_t n, int64_t seed)
-{
+void float_rand(float* x, size_t n, int64_t seed) {
     // only try to parallelize on large enough arrays
     const size_t nblock = n < 1024 ? 1 : 1024;
-    RandomGenerator rng0 (seed);
-    int a0 = rng0.rand_int (), b0 = rng0.rand_int ();
+    RandomGenerator rng0(seed);
+    int a0 = rng0.rand_int(), b0 = rng0.rand_int();
 #pragma omp parallel for
     for (int64_t j = 0; j < nblock; j++) {
-        RandomGenerator rng (a0 + j * b0);
+        RandomGenerator rng(a0 + j * b0);
         const size_t istart = j * n / nblock;
         const size_t iend = (j + 1) * n / nblock;
         for (size_t i = istart; i < iend; i++)
-            x[i] = rng.rand_float ();
+            x[i] = rng.rand_float();
     }
 }
-void float_randn (float * x, size_t n, int64_t seed)
-{
+void float_randn(float* x, size_t n, int64_t seed) {
     // only try to parallelize on large enough arrays
     const size_t nblock = n < 1024 ? 1 : 1024;
-    RandomGenerator rng0 (seed);
-    int a0 = rng0.rand_int (), b0 = rng0.rand_int ();
+    RandomGenerator rng0(seed);
+    int a0 = rng0.rand_int(), b0 = rng0.rand_int();
 #pragma omp parallel for
     for (int64_t j = 0; j < nblock; j++) {
-        RandomGenerator rng (a0 + j * b0);
+        RandomGenerator rng(a0 + j * b0);
         double a = 0, b = 0, s = 0;
-        int state = 0;  /* generate two number per "do-while" loop */
+        int state = 0; /* generate two number per "do-while" loop */
         const size_t istart = j * n / nblock;
         const size_t iend = (j + 1) * n / nblock;
@@ -96,96 +84,84 @@ void float_randn (float * x, size_t n, int64_t seed)
             /* Marsaglia's method (see Knuth) */
             if (state == 0) {
                 do {
-                    a = 2.0 * rng.rand_double () - 1;
-                    b = 2.0 * rng.rand_double () - 1;
+                    a = 2.0 * rng.rand_double() - 1;
+                    b = 2.0 * rng.rand_double() - 1;
                     s = a * a + b * b;
                 } while (s >= 1.0);
                 x[i] = a * sqrt(-2.0 * log(s) / s);
-            }
-            else
+            } else
                 x[i] = b * sqrt(-2.0 * log(s) / s);
             state = 1 - state;
         }
     }
 }
 /* Integer versions */
-void int64_rand (int64_t * x, size_t n, int64_t seed)
-{
+void int64_rand(int64_t* x, size_t n, int64_t seed) {
     // only try to parallelize on large enough arrays
     const size_t nblock = n < 1024 ? 1 : 1024;
-    RandomGenerator rng0 (seed);
-    int a0 = rng0.rand_int (), b0 = rng0.rand_int ();
+    RandomGenerator rng0(seed);
+    int a0 = rng0.rand_int(), b0 = rng0.rand_int();
 #pragma omp parallel for
     for (int64_t j = 0; j < nblock; j++) {
-        RandomGenerator rng (a0 + j * b0);
+        RandomGenerator rng(a0 + j * b0);
         const size_t istart = j * n / nblock;
         const size_t iend = (j + 1) * n / nblock;
         for (size_t i = istart; i < iend; i++)
-            x[i] = rng.rand_int64 ();
+            x[i] = rng.rand_int64();
     }
 }
-void int64_rand_max (int64_t * x, size_t n, uint64_t max, int64_t seed)
-{
+void int64_rand_max(int64_t* x, size_t n, uint64_t max, int64_t seed) {
     // only try to parallelize on large enough arrays
     const size_t nblock = n < 1024 ? 1 : 1024;
-    RandomGenerator rng0 (seed);
-    int a0 = rng0.rand_int (), b0 = rng0.rand_int ();
+    RandomGenerator rng0(seed);
+    int a0 = rng0.rand_int(), b0 = rng0.rand_int();
 #pragma omp parallel for
     for (int64_t j = 0; j < nblock; j++) {
-        RandomGenerator rng (a0 + j * b0);
+        RandomGenerator rng(a0 + j * b0);
         const size_t istart = j * n / nblock;
         const size_t iend = (j + 1) * n / nblock;
         for (size_t i = istart; i < iend; i++)
-            x[i] = rng.rand_int64 () % max;
+            x[i] = rng.rand_int64() % max;
     }
 }
+void rand_perm(int* perm, size_t n, int64_t seed) {
+    for (size_t i = 0; i < n; i++)
+        perm[i] = i;
-void rand_perm (int *perm, size_t n, int64_t seed)
-{
-    for (size_t i = 0; i < n; i++) perm[i] = i;
-    RandomGenerator rng (seed);
+    RandomGenerator rng(seed);
     for (size_t i = 0; i + 1 < n; i++) {
-        int i2 = i + rng.rand_int (n - i);
+        int i2 = i + rng.rand_int(n - i);
         std::swap(perm[i], perm[i2]);
     }
 }
-void byte_rand (uint8_t * x, size_t n, int64_t seed)
-{
+void byte_rand(uint8_t* x, size_t n, int64_t seed) {
     // only try to parallelize on large enough arrays
     const size_t nblock = n < 1024 ? 1 : 1024;
-    RandomGenerator rng0 (seed);
-    int a0 = rng0.rand_int (), b0 = rng0.rand_int ();
+    RandomGenerator rng0(seed);
+    int a0 = rng0.rand_int(), b0 = rng0.rand_int();
 #pragma omp parallel for
     for (int64_t j = 0; j < nblock; j++) {
-        RandomGenerator rng (a0 + j * b0);
+        RandomGenerator rng(a0 + j * b0);
         const size_t istart = j * n / nblock;
         const size_t iend = (j + 1) * n / nblock;
         size_t i;
         for (i = istart; i < iend; i++)
-            x[i] = rng.rand_int64 ();
+            x[i] = rng.rand_int64();
     }
 }