RubyGems - faiss - Versions diffs - 0.1.7 → 0.2.3 - Mend

faiss 0.1.7 → 0.2.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +18 -0
data/README.md +7 -7
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +8 -2
data/ext/faiss/index.cpp +102 -69
data/ext/faiss/index_binary.cpp +24 -30
data/ext/faiss/kmeans.cpp +20 -16
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +13 -14
data/ext/faiss/product_quantizer.cpp +23 -24
data/ext/faiss/utils.cpp +10 -37
data/ext/faiss/utils.h +2 -13
data/lib/faiss/version.rb +1 -1
data/lib/faiss.rb +0 -5
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +26 -12
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/IndexLSH.cpp CHANGED Viewed

@@ -14,10 +14,9 @@
 #include <algorithm>
-#include <faiss/utils/utils.h>
-#include <faiss/utils/hamming.h>
 #include <faiss/impl/FaissAssert.h>
+#include <faiss/utils/hamming.h>
+#include <faiss/utils/utils.h>
 namespace faiss {
@@ -25,11 +24,12 @@ namespace faiss {
  * IndexLSH
  ***************************************************************/
-IndexLSH::IndexLSH (idx_t d, int nbits, bool rotate_data, bool train_thresholds):
-    Index(d), nbits(nbits), rotate_data(rotate_data),
-    train_thresholds (train_thresholds), rrot(d, nbits)
-{
+IndexLSH::IndexLSH(idx_t d, int nbits, bool rotate_data, bool train_thresholds)
+        : Index(d),
+          nbits(nbits),
+          rotate_data(rotate_data),
+          train_thresholds(train_thresholds),
+          rrot(d, nbits) {
     is_trained = !train_thresholds;
     bytes_per_vec = (nbits + 7) / 8;
@@ -37,131 +37,119 @@ IndexLSH::IndexLSH (idx_t d, int nbits, bool rotate_data, bool train_thresholds)
     if (rotate_data) {
         rrot.init(5);
     } else {
-        FAISS_THROW_IF_NOT (d >= nbits);
+        FAISS_THROW_IF_NOT(d >= nbits);
     }
 }
-IndexLSH::IndexLSH ():
-    nbits (0), bytes_per_vec(0), rotate_data (false), train_thresholds (false)
-{
-}
+IndexLSH::IndexLSH()
+        : nbits(0),
+          bytes_per_vec(0),
+          rotate_data(false),
+          train_thresholds(false) {}
-const float * IndexLSH::apply_preprocess (idx_t n, const float *x) const
-{
-    float *xt = nullptr;
+const float* IndexLSH::apply_preprocess(idx_t n, const float* x) const {
+    float* xt = nullptr;
     if (rotate_data) {
         // also applies bias if exists
-        xt = rrot.apply (n, x);
+        xt = rrot.apply(n, x);
     } else if (d != nbits) {
-        assert (nbits < d);
-        xt = new float [nbits * n];
-        float *xp = xt;
+        assert(nbits < d);
+        xt = new float[nbits * n];
+        float* xp = xt;
         for (idx_t i = 0; i < n; i++) {
-            const float *xl = x + i * d;
+            const float* xl = x + i * d;
             for (int j = 0; j < nbits; j++)
-                *xp++ = xl [j];
+                *xp++ = xl[j];
         }
     }
     if (train_thresholds) {
         if (xt == NULL) {
-            xt = new float [nbits * n];
-            memcpy (xt, x, sizeof(*x) * n * nbits);
+            xt = new float[nbits * n];
+            memcpy(xt, x, sizeof(*x) * n * nbits);
         }
-        float *xp = xt;
+        float* xp = xt;
         for (idx_t i = 0; i < n; i++)
             for (int j = 0; j < nbits; j++)
-                *xp++ -= thresholds [j];
+                *xp++ -= thresholds[j];
     }
     return xt ? xt : x;
 }
-void IndexLSH::train (idx_t n, const float *x)
-{
+void IndexLSH::train(idx_t n, const float* x) {
     if (train_thresholds) {
-        thresholds.resize (nbits);
+        thresholds.resize(nbits);
         train_thresholds = false;
-        const float *xt = apply_preprocess (n, x);
-        ScopeDeleter<float> del (xt == x ? nullptr : xt);
+        const float* xt = apply_preprocess(n, x);
+        ScopeDeleter<float> del(xt == x ? nullptr : xt);
         train_thresholds = true;
-        float * transposed_x = new float [n * nbits];
-        ScopeDeleter<float> del2 (transposed_x);
+        float* transposed_x = new float[n * nbits];
+        ScopeDeleter<float> del2(transposed_x);
         for (idx_t i = 0; i < n; i++)
             for (idx_t j = 0; j < nbits; j++)
-                transposed_x [j * n + i] = xt [i * nbits + j];
+                transposed_x[j * n + i] = xt[i * nbits + j];
         for (idx_t i = 0; i < nbits; i++) {
-            float *xi = transposed_x + i * n;
+            float* xi = transposed_x + i * n;
             // std::nth_element
-            std::sort (xi, xi + n);
+            std::sort(xi, xi + n);
             if (n % 2 == 1)
-                thresholds [i] = xi [n / 2];
+                thresholds[i] = xi[n / 2];
             else
-                thresholds [i] = (xi [n / 2 - 1] + xi [n / 2]) / 2;
+                thresholds[i] = (xi[n / 2 - 1] + xi[n / 2]) / 2;
         }
     }
     is_trained = true;
 }
+void IndexLSH::add(idx_t n, const float* x) {
+    FAISS_THROW_IF_NOT(is_trained);
+    codes.resize((ntotal + n) * bytes_per_vec);
-void IndexLSH::add (idx_t n, const float *x)
-{
-    FAISS_THROW_IF_NOT (is_trained);
-    codes.resize ((ntotal + n) * bytes_per_vec);
-    sa_encode (n, x, &codes[ntotal * bytes_per_vec]);
+    sa_encode(n, x, &codes[ntotal * bytes_per_vec]);
     ntotal += n;
 }
-void IndexLSH::search (
+void IndexLSH::search(
         idx_t n,
-        const float *x,
+        const float* x,
         idx_t k,
-        float *distances,
-        idx_t *labels) const
-{
-    FAISS_THROW_IF_NOT (is_trained);
-    const float *xt = apply_preprocess (n, x);
-    ScopeDeleter<float> del (xt == x ? nullptr : xt);
+        float* distances,
+        idx_t* labels) const {
+    FAISS_THROW_IF_NOT(k > 0);
-    uint8_t * qcodes = new uint8_t [n * bytes_per_vec];
-    ScopeDeleter<uint8_t> del2 (qcodes);
+    FAISS_THROW_IF_NOT(is_trained);
+    const float* xt = apply_preprocess(n, x);
+    ScopeDeleter<float> del(xt == x ? nullptr : xt);
-    fvecs2bitvecs (xt, qcodes, nbits, n);
+    uint8_t* qcodes = new uint8_t[n * bytes_per_vec];
+    ScopeDeleter<uint8_t> del2(qcodes);
-    int * idistances = new int [n * k];
-    ScopeDeleter<int> del3 (idistances);
+    fvecs2bitvecs(xt, qcodes, nbits, n);
-    int_maxheap_array_t res = { size_t(n), size_t(k), labels, idistances};
+    int* idistances = new int[n * k];
+    ScopeDeleter<int> del3(idistances);
-    hammings_knn_hc (&res, qcodes, codes.data(),
-                     ntotal, bytes_per_vec, true);
+    int_maxheap_array_t res = {size_t(n), size_t(k), labels, idistances};
+    hammings_knn_hc(&res, qcodes, codes.data(), ntotal, bytes_per_vec, true);
     // convert distances to floats
     for (int i = 0; i < k * n; i++)
         distances[i] = idistances[i];
 }
-void IndexLSH::transfer_thresholds (LinearTransform *vt) {
-    if (!train_thresholds) return;
-    FAISS_THROW_IF_NOT (nbits == vt->d_out);
+void IndexLSH::transfer_thresholds(LinearTransform* vt) {
+    if (!train_thresholds)
+        return;
+    FAISS_THROW_IF_NOT(nbits == vt->d_out);
     if (!vt->have_bias) {
-        vt->b.resize (nbits, 0);
+        vt->b.resize(nbits, 0);
         vt->have_bias = true;
     }
     for (int i = 0; i < nbits; i++)
@@ -175,51 +163,42 @@ void IndexLSH::reset() {
     ntotal = 0;
 }
-size_t IndexLSH::sa_code_size () const
-{
+size_t IndexLSH::sa_code_size() const {
     return bytes_per_vec;
 }
-void IndexLSH::sa_encode (idx_t n, const float *x,
-                                uint8_t *bytes) const
-{
-    FAISS_THROW_IF_NOT (is_trained);
-    const float *xt = apply_preprocess (n, x);
-    ScopeDeleter<float> del (xt == x ? nullptr : xt);
-    fvecs2bitvecs (xt, bytes, nbits, n);
+void IndexLSH::sa_encode(idx_t n, const float* x, uint8_t* bytes) const {
+    FAISS_THROW_IF_NOT(is_trained);
+    const float* xt = apply_preprocess(n, x);
+    ScopeDeleter<float> del(xt == x ? nullptr : xt);
+    fvecs2bitvecs(xt, bytes, nbits, n);
 }
-void IndexLSH::sa_decode (idx_t n, const uint8_t *bytes,
-                                  float *x) const
-{
-    float *xt = x;
+void IndexLSH::sa_decode(idx_t n, const uint8_t* bytes, float* x) const {
+    float* xt = x;
     ScopeDeleter<float> del;
     if (rotate_data || nbits != d) {
-        xt = new float [n * nbits];
+        xt = new float[n * nbits];
         del.set(xt);
     }
-    bitvecs2fvecs (bytes, xt, nbits, n);
+    bitvecs2fvecs(bytes, xt, nbits, n);
     if (train_thresholds) {
-        float *xp = xt;
+        float* xp = xt;
         for (idx_t i = 0; i < n; i++) {
             for (int j = 0; j < nbits; j++) {
-                *xp++ += thresholds [j];
+                *xp++ += thresholds[j];
             }
         }
     }
     if (rotate_data) {
-        rrot.reverse_transform (n, xt, x);
+        rrot.reverse_transform(n, xt, x);
     } else if (nbits != d) {
         for (idx_t i = 0; i < n; i++) {
-            memcpy (x + i * d, xt + i * nbits,
-                    nbits * sizeof(xt[0]));
+            memcpy(x + i * d, xt + i * nbits, nbits * sizeof(xt[0]));
         }
     }
 }
 } // namespace faiss

data/vendor/faiss/faiss/IndexLSH.h CHANGED Viewed

@@ -17,25 +17,25 @@
 namespace faiss {
 /** The sign of each vector component is put in a binary signature */
-struct IndexLSH:Index {
+struct IndexLSH : Index {
     typedef unsigned char uint8_t;
-    int nbits;              ///< nb of bits per vector
-    int bytes_per_vec;      ///< nb of 8-bits per encoded vector
-    bool rotate_data;       ///< whether to apply a random rotation to input
-    bool train_thresholds;  ///< whether we train thresholds or use 0
+    int nbits;             ///< nb of bits per vector
+    int bytes_per_vec;     ///< nb of 8-bits per encoded vector
+    bool rotate_data;      ///< whether to apply a random rotation to input
+    bool train_thresholds; ///< whether we train thresholds or use 0
     RandomRotationMatrix rrot; ///< optional random rotation
-    std::vector <float> thresholds; ///< thresholds to compare with
+    std::vector<float> thresholds; ///< thresholds to compare with
     /// encoded dataset
     std::vector<uint8_t> codes;
-    IndexLSH (
-            idx_t d, int nbits,
+    IndexLSH(
+            idx_t d,
+            int nbits,
             bool rotate_data = true,
             bool train_thresholds = false);
@@ -46,45 +46,40 @@ struct IndexLSH:Index {
      * @return output vectors, size n * bits. May be the same pointer
      *         as x, otherwise it should be deleted by the caller
      */
-    const float *apply_preprocess (idx_t n, const float *x) const;
+    const float* apply_preprocess(idx_t n, const float* x) const;
     void train(idx_t n, const float* x) override;
     void add(idx_t n, const float* x) override;
     void search(
-        idx_t n,
-        const float* x,
-        idx_t k,
-        float* distances,
-        idx_t* labels) const override;
+            idx_t n,
+            const float* x,
+            idx_t k,
+            float* distances,
+            idx_t* labels) const override;
     void reset() override;
     /// transfer the thresholds to a pre-processing stage (and unset
     /// train_thresholds)
-    void transfer_thresholds (LinearTransform * vt);
+    void transfer_thresholds(LinearTransform* vt);
     ~IndexLSH() override {}
-    IndexLSH ();
+    IndexLSH();
     /* standalone codec interface.
      *
      * The vectors are decoded to +/- 1 (not 0, 1) */
-    size_t sa_code_size () const override;
-    void sa_encode (idx_t n, const float *x,
-                          uint8_t *bytes) const override;
+    size_t sa_code_size() const override;
-    void sa_decode (idx_t n, const uint8_t *bytes,
-                            float *x) const override;
+    void sa_encode(idx_t n, const float* x, uint8_t* bytes) const override;
+    void sa_decode(idx_t n, const uint8_t* bytes, float* x) const override;
 };
-}
+} // namespace faiss
 #endif

data/vendor/faiss/faiss/IndexLattice.cpp CHANGED Viewed

@@ -7,26 +7,23 @@
 // -*- c++ -*-
 #include <faiss/IndexLattice.h>
-#include <faiss/utils/hamming.h>    // for the bitstring routines
 #include <faiss/impl/FaissAssert.h>
 #include <faiss/utils/distances.h>
+#include <faiss/utils/hamming.h> // for the bitstring routines
 namespace faiss {
-IndexLattice::IndexLattice (idx_t d, int nsq, int scale_nbit, int r2):
-    Index (d),
-    nsq (nsq),
-    dsq (d / nsq),
-    zn_sphere_codec (dsq, r2),
-    scale_nbit (scale_nbit)
-{
-    FAISS_THROW_IF_NOT (d % nsq == 0);
+IndexLattice::IndexLattice(idx_t d, int nsq, int scale_nbit, int r2)
+        : Index(d),
+          nsq(nsq),
+          dsq(d / nsq),
+          zn_sphere_codec(dsq, r2),
+          scale_nbit(scale_nbit) {
+    FAISS_THROW_IF_NOT(d % nsq == 0);
     lattice_nbit = 0;
-    while (!( ((uint64_t)1 << lattice_nbit) >= zn_sphere_codec.nv)) {
+    while (!(((uint64_t)1 << lattice_nbit) >= zn_sphere_codec.nv)) {
         lattice_nbit++;
     }
@@ -37,12 +34,11 @@ IndexLattice::IndexLattice (idx_t d, int nsq, int scale_nbit, int r2):
     is_trained = false;
 }
-void IndexLattice::train(idx_t n, const float* x)
-{
+void IndexLattice::train(idx_t n, const float* x) {
     // compute ranges per sub-block
-    trained.resize (nsq * 2);
-    float * mins = trained.data();
-    float * maxs = trained.data() + nsq;
+    trained.resize(nsq * 2);
+    float* mins = trained.data();
+    float* maxs = trained.data() + nsq;
     for (int sq = 0; sq < nsq; sq++) {
         mins[sq] = HUGE_VAL;
         maxs[sq] = -1;
@@ -50,45 +46,43 @@ void IndexLattice::train(idx_t n, const float* x)
     for (idx_t i = 0; i < n; i++) {
         for (int sq = 0; sq < nsq; sq++) {
-            float norm2 = fvec_norm_L2sqr (x + i * d + sq * dsq, dsq);
-            if (norm2 > maxs[sq]) maxs[sq] = norm2;
-            if (norm2 < mins[sq]) mins[sq] = norm2;
+            float norm2 = fvec_norm_L2sqr(x + i * d + sq * dsq, dsq);
+            if (norm2 > maxs[sq])
+                maxs[sq] = norm2;
+            if (norm2 < mins[sq])
+                mins[sq] = norm2;
         }
     }
     for (int sq = 0; sq < nsq; sq++) {
-        mins[sq] = sqrtf (mins[sq]);
-        maxs[sq] = sqrtf (maxs[sq]);
+        mins[sq] = sqrtf(mins[sq]);
+        maxs[sq] = sqrtf(maxs[sq]);
     }
     is_trained = true;
 }
 /* The standalone codec interface */
-size_t IndexLattice::sa_code_size () const
-{
+size_t IndexLattice::sa_code_size() const {
     return code_size;
 }
-void IndexLattice::sa_encode (idx_t n, const float *x, uint8_t *codes) const
-{
-    const float * mins = trained.data();
-    const float * maxs = mins + nsq;
+void IndexLattice::sa_encode(idx_t n, const float* x, uint8_t* codes) const {
+    const float* mins = trained.data();
+    const float* maxs = mins + nsq;
     int64_t sc = int64_t(1) << scale_nbit;
 #pragma omp parallel for
     for (idx_t i = 0; i < n; i++) {
         BitstringWriter wr(codes + i * code_size, code_size);
-        const float *xi = x + i * d;
+        const float* xi = x + i * d;
         for (int j = 0; j < nsq; j++) {
-            float nj =
-                (sqrtf(fvec_norm_L2sqr(xi, dsq)) - mins[j])
-                * sc / (maxs[j] - mins[j]);
-            if (nj < 0) nj = 0;
-            if (nj >= sc) nj = sc - 1;
+            float nj = (sqrtf(fvec_norm_L2sqr(xi, dsq)) - mins[j]) * sc /
+                    (maxs[j] - mins[j]);
+            if (nj < 0)
+                nj = 0;
+            if (nj >= sc)
+                nj = sc - 1;
             wr.write((int64_t)nj, scale_nbit);
             wr.write(zn_sphere_codec.encode(xi), lattice_nbit);
             xi += dsq;
@@ -96,23 +90,22 @@ void IndexLattice::sa_encode (idx_t n, const float *x, uint8_t *codes) const
     }
 }
-void IndexLattice::sa_decode (idx_t n, const uint8_t *codes, float *x) const
-{
-    const float * mins = trained.data();
-    const float * maxs = mins + nsq;
+void IndexLattice::sa_decode(idx_t n, const uint8_t* codes, float* x) const {
+    const float* mins = trained.data();
+    const float* maxs = mins + nsq;
     float sc = int64_t(1) << scale_nbit;
     float r = sqrtf(zn_sphere_codec.r2);
 #pragma omp parallel for
     for (idx_t i = 0; i < n; i++) {
         BitstringReader rd(codes + i * code_size, code_size);
-        float *xi = x + i * d;
+        float* xi = x + i * d;
         for (int j = 0; j < nsq; j++) {
             float norm =
-                (rd.read (scale_nbit) + 0.5) *
-                (maxs[j] - mins[j]) / sc + mins[j];
+                    (rd.read(scale_nbit) + 0.5) * (maxs[j] - mins[j]) / sc +
+                    mins[j];
             norm /= r;
-            zn_sphere_codec.decode (rd.read (lattice_nbit), xi);
+            zn_sphere_codec.decode(rd.read(lattice_nbit), xi);
             for (int l = 0; l < dsq; l++) {
                 xi[l] *= norm;
             }
@@ -121,23 +114,16 @@ void IndexLattice::sa_decode (idx_t n, const uint8_t *codes, float *x) const
     }
 }
-void IndexLattice::add(idx_t , const float* )
-{
+void IndexLattice::add(idx_t, const float*) {
     FAISS_THROW_MSG("not implemented");
 }
-void  IndexLattice::search(idx_t , const float* , idx_t ,
-                           float* , idx_t* ) const
-{
+void IndexLattice::search(idx_t, const float*, idx_t, float*, idx_t*) const {
     FAISS_THROW_MSG("not implemented");
 }
-void IndexLattice::reset()
-{
+void IndexLattice::reset() {
     FAISS_THROW_MSG("not implemented");
 }
-}  // namespace faiss
+} // namespace faiss

data/vendor/faiss/faiss/IndexLattice.h CHANGED Viewed

@@ -10,7 +10,6 @@
 #ifndef FAISS_INDEX_LATTICE_H
 #define FAISS_INDEX_LATTICE_H
 #include <vector>
 #include <faiss/IndexIVF.h>
@@ -18,14 +17,9 @@
 namespace faiss {
 /** Index that encodes a vector with a series of Zn lattice quantizers
  */
-struct IndexLattice: Index {
+struct IndexLattice : Index {
     /// number of sub-vectors
     int nsq;
     /// dimension of sub-vectors
@@ -42,25 +36,26 @@ struct IndexLattice: Index {
     /// mins and maxes of the vector norms, per subquantizer
     std::vector<float> trained;
-    IndexLattice (idx_t d, int nsq, int scale_nbit, int r2);
+    IndexLattice(idx_t d, int nsq, int scale_nbit, int r2);
     void train(idx_t n, const float* x) override;
     /* The standalone codec interface */
-    size_t sa_code_size () const override;
+    size_t sa_code_size() const override;
-    void sa_encode (idx_t n, const float *x,
-                          uint8_t *bytes) const override;
+    void sa_encode(idx_t n, const float* x, uint8_t* bytes) const override;
-    void sa_decode (idx_t n, const uint8_t *bytes,
-                            float *x) const override;
+    void sa_decode(idx_t n, const uint8_t* bytes, float* x) const override;
     /// not implemented
     void add(idx_t n, const float* x) override;
-    void search(idx_t n, const float* x, idx_t k,
-                float* distances, idx_t* labels) const override;
+    void search(
+            idx_t n,
+            const float* x,
+            idx_t k,
+            float* distances,
+            idx_t* labels) const override;
     void reset() override;
 };
 } // namespace faiss