RubyGems - faiss - Versions diffs - 0.1.4 → 0.2.1 - Mend

faiss 0.1.4 → 0.2.1

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +26 -1
data/README.md +15 -3
data/ext/faiss/ext.cpp +12 -308
data/ext/faiss/extconf.rb +5 -2
data/ext/faiss/index.cpp +189 -0
data/ext/faiss/index_binary.cpp +75 -0
data/ext/faiss/kmeans.cpp +40 -0
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +33 -0
data/ext/faiss/product_quantizer.cpp +53 -0
data/ext/faiss/utils.cpp +13 -0
data/ext/faiss/utils.h +5 -0
data/lib/faiss.rb +0 -5
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +31 -10
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/VectorTransform.h CHANGED Viewed

@@ -14,67 +14,55 @@
  * vectors Often these are pre-processing steps.
  */
-#include <vector>
 #include <stdint.h>
+#include <vector>
 #include <faiss/Index.h>
 namespace faiss {
 /** Any transformation applied on a set of vectors */
 struct VectorTransform {
     typedef Index::idx_t idx_t;
-    int d_in;      ///! input dimension
-    int d_out;     ///! output dimension
-    explicit VectorTransform (int d_in = 0, int d_out = 0):
-    d_in(d_in), d_out(d_out), is_trained(true)
-    {}
+    int d_in;  ///! input dimension
+    int d_out; ///! output dimension
+    explicit VectorTransform(int d_in = 0, int d_out = 0)
+            : d_in(d_in), d_out(d_out), is_trained(true) {}
     /// set if the VectorTransform does not require training, or if
     /// training is done already
     bool is_trained;
     /** Perform training on a representative set of vectors. Does
      * nothing by default.
      *
      * @param n      nb of training vectors
      * @param x      training vecors, size n * d
      */
-    virtual void train (idx_t n, const float *x);
+    virtual void train(idx_t n, const float* x);
-    /** apply the random roation, return new allocated matrix
+    /** apply the random rotation, return new allocated matrix
      * @param     x size n * d_in
      * @return    size n * d_out
      */
-    float *apply (idx_t n, const float * x) const;
+    float* apply(idx_t n, const float* x) const;
     /// same as apply, but result is pre-allocated
-    virtual void apply_noalloc (idx_t n, const float * x,
-                                float *xt) const = 0;
+    virtual void apply_noalloc(idx_t n, const float* x, float* xt) const = 0;
     /// reverse transformation. May not be implemented or may return
     /// approximate result
-    virtual void reverse_transform (idx_t n, const float * xt,
-                                    float *x) const;
-    virtual ~VectorTransform () {}
+    virtual void reverse_transform(idx_t n, const float* xt, float* x) const;
+    virtual ~VectorTransform() {}
 };
 /** Generic linear transformation, with bias term applied on output
  * y = A * x + b
  */
-struct LinearTransform: VectorTransform {
+struct LinearTransform : VectorTransform {
     bool have_bias; ///! whether to use the bias term
     /// check if matrix A is orthonormal (enables reverse_transform)
@@ -83,58 +71,56 @@ struct LinearTransform: VectorTransform {
     /// Transformation matrix, size d_out * d_in
     std::vector<float> A;
-     /// bias vector, size d_out
+    /// bias vector, size d_out
     std::vector<float> b;
     /// both d_in > d_out and d_out < d_in are supported
-    explicit LinearTransform (int d_in = 0, int d_out = 0,
-                              bool have_bias = false);
+    explicit LinearTransform(
+            int d_in = 0,
+            int d_out = 0,
+            bool have_bias = false);
     /// same as apply, but result is pre-allocated
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// compute x = A^T * (x - b)
     /// is reverse transform if A has orthonormal lines
-    void transform_transpose (idx_t n, const float * y,
-                              float *x) const;
+    void transform_transpose(idx_t n, const float* y, float* x) const;
     /// works only if is_orthonormal
-    void reverse_transform (idx_t n, const float * xt,
-                            float *x) const override;
+    void reverse_transform(idx_t n, const float* xt, float* x) const override;
     /// compute A^T * A to set the is_orthonormal flag
-    void set_is_orthonormal ();
+    void set_is_orthonormal();
     bool verbose;
-    void print_if_verbose (const char*name, const std::vector<double> &mat,
-                           int n, int d) const;
+    void print_if_verbose(
+            const char* name,
+            const std::vector<double>& mat,
+            int n,
+            int d) const;
     ~LinearTransform() override {}
 };
 /// Randomly rotate a set of vectors
-struct RandomRotationMatrix: LinearTransform {
-     /// both d_in > d_out and d_out < d_in are supported
-     RandomRotationMatrix (int d_in, int d_out):
-         LinearTransform(d_in, d_out, false) {}
+struct RandomRotationMatrix : LinearTransform {
+    /// both d_in > d_out and d_out < d_in are supported
+    RandomRotationMatrix(int d_in, int d_out)
+            : LinearTransform(d_in, d_out, false) {}
-     /// must be called before the transform is used
-     void init(int seed);
+    /// must be called before the transform is used
+    void init(int seed);
-     // intializes with an arbitrary seed
-     void train(idx_t n, const float* x) override;
+    // intializes with an arbitrary seed
+    void train(idx_t n, const float* x) override;
-     RandomRotationMatrix () {}
+    RandomRotationMatrix() {}
 };
 /** Applies a principal component analysis on a set of vectors,
  *  with optionally whitening and random rotation. */
-struct PCAMatrix: LinearTransform {
+struct PCAMatrix : LinearTransform {
     /** after transformation the components are multiplied by
      * eigenvalues^eigen_power
      *
@@ -162,22 +148,23 @@ struct PCAMatrix: LinearTransform {
     std::vector<float> PCAMat;
     // the final matrix is computed after random rotation and/or whitening
-    explicit PCAMatrix (int d_in = 0, int d_out = 0,
-                        float eigen_power = 0, bool random_rotation = false);
+    explicit PCAMatrix(
+            int d_in = 0,
+            int d_out = 0,
+            float eigen_power = 0,
+            bool random_rotation = false);
     /// train on n vectors. If n < d_in then the eigenvector matrix
     /// will be completed with 0s
     void train(idx_t n, const float* x) override;
     /// copy pre-trained PCA matrix
-    void copy_from (const PCAMatrix & other);
+    void copy_from(const PCAMatrix& other);
     /// called after mean, PCAMat and eigenvalues are computed
     void prepare_Ab();
 };
 /** ITQ implementation from
  *
  *     Iterative quantization: A procrustean approach to learning binary codes
@@ -187,25 +174,21 @@ struct PCAMatrix: LinearTransform {
  * PAMI'12.
  */
-struct ITQMatrix: LinearTransform {
+struct ITQMatrix : LinearTransform {
     int max_iter;
     int seed;
     // force initialization of the rotation (for debugging)
     std::vector<double> init_rotation;
-    explicit ITQMatrix (int d = 0);
+    explicit ITQMatrix(int d = 0);
-    void train (idx_t n, const float* x) override;
+    void train(idx_t n, const float* x) override;
 };
 /** The full ITQ transform, including normalizations and PCA transformation
  */
-struct ITQTransform: VectorTransform {
+struct ITQTransform : VectorTransform {
     std::vector<float> mean;
     bool do_pca;
     ITQMatrix itq;
@@ -216,15 +199,13 @@ struct ITQTransform: VectorTransform {
     // concatenation of PCA + ITQ transformation
     LinearTransform pca_then_itq;
-    explicit ITQTransform (int d_in = 0, int d_out = 0, bool do_pca = false);
-    void train (idx_t n, const float *x) override;
+    explicit ITQTransform(int d_in = 0, int d_out = 0, bool do_pca = false);
-    void apply_noalloc (idx_t n, const float* x, float* xt) const override;
+    void train(idx_t n, const float* x) override;
+    void apply_noalloc(idx_t n, const float* x, float* xt) const override;
 };
 struct ProductQuantizer;
 /** Applies a rotation to align the dimensions with a PQ to minimize
@@ -235,8 +216,7 @@ struct ProductQuantizer;
  * Tiezheng Ge, Kaiming He, Qifa Ke, Jian Sun, CVPR'13
  *
  */
-struct OPQMatrix: LinearTransform {
+struct OPQMatrix : LinearTransform {
     int M;          ///< nb of subquantizers
     int niter;      ///< Number of outer training iterations
     int niter_pq;   ///< Number of training iterations for the PQ
@@ -248,46 +228,43 @@ struct OPQMatrix: LinearTransform {
     /// if non-NULL, use this product quantizer for training
     /// should be constructed with (d_out, M, _)
-    ProductQuantizer * pq;
+    ProductQuantizer* pq;
     /// if d2 != -1, output vectors of this dimension
-    explicit OPQMatrix (int d = 0, int M = 1, int d2 = -1);
+    explicit OPQMatrix(int d = 0, int M = 1, int d2 = -1);
     void train(idx_t n, const float* x) override;
 };
 /** remap dimensions for intput vectors, possibly inserting 0s
  * strictly speaking this is also a linear transform but we don't want
  * to compute it with matrix multiplies */
-struct RemapDimensionsTransform: VectorTransform {
+struct RemapDimensionsTransform : VectorTransform {
     /// map from output dimension to input, size d_out
     /// -1 -> set output to 0
     std::vector<int> map;
-    RemapDimensionsTransform (int d_in, int d_out, const int *map);
+    RemapDimensionsTransform(int d_in, int d_out, const int* map);
     /// remap input to output, skipping or inserting dimensions as needed
     /// if uniform: distribute dimensions uniformly
     /// otherwise just take the d_out first ones.
-    RemapDimensionsTransform (int d_in, int d_out, bool uniform = true);
+    RemapDimensionsTransform(int d_in, int d_out, bool uniform = true);
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// reverse transform correct only when the mapping is a permutation
     void reverse_transform(idx_t n, const float* xt, float* x) const override;
-    RemapDimensionsTransform () {}
+    RemapDimensionsTransform() {}
 };
 /** per-vector normalization */
-struct NormalizationTransform: VectorTransform {
+struct NormalizationTransform : VectorTransform {
     float norm;
-    explicit NormalizationTransform (int d, float norm = 2.0);
-    NormalizationTransform ();
+    explicit NormalizationTransform(int d, float norm = 2.0);
+    NormalizationTransform();
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
@@ -296,12 +273,11 @@ struct NormalizationTransform: VectorTransform {
 };
 /** Subtract the mean of each component from the vectors. */
-struct CenteringTransform: VectorTransform {
+struct CenteringTransform : VectorTransform {
     /// Mean, size d_in = d_out
     std::vector<float> mean;
-    explicit CenteringTransform (int d = 0);
+    explicit CenteringTransform(int d = 0);
     /// train on n vectors.
     void train(idx_t n, const float* x) override;
@@ -310,13 +286,9 @@ struct CenteringTransform: VectorTransform {
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// add the mean
-    void reverse_transform (idx_t n, const float * xt,
-                            float *x) const override;
+    void reverse_transform(idx_t n, const float* xt, float* x) const override;
 };
 } // namespace faiss
 #endif

data/vendor/faiss/faiss/clone_index.cpp CHANGED Viewed

@@ -14,22 +14,23 @@
 #include <faiss/impl/FaissAssert.h>
+#include <faiss/Index2Layer.h>
 #include <faiss/IndexFlat.h>
-#include <faiss/VectorTransform.h>
-#include <faiss/IndexPreTransform.h>
-#include <faiss/IndexLSH.h>
-#include <faiss/IndexPQ.h>
+#include <faiss/IndexHNSW.h>
 #include <faiss/IndexIVF.h>
+#include <faiss/IndexIVFFlat.h>
 #include <faiss/IndexIVFPQ.h>
 #include <faiss/IndexIVFPQR.h>
-#include <faiss/Index2Layer.h>
-#include <faiss/IndexIVFFlat.h>
 #include <faiss/IndexIVFSpectralHash.h>
-#include <faiss/MetaIndexes.h>
-#include <faiss/IndexScalarQuantizer.h>
-#include <faiss/IndexHNSW.h>
+#include <faiss/IndexLSH.h>
 #include <faiss/IndexLattice.h>
-#include <faiss/Index2Layer.h>
+#include <faiss/IndexNSG.h>
+#include <faiss/IndexPQ.h>
+#include <faiss/IndexPreTransform.h>
+#include <faiss/IndexResidual.h>
+#include <faiss/IndexScalarQuantizer.h>
+#include <faiss/MetaIndexes.h>
+#include <faiss/VectorTransform.h>
 namespace faiss {
@@ -37,111 +38,114 @@ namespace faiss {
  * cloning functions
  **************************************************************/
-Index * clone_index (const Index *index)
-{
+Index* clone_index(const Index* index) {
     Cloner cl;
-    return cl.clone_Index (index);
+    return cl.clone_Index(index);
 }
 // assumes there is a copy constructor ready. Always try from most
 // specific to most general. Most indexes don't have complicated
 // structs, the default copy constructor often just works.
-#define TRYCLONE(classname, obj) \
-    if (const classname *clo = dynamic_cast<const classname *>(obj)) { \
-        return new classname(*clo); \
+#define TRYCLONE(classname, obj)                                      \
+    if (const classname* clo = dynamic_cast<const classname*>(obj)) { \
+        return new classname(*clo);                                   \
     } else
-VectorTransform *Cloner::clone_VectorTransform (const VectorTransform *vt)
-{
-    TRYCLONE (RemapDimensionsTransform, vt)
-    TRYCLONE (OPQMatrix, vt)
-    TRYCLONE (PCAMatrix, vt)
-    TRYCLONE (ITQMatrix, vt)
-    TRYCLONE (RandomRotationMatrix, vt)
-    TRYCLONE (LinearTransform, vt)
-    {
-      FAISS_THROW_MSG("clone not supported for this type of VectorTransform");
+VectorTransform* Cloner::clone_VectorTransform(const VectorTransform* vt) {
+    TRYCLONE(RemapDimensionsTransform, vt)
+    TRYCLONE(OPQMatrix, vt)
+    TRYCLONE(PCAMatrix, vt)
+    TRYCLONE(ITQMatrix, vt)
+    TRYCLONE(RandomRotationMatrix, vt)
+    TRYCLONE(LinearTransform, vt) {
+        FAISS_THROW_MSG("clone not supported for this type of VectorTransform");
     }
     return nullptr;
 }
-IndexIVF * Cloner::clone_IndexIVF (const IndexIVF *ivf)
-{
-    TRYCLONE (IndexIVFPQR, ivf)
-    TRYCLONE (IndexIVFPQ, ivf)
-    TRYCLONE (IndexIVFFlat, ivf)
-    TRYCLONE (IndexIVFScalarQuantizer, ivf)
-    {
-      FAISS_THROW_MSG("clone not supported for this type of IndexIVF");
+IndexIVF* Cloner::clone_IndexIVF(const IndexIVF* ivf) {
+    TRYCLONE(IndexIVFPQR, ivf)
+    TRYCLONE(IndexIVFPQ, ivf)
+    TRYCLONE(IndexIVFFlat, ivf)
+    TRYCLONE(IndexIVFScalarQuantizer, ivf) {
+        FAISS_THROW_MSG("clone not supported for this type of IndexIVF");
     }
     return nullptr;
 }
-Index *Cloner::clone_Index (const Index *index)
-{
-    TRYCLONE (IndexPQ, index)
-    TRYCLONE (IndexLSH, index)
-    TRYCLONE (IndexFlatL2, index)
-    TRYCLONE (IndexFlatIP, index)
-    TRYCLONE (IndexFlat, index)
-    TRYCLONE (IndexLattice, index)
-    TRYCLONE (IndexScalarQuantizer, index)
-    TRYCLONE (MultiIndexQuantizer, index)
-    if (const IndexIVF * ivf = dynamic_cast<const IndexIVF*>(index)) {
-        IndexIVF *res = clone_IndexIVF (ivf);
+Index* Cloner::clone_Index(const Index* index) {
+    TRYCLONE(IndexPQ, index)
+    TRYCLONE(IndexLSH, index)
+    TRYCLONE(IndexFlatL2, index)
+    TRYCLONE(IndexFlatIP, index)
+    TRYCLONE(IndexFlat, index)
+    TRYCLONE(IndexLattice, index)
+    TRYCLONE(IndexResidual, index)
+    TRYCLONE(IndexScalarQuantizer, index)
+    TRYCLONE(MultiIndexQuantizer, index)
+    if (const IndexIVF* ivf = dynamic_cast<const IndexIVF*>(index)) {
+        IndexIVF* res = clone_IndexIVF(ivf);
         if (ivf->invlists == nullptr) {
             res->invlists = nullptr;
-        } else if (auto *ails = dynamic_cast<const ArrayInvertedLists*>
-                   (ivf->invlists)) {
+        } else if (
+                auto* ails = dynamic_cast<const ArrayInvertedLists*>(
+                        ivf->invlists)) {
             res->invlists = new ArrayInvertedLists(*ails);
             res->own_invlists = true;
         } else {
-            FAISS_THROW_MSG( "clone not supported for this type of inverted lists");
+            FAISS_THROW_MSG(
+                    "clone not supported for this type of inverted lists");
         }
         res->own_fields = true;
-        res->quantizer = clone_Index (ivf->quantizer);
+        res->quantizer = clone_Index(ivf->quantizer);
         return res;
-    } else if (const IndexPreTransform * ipt =
-               dynamic_cast<const IndexPreTransform*> (index)) {
-        IndexPreTransform *res = new IndexPreTransform ();
+    } else if (
+            const IndexPreTransform* ipt =
+                    dynamic_cast<const IndexPreTransform*>(index)) {
+        IndexPreTransform* res = new IndexPreTransform();
         res->d = ipt->d;
         res->ntotal = ipt->ntotal;
         res->is_trained = ipt->is_trained;
         res->metric_type = ipt->metric_type;
         res->metric_arg = ipt->metric_arg;
-        res->index = clone_Index (ipt->index);
+        res->index = clone_Index(ipt->index);
         for (int i = 0; i < ipt->chain.size(); i++)
-            res->chain.push_back (clone_VectorTransform (ipt->chain[i]));
+            res->chain.push_back(clone_VectorTransform(ipt->chain[i]));
         res->own_fields = true;
         return res;
-    } else if (const IndexIDMap *idmap =
-               dynamic_cast<const IndexIDMap*> (index)) {
-        IndexIDMap *res = new IndexIDMap (*idmap);
+    } else if (
+            const IndexIDMap* idmap = dynamic_cast<const IndexIDMap*>(index)) {
+        IndexIDMap* res = new IndexIDMap(*idmap);
         res->own_fields = true;
-        res->index = clone_Index (idmap->index);
+        res->index = clone_Index(idmap->index);
         return res;
-    } else if (const IndexHNSW *ihnsw =
-               dynamic_cast<const IndexHNSW*> (index)) {
-        IndexHNSW *res = new IndexHNSW (*ihnsw);
+    } else if (const IndexHNSW* ihnsw = dynamic_cast<const IndexHNSW*>(index)) {
+        IndexHNSW* res = new IndexHNSW(*ihnsw);
         res->own_fields = true;
-        res->storage = clone_Index (ihnsw->storage);
+        res->storage = clone_Index(ihnsw->storage);
         return res;
-    } else if (const Index2Layer *i2l =
-               dynamic_cast<const Index2Layer*> (index)) {
-        Index2Layer *res = new Index2Layer (*i2l);
+    } else if (const IndexNSG* insg = dynamic_cast<const IndexNSG*>(index)) {
+        IndexNSG* res = new IndexNSG(*insg);
+        // copy the dynamic allocated graph
+        auto& new_graph = res->nsg.final_graph;
+        auto& old_graph = insg->nsg.final_graph;
+        new_graph = std::make_shared<nsg::Graph<int>>(*old_graph);
+        res->own_fields = true;
+        res->storage = clone_Index(insg->storage);
+        return res;
+    } else if (
+            const Index2Layer* i2l = dynamic_cast<const Index2Layer*>(index)) {
+        Index2Layer* res = new Index2Layer(*i2l);
         res->q1.own_fields = true;
-        res->q1.quantizer = clone_Index (i2l->q1.quantizer);
+        res->q1.quantizer = clone_Index(i2l->q1.quantizer);
         return res;
     } else {
-        FAISS_THROW_MSG( "clone not supported for this type of Index");
+        FAISS_THROW_MSG("clone not supported for this type of Index");
     }
     return nullptr;
 }
 } // namespace faiss