RubyGems - faiss - Versions diffs - 0.1.5 → 0.2.2 - Mend

faiss 0.1.5 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +24 -0
data/README.md +12 -0
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +6 -2
data/ext/faiss/index.cpp +114 -43
data/ext/faiss/index_binary.cpp +24 -30
data/ext/faiss/kmeans.cpp +20 -16
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +13 -14
data/ext/faiss/product_quantizer.cpp +23 -24
data/ext/faiss/utils.cpp +10 -37
data/ext/faiss/utils.h +2 -13
data/lib/faiss.rb +0 -5
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +24 -10
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/VectorTransform.h CHANGED Viewed

@@ -14,67 +14,55 @@
  * vectors Often these are pre-processing steps.
  */
-#include <vector>
 #include <stdint.h>
+#include <vector>
 #include <faiss/Index.h>
 namespace faiss {
 /** Any transformation applied on a set of vectors */
 struct VectorTransform {
     typedef Index::idx_t idx_t;
-    int d_in;      ///! input dimension
-    int d_out;     ///! output dimension
-    explicit VectorTransform (int d_in = 0, int d_out = 0):
-    d_in(d_in), d_out(d_out), is_trained(true)
-    {}
+    int d_in;  ///! input dimension
+    int d_out; ///! output dimension
+    explicit VectorTransform(int d_in = 0, int d_out = 0)
+            : d_in(d_in), d_out(d_out), is_trained(true) {}
     /// set if the VectorTransform does not require training, or if
     /// training is done already
     bool is_trained;
     /** Perform training on a representative set of vectors. Does
      * nothing by default.
      *
      * @param n      nb of training vectors
      * @param x      training vecors, size n * d
      */
-    virtual void train (idx_t n, const float *x);
+    virtual void train(idx_t n, const float* x);
-    /** apply the random roation, return new allocated matrix
+    /** apply the random rotation, return new allocated matrix
      * @param     x size n * d_in
      * @return    size n * d_out
      */
-    float *apply (idx_t n, const float * x) const;
+    float* apply(idx_t n, const float* x) const;
     /// same as apply, but result is pre-allocated
-    virtual void apply_noalloc (idx_t n, const float * x,
-                                float *xt) const = 0;
+    virtual void apply_noalloc(idx_t n, const float* x, float* xt) const = 0;
     /// reverse transformation. May not be implemented or may return
     /// approximate result
-    virtual void reverse_transform (idx_t n, const float * xt,
-                                    float *x) const;
-    virtual ~VectorTransform () {}
+    virtual void reverse_transform(idx_t n, const float* xt, float* x) const;
+    virtual ~VectorTransform() {}
 };
 /** Generic linear transformation, with bias term applied on output
  * y = A * x + b
  */
-struct LinearTransform: VectorTransform {
+struct LinearTransform : VectorTransform {
     bool have_bias; ///! whether to use the bias term
     /// check if matrix A is orthonormal (enables reverse_transform)
@@ -83,58 +71,56 @@ struct LinearTransform: VectorTransform {
     /// Transformation matrix, size d_out * d_in
     std::vector<float> A;
-     /// bias vector, size d_out
+    /// bias vector, size d_out
     std::vector<float> b;
     /// both d_in > d_out and d_out < d_in are supported
-    explicit LinearTransform (int d_in = 0, int d_out = 0,
-                              bool have_bias = false);
+    explicit LinearTransform(
+            int d_in = 0,
+            int d_out = 0,
+            bool have_bias = false);
     /// same as apply, but result is pre-allocated
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// compute x = A^T * (x - b)
     /// is reverse transform if A has orthonormal lines
-    void transform_transpose (idx_t n, const float * y,
-                              float *x) const;
+    void transform_transpose(idx_t n, const float* y, float* x) const;
     /// works only if is_orthonormal
-    void reverse_transform (idx_t n, const float * xt,
-                            float *x) const override;
+    void reverse_transform(idx_t n, const float* xt, float* x) const override;
     /// compute A^T * A to set the is_orthonormal flag
-    void set_is_orthonormal ();
+    void set_is_orthonormal();
     bool verbose;
-    void print_if_verbose (const char*name, const std::vector<double> &mat,
-                           int n, int d) const;
+    void print_if_verbose(
+            const char* name,
+            const std::vector<double>& mat,
+            int n,
+            int d) const;
     ~LinearTransform() override {}
 };
 /// Randomly rotate a set of vectors
-struct RandomRotationMatrix: LinearTransform {
-     /// both d_in > d_out and d_out < d_in are supported
-     RandomRotationMatrix (int d_in, int d_out):
-         LinearTransform(d_in, d_out, false) {}
+struct RandomRotationMatrix : LinearTransform {
+    /// both d_in > d_out and d_out < d_in are supported
+    RandomRotationMatrix(int d_in, int d_out)
+            : LinearTransform(d_in, d_out, false) {}
-     /// must be called before the transform is used
-     void init(int seed);
+    /// must be called before the transform is used
+    void init(int seed);
-     // intializes with an arbitrary seed
-     void train(idx_t n, const float* x) override;
+    // intializes with an arbitrary seed
+    void train(idx_t n, const float* x) override;
-     RandomRotationMatrix () {}
+    RandomRotationMatrix() {}
 };
 /** Applies a principal component analysis on a set of vectors,
  *  with optionally whitening and random rotation. */
-struct PCAMatrix: LinearTransform {
+struct PCAMatrix : LinearTransform {
     /** after transformation the components are multiplied by
      * eigenvalues^eigen_power
      *
@@ -162,22 +148,23 @@ struct PCAMatrix: LinearTransform {
     std::vector<float> PCAMat;
     // the final matrix is computed after random rotation and/or whitening
-    explicit PCAMatrix (int d_in = 0, int d_out = 0,
-                        float eigen_power = 0, bool random_rotation = false);
+    explicit PCAMatrix(
+            int d_in = 0,
+            int d_out = 0,
+            float eigen_power = 0,
+            bool random_rotation = false);
     /// train on n vectors. If n < d_in then the eigenvector matrix
     /// will be completed with 0s
     void train(idx_t n, const float* x) override;
     /// copy pre-trained PCA matrix
-    void copy_from (const PCAMatrix & other);
+    void copy_from(const PCAMatrix& other);
     /// called after mean, PCAMat and eigenvalues are computed
     void prepare_Ab();
 };
 /** ITQ implementation from
  *
  *     Iterative quantization: A procrustean approach to learning binary codes
@@ -187,25 +174,21 @@ struct PCAMatrix: LinearTransform {
  * PAMI'12.
  */
-struct ITQMatrix: LinearTransform {
+struct ITQMatrix : LinearTransform {
     int max_iter;
     int seed;
     // force initialization of the rotation (for debugging)
     std::vector<double> init_rotation;
-    explicit ITQMatrix (int d = 0);
+    explicit ITQMatrix(int d = 0);
-    void train (idx_t n, const float* x) override;
+    void train(idx_t n, const float* x) override;
 };
 /** The full ITQ transform, including normalizations and PCA transformation
  */
-struct ITQTransform: VectorTransform {
+struct ITQTransform : VectorTransform {
     std::vector<float> mean;
     bool do_pca;
     ITQMatrix itq;
@@ -216,15 +199,13 @@ struct ITQTransform: VectorTransform {
     // concatenation of PCA + ITQ transformation
     LinearTransform pca_then_itq;
-    explicit ITQTransform (int d_in = 0, int d_out = 0, bool do_pca = false);
-    void train (idx_t n, const float *x) override;
+    explicit ITQTransform(int d_in = 0, int d_out = 0, bool do_pca = false);
-    void apply_noalloc (idx_t n, const float* x, float* xt) const override;
+    void train(idx_t n, const float* x) override;
+    void apply_noalloc(idx_t n, const float* x, float* xt) const override;
 };
 struct ProductQuantizer;
 /** Applies a rotation to align the dimensions with a PQ to minimize
@@ -235,8 +216,7 @@ struct ProductQuantizer;
  * Tiezheng Ge, Kaiming He, Qifa Ke, Jian Sun, CVPR'13
  *
  */
-struct OPQMatrix: LinearTransform {
+struct OPQMatrix : LinearTransform {
     int M;          ///< nb of subquantizers
     int niter;      ///< Number of outer training iterations
     int niter_pq;   ///< Number of training iterations for the PQ
@@ -248,46 +228,43 @@ struct OPQMatrix: LinearTransform {
     /// if non-NULL, use this product quantizer for training
     /// should be constructed with (d_out, M, _)
-    ProductQuantizer * pq;
+    ProductQuantizer* pq;
     /// if d2 != -1, output vectors of this dimension
-    explicit OPQMatrix (int d = 0, int M = 1, int d2 = -1);
+    explicit OPQMatrix(int d = 0, int M = 1, int d2 = -1);
     void train(idx_t n, const float* x) override;
 };
 /** remap dimensions for intput vectors, possibly inserting 0s
  * strictly speaking this is also a linear transform but we don't want
  * to compute it with matrix multiplies */
-struct RemapDimensionsTransform: VectorTransform {
+struct RemapDimensionsTransform : VectorTransform {
     /// map from output dimension to input, size d_out
     /// -1 -> set output to 0
     std::vector<int> map;
-    RemapDimensionsTransform (int d_in, int d_out, const int *map);
+    RemapDimensionsTransform(int d_in, int d_out, const int* map);
     /// remap input to output, skipping or inserting dimensions as needed
     /// if uniform: distribute dimensions uniformly
     /// otherwise just take the d_out first ones.
-    RemapDimensionsTransform (int d_in, int d_out, bool uniform = true);
+    RemapDimensionsTransform(int d_in, int d_out, bool uniform = true);
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// reverse transform correct only when the mapping is a permutation
     void reverse_transform(idx_t n, const float* xt, float* x) const override;
-    RemapDimensionsTransform () {}
+    RemapDimensionsTransform() {}
 };
 /** per-vector normalization */
-struct NormalizationTransform: VectorTransform {
+struct NormalizationTransform : VectorTransform {
     float norm;
-    explicit NormalizationTransform (int d, float norm = 2.0);
-    NormalizationTransform ();
+    explicit NormalizationTransform(int d, float norm = 2.0);
+    NormalizationTransform();
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
@@ -296,12 +273,11 @@ struct NormalizationTransform: VectorTransform {
 };
 /** Subtract the mean of each component from the vectors. */
-struct CenteringTransform: VectorTransform {
+struct CenteringTransform : VectorTransform {
     /// Mean, size d_in = d_out
     std::vector<float> mean;
-    explicit CenteringTransform (int d = 0);
+    explicit CenteringTransform(int d = 0);
     /// train on n vectors.
     void train(idx_t n, const float* x) override;
@@ -310,13 +286,9 @@ struct CenteringTransform: VectorTransform {
     void apply_noalloc(idx_t n, const float* x, float* xt) const override;
     /// add the mean
-    void reverse_transform (idx_t n, const float * xt,
-                            float *x) const override;
+    void reverse_transform(idx_t n, const float* xt, float* x) const override;
 };
 } // namespace faiss
 #endif

data/vendor/faiss/faiss/clone_index.cpp CHANGED Viewed

@@ -14,22 +14,23 @@
 #include <faiss/impl/FaissAssert.h>
+#include <faiss/Index2Layer.h>
 #include <faiss/IndexFlat.h>
-#include <faiss/VectorTransform.h>
-#include <faiss/IndexPreTransform.h>
-#include <faiss/IndexLSH.h>
-#include <faiss/IndexPQ.h>
+#include <faiss/IndexHNSW.h>
 #include <faiss/IndexIVF.h>
+#include <faiss/IndexIVFFlat.h>
 #include <faiss/IndexIVFPQ.h>
 #include <faiss/IndexIVFPQR.h>
-#include <faiss/Index2Layer.h>
-#include <faiss/IndexIVFFlat.h>
 #include <faiss/IndexIVFSpectralHash.h>
-#include <faiss/MetaIndexes.h>
-#include <faiss/IndexScalarQuantizer.h>
-#include <faiss/IndexHNSW.h>
+#include <faiss/IndexLSH.h>
 #include <faiss/IndexLattice.h>
-#include <faiss/Index2Layer.h>
+#include <faiss/IndexNSG.h>
+#include <faiss/IndexPQ.h>
+#include <faiss/IndexPreTransform.h>
+#include <faiss/IndexResidual.h>
+#include <faiss/IndexScalarQuantizer.h>
+#include <faiss/MetaIndexes.h>
+#include <faiss/VectorTransform.h>
 namespace faiss {
@@ -37,111 +38,114 @@ namespace faiss {
  * cloning functions
  **************************************************************/
-Index * clone_index (const Index *index)
-{
+Index* clone_index(const Index* index) {
     Cloner cl;
-    return cl.clone_Index (index);
+    return cl.clone_Index(index);
 }
 // assumes there is a copy constructor ready. Always try from most
 // specific to most general. Most indexes don't have complicated
 // structs, the default copy constructor often just works.
-#define TRYCLONE(classname, obj) \
-    if (const classname *clo = dynamic_cast<const classname *>(obj)) { \
-        return new classname(*clo); \
+#define TRYCLONE(classname, obj)                                      \
+    if (const classname* clo = dynamic_cast<const classname*>(obj)) { \
+        return new classname(*clo);                                   \
     } else
-VectorTransform *Cloner::clone_VectorTransform (const VectorTransform *vt)
-{
-    TRYCLONE (RemapDimensionsTransform, vt)
-    TRYCLONE (OPQMatrix, vt)
-    TRYCLONE (PCAMatrix, vt)
-    TRYCLONE (ITQMatrix, vt)
-    TRYCLONE (RandomRotationMatrix, vt)
-    TRYCLONE (LinearTransform, vt)
-    {
-      FAISS_THROW_MSG("clone not supported for this type of VectorTransform");
+VectorTransform* Cloner::clone_VectorTransform(const VectorTransform* vt) {
+    TRYCLONE(RemapDimensionsTransform, vt)
+    TRYCLONE(OPQMatrix, vt)
+    TRYCLONE(PCAMatrix, vt)
+    TRYCLONE(ITQMatrix, vt)
+    TRYCLONE(RandomRotationMatrix, vt)
+    TRYCLONE(LinearTransform, vt) {
+        FAISS_THROW_MSG("clone not supported for this type of VectorTransform");
     }
     return nullptr;
 }
-IndexIVF * Cloner::clone_IndexIVF (const IndexIVF *ivf)
-{
-    TRYCLONE (IndexIVFPQR, ivf)
-    TRYCLONE (IndexIVFPQ, ivf)
-    TRYCLONE (IndexIVFFlat, ivf)
-    TRYCLONE (IndexIVFScalarQuantizer, ivf)
-    {
-      FAISS_THROW_MSG("clone not supported for this type of IndexIVF");
+IndexIVF* Cloner::clone_IndexIVF(const IndexIVF* ivf) {
+    TRYCLONE(IndexIVFPQR, ivf)
+    TRYCLONE(IndexIVFPQ, ivf)
+    TRYCLONE(IndexIVFFlat, ivf)
+    TRYCLONE(IndexIVFScalarQuantizer, ivf) {
+        FAISS_THROW_MSG("clone not supported for this type of IndexIVF");
     }
     return nullptr;
 }
-Index *Cloner::clone_Index (const Index *index)
-{
-    TRYCLONE (IndexPQ, index)
-    TRYCLONE (IndexLSH, index)
-    TRYCLONE (IndexFlatL2, index)
-    TRYCLONE (IndexFlatIP, index)
-    TRYCLONE (IndexFlat, index)
-    TRYCLONE (IndexLattice, index)
-    TRYCLONE (IndexScalarQuantizer, index)
-    TRYCLONE (MultiIndexQuantizer, index)
-    if (const IndexIVF * ivf = dynamic_cast<const IndexIVF*>(index)) {
-        IndexIVF *res = clone_IndexIVF (ivf);
+Index* Cloner::clone_Index(const Index* index) {
+    TRYCLONE(IndexPQ, index)
+    TRYCLONE(IndexLSH, index)
+    TRYCLONE(IndexFlatL2, index)
+    TRYCLONE(IndexFlatIP, index)
+    TRYCLONE(IndexFlat, index)
+    TRYCLONE(IndexLattice, index)
+    TRYCLONE(IndexResidual, index)
+    TRYCLONE(IndexScalarQuantizer, index)
+    TRYCLONE(MultiIndexQuantizer, index)
+    if (const IndexIVF* ivf = dynamic_cast<const IndexIVF*>(index)) {
+        IndexIVF* res = clone_IndexIVF(ivf);
         if (ivf->invlists == nullptr) {
             res->invlists = nullptr;
-        } else if (auto *ails = dynamic_cast<const ArrayInvertedLists*>
-                   (ivf->invlists)) {
+        } else if (
+                auto* ails = dynamic_cast<const ArrayInvertedLists*>(
+                        ivf->invlists)) {
             res->invlists = new ArrayInvertedLists(*ails);
             res->own_invlists = true;
         } else {
-            FAISS_THROW_MSG( "clone not supported for this type of inverted lists");
+            FAISS_THROW_MSG(
+                    "clone not supported for this type of inverted lists");
         }
         res->own_fields = true;
-        res->quantizer = clone_Index (ivf->quantizer);
+        res->quantizer = clone_Index(ivf->quantizer);
         return res;
-    } else if (const IndexPreTransform * ipt =
-               dynamic_cast<const IndexPreTransform*> (index)) {
-        IndexPreTransform *res = new IndexPreTransform ();
+    } else if (
+            const IndexPreTransform* ipt =
+                    dynamic_cast<const IndexPreTransform*>(index)) {
+        IndexPreTransform* res = new IndexPreTransform();
         res->d = ipt->d;
         res->ntotal = ipt->ntotal;
         res->is_trained = ipt->is_trained;
         res->metric_type = ipt->metric_type;
         res->metric_arg = ipt->metric_arg;
-        res->index = clone_Index (ipt->index);
+        res->index = clone_Index(ipt->index);
         for (int i = 0; i < ipt->chain.size(); i++)
-            res->chain.push_back (clone_VectorTransform (ipt->chain[i]));
+            res->chain.push_back(clone_VectorTransform(ipt->chain[i]));
         res->own_fields = true;
         return res;
-    } else if (const IndexIDMap *idmap =
-               dynamic_cast<const IndexIDMap*> (index)) {
-        IndexIDMap *res = new IndexIDMap (*idmap);
+    } else if (
+            const IndexIDMap* idmap = dynamic_cast<const IndexIDMap*>(index)) {
+        IndexIDMap* res = new IndexIDMap(*idmap);
         res->own_fields = true;
-        res->index = clone_Index (idmap->index);
+        res->index = clone_Index(idmap->index);
         return res;
-    } else if (const IndexHNSW *ihnsw =
-               dynamic_cast<const IndexHNSW*> (index)) {
-        IndexHNSW *res = new IndexHNSW (*ihnsw);
+    } else if (const IndexHNSW* ihnsw = dynamic_cast<const IndexHNSW*>(index)) {
+        IndexHNSW* res = new IndexHNSW(*ihnsw);
         res->own_fields = true;
-        res->storage = clone_Index (ihnsw->storage);
+        res->storage = clone_Index(ihnsw->storage);
         return res;
-    } else if (const Index2Layer *i2l =
-               dynamic_cast<const Index2Layer*> (index)) {
-        Index2Layer *res = new Index2Layer (*i2l);
+    } else if (const IndexNSG* insg = dynamic_cast<const IndexNSG*>(index)) {
+        IndexNSG* res = new IndexNSG(*insg);
+        // copy the dynamic allocated graph
+        auto& new_graph = res->nsg.final_graph;
+        auto& old_graph = insg->nsg.final_graph;
+        new_graph = std::make_shared<nsg::Graph<int>>(*old_graph);
+        res->own_fields = true;
+        res->storage = clone_Index(insg->storage);
+        return res;
+    } else if (
+            const Index2Layer* i2l = dynamic_cast<const Index2Layer*>(index)) {
+        Index2Layer* res = new Index2Layer(*i2l);
         res->q1.own_fields = true;
-        res->q1.quantizer = clone_Index (i2l->q1.quantizer);
+        res->q1.quantizer = clone_Index(i2l->q1.quantizer);
         return res;
     } else {
-        FAISS_THROW_MSG( "clone not supported for this type of Index");
+        FAISS_THROW_MSG("clone not supported for this type of Index");
     }
     return nullptr;
 }
 } // namespace faiss