RubyGems - faiss - Versions diffs - 0.2.0 → 0.2.4 - Mend

faiss 0.2.0 → 0.2.4

Files changed (215) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/LICENSE.txt +1 -1
data/README.md +7 -7
data/ext/faiss/extconf.rb +6 -3
data/ext/faiss/numo.hpp +4 -4
data/ext/faiss/utils.cpp +1 -1
data/ext/faiss/utils.h +1 -1
data/lib/faiss/version.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +365 -194
data/vendor/faiss/faiss/Clustering.h +102 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +126 -224
data/vendor/faiss/faiss/Index2Layer.h +22 -36
data/vendor/faiss/faiss/IndexAdditiveQuantizer.cpp +407 -0
data/vendor/faiss/faiss/IndexAdditiveQuantizer.h +195 -0
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +115 -176
data/vendor/faiss/faiss/IndexFlat.h +42 -59
data/vendor/faiss/faiss/IndexFlatCodes.cpp +67 -0
data/vendor/faiss/faiss/IndexFlatCodes.h +47 -0
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +545 -453
data/vendor/faiss/faiss/IndexIVF.h +169 -118
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.cpp +316 -0
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizer.h +121 -0
data/vendor/faiss/faiss/IndexIVFFlat.cpp +247 -252
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +459 -517
data/vendor/faiss/faiss/IndexIVFPQ.h +75 -67
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +163 -150
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +38 -25
data/vendor/faiss/faiss/IndexLSH.cpp +66 -113
data/vendor/faiss/faiss/IndexLSH.h +20 -38
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +229 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +301 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +387 -495
data/vendor/faiss/faiss/IndexPQ.h +64 -82
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +139 -127
data/vendor/faiss/faiss/IndexRefine.h +32 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +111 -172
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -59
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +654 -475
data/vendor/faiss/faiss/VectorTransform.h +64 -89
data/vendor/faiss/faiss/clone_index.cpp +78 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +198 -171
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIcmEncoder.h +60 -0
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +503 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +175 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +606 -617
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +855 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +244 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +679 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +758 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +188 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +647 -707
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +631 -480
data/vendor/faiss/faiss/impl/index_write.cpp +547 -407
data/vendor/faiss/faiss/impl/io.cpp +76 -95
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +60 -29
data/vendor/faiss/faiss/impl/kmeans1d.cpp +301 -0
data/vendor/faiss/faiss/impl/kmeans1d.h +48 -0
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +619 -397
data/vendor/faiss/faiss/index_factory.h +8 -6
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +305 -312
data/vendor/faiss/faiss/utils/distances.h +170 -122
data/vendor/faiss/faiss/utils/distances_simd.cpp +498 -508
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +54 -49
metadata +29 -4

data/vendor/faiss/faiss/gpu/GpuCloner.cpp CHANGED Viewed

@@ -5,51 +5,52 @@
  * LICENSE file in the root directory of this source tree.
  */
 #include <faiss/gpu/GpuCloner.h>
+#include <faiss/impl/FaissAssert.h>
 #include <typeinfo>
-#include <faiss/gpu/GpuIndex.h>
-#include <faiss/impl/FaissAssert.h>
-#include <faiss/index_io.h>
+#include <faiss/gpu/StandardGpuResources.h>
 #include <faiss/IndexFlat.h>
 #include <faiss/IndexIVF.h>
 #include <faiss/IndexIVFFlat.h>
-#include <faiss/IndexScalarQuantizer.h>
 #include <faiss/IndexIVFPQ.h>
-#include <faiss/IndexReplicas.h>
 #include <faiss/IndexPreTransform.h>
+#include <faiss/IndexReplicas.h>
+#include <faiss/IndexScalarQuantizer.h>
 #include <faiss/MetaIndexes.h>
+#include <faiss/gpu/GpuIndex.h>
 #include <faiss/gpu/GpuIndexFlat.h>
 #include <faiss/gpu/GpuIndexIVFFlat.h>
 #include <faiss/gpu/GpuIndexIVFPQ.h>
 #include <faiss/gpu/GpuIndexIVFScalarQuantizer.h>
 #include <faiss/gpu/utils/DeviceUtils.h>
+#include <faiss/impl/FaissAssert.h>
+#include <faiss/index_io.h>
-namespace faiss { namespace gpu {
+namespace faiss {
+namespace gpu {
 /**********************************************************
  * Cloning to CPU
  **********************************************************/
-void ToCPUCloner::merge_index(Index *dst, Index *src, bool successive_ids)
-{
-    if (auto ifl = dynamic_cast<IndexFlat *>(dst)) {
-        auto ifl2 = dynamic_cast<const IndexFlat *>(src);
+void ToCPUCloner::merge_index(Index* dst, Index* src, bool successive_ids) {
+    if (auto ifl = dynamic_cast<IndexFlat*>(dst)) {
+        auto ifl2 = dynamic_cast<const IndexFlat*>(src);
         FAISS_ASSERT(ifl2);
         FAISS_ASSERT(successive_ids);
-        ifl->add(ifl2->ntotal, ifl2->xb.data());
-    } else if(auto ifl = dynamic_cast<IndexIVFFlat *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFFlat *>(src);
+        ifl->add(ifl2->ntotal, ifl2->get_xb());
+    } else if (auto ifl = dynamic_cast<IndexIVFFlat*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFFlat*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
-    } else if(auto ifl = dynamic_cast<IndexIVFScalarQuantizer *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFScalarQuantizer *>(src);
+    } else if (auto ifl = dynamic_cast<IndexIVFScalarQuantizer*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFScalarQuantizer*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
-    } else if(auto ifl = dynamic_cast<IndexIVFPQ *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFPQ *>(src);
+    } else if (auto ifl = dynamic_cast<IndexIVFPQ*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFPQ*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
     } else {
@@ -57,24 +58,22 @@ void ToCPUCloner::merge_index(Index *dst, Index *src, bool successive_ids)
     }
 }
-Index *ToCPUCloner::clone_Index(const Index *index)
-{
-    if(auto ifl = dynamic_cast<const GpuIndexFlat *>(index)) {
-        IndexFlat *res = new IndexFlat();
+Index* ToCPUCloner::clone_Index(const Index* index) {
+    if (auto ifl = dynamic_cast<const GpuIndexFlat*>(index)) {
+        IndexFlat* res = new IndexFlat();
         ifl->copyTo(res);
         return res;
-    } else if(auto ifl = dynamic_cast<const GpuIndexIVFFlat *>(index)) {
-        IndexIVFFlat *res = new IndexIVFFlat();
+    } else if (auto ifl = dynamic_cast<const GpuIndexIVFFlat*>(index)) {
+        IndexIVFFlat* res = new IndexIVFFlat();
         ifl->copyTo(res);
         return res;
-    } else if(auto ifl =
-              dynamic_cast<const GpuIndexIVFScalarQuantizer *>(index)) {
-        IndexIVFScalarQuantizer *res = new IndexIVFScalarQuantizer();
+    } else if (
+            auto ifl = dynamic_cast<const GpuIndexIVFScalarQuantizer*>(index)) {
+        IndexIVFScalarQuantizer* res = new IndexIVFScalarQuantizer();
         ifl->copyTo(res);
         return res;
-    } else if(auto ipq = dynamic_cast<const GpuIndexIVFPQ *>(index)) {
-        IndexIVFPQ *res = new IndexIVFPQ();
+    } else if (auto ipq = dynamic_cast<const GpuIndexIVFPQ*>(index)) {
+        IndexIVFPQ* res = new IndexIVFPQ();
         ipq->copyTo(res);
         return res;
@@ -82,17 +81,17 @@ Index *ToCPUCloner::clone_Index(const Index *index)
         // objective is to make a single component out of them
         // (inverse op of ToGpuClonerMultiple)
-    } else if(auto ish = dynamic_cast<const IndexShards *>(index)) {
+    } else if (auto ish = dynamic_cast<const IndexShards*>(index)) {
         int nshard = ish->count();
         FAISS_ASSERT(nshard > 0);
-        Index *res = clone_Index(ish->at(0));
-        for(int i = 1; i < ish->count(); i++) {
-            Index *res_i = clone_Index(ish->at(i));
+        Index* res = clone_Index(ish->at(0));
+        for (int i = 1; i < ish->count(); i++) {
+            Index* res_i = clone_Index(ish->at(i));
             merge_index(res, res_i, ish->successive_ids);
             delete res_i;
         }
         return res;
-    } else if(auto ipr = dynamic_cast<const IndexReplicas *>(index)) {
+    } else if (auto ipr = dynamic_cast<const IndexReplicas*>(index)) {
         // just clone one of the replicas
         FAISS_ASSERT(ipr->count() > 0);
         return clone_Index(ipr->at(0));
@@ -101,81 +100,97 @@ Index *ToCPUCloner::clone_Index(const Index *index)
     }
 }
-faiss::Index * index_gpu_to_cpu(const faiss::Index *gpu_index)
-{
+faiss::Index* index_gpu_to_cpu(const faiss::Index* gpu_index) {
     ToCPUCloner cl;
     return cl.clone_Index(gpu_index);
 }
 /**********************************************************
  * Cloning to 1 GPU
  **********************************************************/
-ToGpuCloner::ToGpuCloner(GpuResourcesProvider *prov, int device,
-                         const GpuClonerOptions &options):
-    GpuClonerOptions(options), provider(prov), device(device)
-{}
+ToGpuCloner::ToGpuCloner(
+        GpuResourcesProvider* prov,
+        int device,
+        const GpuClonerOptions& options)
+        : GpuClonerOptions(options), provider(prov), device(device) {}
-Index *ToGpuCloner::clone_Index(const Index *index)
-{
-    if(auto ifl = dynamic_cast<const IndexFlat *>(index)) {
+Index* ToGpuCloner::clone_Index(const Index* index) {
+    using idx_t = Index::idx_t;
+    if (auto ifl = dynamic_cast<const IndexFlat*>(index)) {
         GpuIndexFlatConfig config;
         config.device = device;
         config.useFloat16 = useFloat16;
         config.storeTransposed = storeTransposed;
         return new GpuIndexFlat(provider, ifl, config);
-    } else if(auto ifl = dynamic_cast<const faiss::IndexIVFFlat *>(index)) {
+    } else if (
+            dynamic_cast<const IndexScalarQuantizer*>(index) &&
+            static_cast<const IndexScalarQuantizer*>(index)->sq.qtype ==
+                    ScalarQuantizer::QT_fp16) {
+        GpuIndexFlatConfig config;
+        config.device = device;
+        config.useFloat16 = true;
+        GpuIndexFlat* gif = new GpuIndexFlat(
+                provider, index->d, index->metric_type, config);
+        // transfer data by blocks
+        idx_t bs = 1024 * 1024;
+        for (idx_t i0 = 0; i0 < index->ntotal; i0 += bs) {
+            idx_t i1 = std::min(i0 + bs, index->ntotal);
+            std::vector<float> buffer((i1 - i0) * index->d);
+            index->reconstruct_n(i0, i1 - i0, buffer.data());
+            gif->add(i1 - i0, buffer.data());
+        }
+        assert(gif->getNumVecs() == index->ntotal);
+        return gif;
+    } else if (auto ifl = dynamic_cast<const faiss::IndexIVFFlat*>(index)) {
         GpuIndexIVFFlatConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
         config.flatConfig.useFloat16 = useFloat16CoarseQuantizer;
         config.flatConfig.storeTransposed = storeTransposed;
-        GpuIndexIVFFlat *res =
-            new GpuIndexIVFFlat(provider,
-                                ifl->d,
-                                ifl->nlist,
-                                ifl->metric_type,
-                                config);
-        if(reserveVecs > 0 && ifl->ntotal == 0) {
+        GpuIndexIVFFlat* res = new GpuIndexIVFFlat(
+                provider, ifl->d, ifl->nlist, ifl->metric_type, config);
+        if (reserveVecs > 0 && ifl->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         res->copyFrom(ifl);
         return res;
-    } else if(auto ifl =
-              dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index)) {
+    } else if (
+            auto ifl = dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(
+                    index)) {
         GpuIndexIVFScalarQuantizerConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
         config.flatConfig.useFloat16 = useFloat16CoarseQuantizer;
         config.flatConfig.storeTransposed = storeTransposed;
-        GpuIndexIVFScalarQuantizer *res =
-            new GpuIndexIVFScalarQuantizer(provider,
-                                           ifl->d,
-                                           ifl->nlist,
-                                           ifl->sq.qtype,
-                                           ifl->metric_type,
-                                           ifl->by_residual,
-                                           config);
-        if(reserveVecs > 0 && ifl->ntotal == 0) {
+        GpuIndexIVFScalarQuantizer* res = new GpuIndexIVFScalarQuantizer(
+                provider,
+                ifl->d,
+                ifl->nlist,
+                ifl->sq.qtype,
+                ifl->metric_type,
+                ifl->by_residual,
+                config);
+        if (reserveVecs > 0 && ifl->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         res->copyFrom(ifl);
         return res;
-    } else if(auto ipq = dynamic_cast<const faiss::IndexIVFPQ *>(index)) {
-        if(verbose)
+    } else if (auto ipq = dynamic_cast<const faiss::IndexIVFPQ*>(index)) {
+        if (verbose) {
             printf("  IndexIVFPQ size %ld -> GpuIndexIVFPQ "
                    "indicesOptions=%d "
                    "usePrecomputed=%d useFloat16=%d reserveVecs=%ld\n",
-                   ipq->ntotal, indicesOptions, usePrecomputed,
-                   useFloat16, reserveVecs);
+                   ipq->ntotal,
+                   indicesOptions,
+                   usePrecomputed,
+                   useFloat16,
+                   reserveVecs);
+        }
         GpuIndexIVFPQConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
@@ -184,154 +199,144 @@ Index *ToGpuCloner::clone_Index(const Index *index)
         config.useFloat16LookupTables = useFloat16;
         config.usePrecomputedTables = usePrecomputed;
-        GpuIndexIVFPQ *res = new GpuIndexIVFPQ(provider, ipq, config);
+        GpuIndexIVFPQ* res = new GpuIndexIVFPQ(provider, ipq, config);
-        if(reserveVecs > 0 && ipq->ntotal == 0) {
+        if (reserveVecs > 0 && ipq->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         return res;
     } else {
+        // default: use CPU cloner
         return Cloner::clone_Index(index);
     }
 }
-faiss::Index * index_cpu_to_gpu(
-       GpuResourcesProvider* provider, int device,
-       const faiss::Index *index,
-       const GpuClonerOptions *options)
-{
+faiss::Index* index_cpu_to_gpu(
+        GpuResourcesProvider* provider,
+        int device,
+        const faiss::Index* index,
+        const GpuClonerOptions* options) {
     GpuClonerOptions defaults;
     ToGpuCloner cl(provider, device, options ? *options : defaults);
     return cl.clone_Index(index);
 }
 /**********************************************************
  * Cloning to multiple GPUs
  **********************************************************/
 ToGpuClonerMultiple::ToGpuClonerMultiple(
-                        std::vector<GpuResourcesProvider *> & provider,
-                        std::vector<int>& devices,
-                        const GpuMultipleClonerOptions &options):
-    GpuMultipleClonerOptions(options)
-{
+        std::vector<GpuResourcesProvider*>& provider,
+        std::vector<int>& devices,
+        const GpuMultipleClonerOptions& options)
+        : GpuMultipleClonerOptions(options) {
     FAISS_ASSERT(provider.size() == devices.size());
-    for(int i = 0; i < provider.size(); i++) {
+    for (int i = 0; i < provider.size(); i++) {
         sub_cloners.push_back(ToGpuCloner(provider[i], devices[i], options));
     }
 }
 ToGpuClonerMultiple::ToGpuClonerMultiple(
-                        const std::vector<ToGpuCloner> & sub_cloners,
-                        const GpuMultipleClonerOptions &options):
-    GpuMultipleClonerOptions(options),
-    sub_cloners(sub_cloners)
-{}
-void ToGpuClonerMultiple::copy_ivf_shard (
-                         const IndexIVF *index_ivf, IndexIVF *idx2,
-                         long n, long i)
-{
+        const std::vector<ToGpuCloner>& sub_cloners,
+        const GpuMultipleClonerOptions& options)
+        : GpuMultipleClonerOptions(options), sub_cloners(sub_cloners) {}
+void ToGpuClonerMultiple::copy_ivf_shard(
+        const IndexIVF* index_ivf,
+        IndexIVF* idx2,
+        long n,
+        long i) {
     if (shard_type == 2) {
         long i0 = i * index_ivf->ntotal / n;
         long i1 = (i + 1) * index_ivf->ntotal / n;
-        if(verbose)
-            printf("IndexShards shard %ld indices %ld:%ld\n",
-                   i, i0, i1);
+        if (verbose)
+            printf("IndexShards shard %ld indices %ld:%ld\n", i, i0, i1);
         index_ivf->copy_subset_to(*idx2, 2, i0, i1);
         FAISS_ASSERT(idx2->ntotal == i1 - i0);
     } else if (shard_type == 1) {
-        if(verbose)
-            printf("IndexShards shard %ld select modulo %ld = %ld\n",
-                   i, n, i);
+        if (verbose)
+            printf("IndexShards shard %ld select modulo %ld = %ld\n", i, n, i);
         index_ivf->copy_subset_to(*idx2, 1, n, i);
     } else {
-        FAISS_THROW_FMT ("shard_type %d not implemented", shard_type);
+        FAISS_THROW_FMT("shard_type %d not implemented", shard_type);
     }
 }
-Index * ToGpuClonerMultiple::clone_Index_to_shards (const Index *index)
-{
+Index* ToGpuClonerMultiple::clone_Index_to_shards(const Index* index) {
     long n = sub_cloners.size();
-    auto index_ivfpq =
-        dynamic_cast<const faiss::IndexIVFPQ *>(index);
-    auto index_ivfflat =
-        dynamic_cast<const faiss::IndexIVFFlat *>(index);
+    auto index_ivfpq = dynamic_cast<const faiss::IndexIVFPQ*>(index);
+    auto index_ivfflat = dynamic_cast<const faiss::IndexIVFFlat*>(index);
     auto index_ivfsq =
-        dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index);
-    auto index_flat =
-        dynamic_cast<const faiss::IndexFlat *>(index);
-    FAISS_THROW_IF_NOT_MSG (
-        index_ivfpq || index_ivfflat || index_flat || index_ivfsq,
-        "IndexShards implemented only for "
-        "IndexIVFFlat, IndexIVFScalarQuantizer, "
-        "IndexFlat and IndexIVFPQ");
+            dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(index);
+    auto index_flat = dynamic_cast<const faiss::IndexFlat*>(index);
+    FAISS_THROW_IF_NOT_MSG(
+            index_ivfpq || index_ivfflat || index_flat || index_ivfsq,
+            "IndexShards implemented only for "
+            "IndexIVFFlat, IndexIVFScalarQuantizer, "
+            "IndexFlat and IndexIVFPQ");
     std::vector<faiss::Index*> shards(n);
-    for(long i = 0; i < n; i++) {
+    for (long i = 0; i < n; i++) {
         // make a shallow copy
-        if(reserveVecs)
-            sub_cloners[i].reserveVecs =
-                (reserveVecs + n - 1) / n;
+        if (reserveVecs)
+            sub_cloners[i].reserveVecs = (reserveVecs + n - 1) / n;
         if (index_ivfpq) {
             faiss::IndexIVFPQ idx2(
-                       index_ivfpq->quantizer, index_ivfpq->d,
-                       index_ivfpq->nlist, index_ivfpq->code_size,
-                       index_ivfpq->pq.nbits);
+                    index_ivfpq->quantizer,
+                    index_ivfpq->d,
+                    index_ivfpq->nlist,
+                    index_ivfpq->code_size,
+                    index_ivfpq->pq.nbits);
             idx2.metric_type = index_ivfpq->metric_type;
             idx2.pq = index_ivfpq->pq;
             idx2.nprobe = index_ivfpq->nprobe;
             idx2.use_precomputed_table = 0;
             idx2.is_trained = index->is_trained;
-            copy_ivf_shard (index_ivfpq, &idx2, n, i);
+            copy_ivf_shard(index_ivfpq, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_ivfflat) {
             faiss::IndexIVFFlat idx2(
-                       index_ivfflat->quantizer, index->d,
-                       index_ivfflat->nlist, index_ivfflat->metric_type);
+                    index_ivfflat->quantizer,
+                    index->d,
+                    index_ivfflat->nlist,
+                    index_ivfflat->metric_type);
             idx2.nprobe = index_ivfflat->nprobe;
             idx2.is_trained = index->is_trained;
-            copy_ivf_shard (index_ivfflat, &idx2, n, i);
+            copy_ivf_shard(index_ivfflat, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_ivfsq) {
             faiss::IndexIVFScalarQuantizer idx2(
-                       index_ivfsq->quantizer, index->d, index_ivfsq->nlist,
-                       index_ivfsq->sq.qtype,
-                       index_ivfsq->metric_type,
-                       index_ivfsq->by_residual);
+                    index_ivfsq->quantizer,
+                    index->d,
+                    index_ivfsq->nlist,
+                    index_ivfsq->sq.qtype,
+                    index_ivfsq->metric_type,
+                    index_ivfsq->by_residual);
             idx2.nprobe = index_ivfsq->nprobe;
             idx2.is_trained = index->is_trained;
             idx2.sq = index_ivfsq->sq;
-            copy_ivf_shard (index_ivfsq, &idx2, n, i);
+            copy_ivf_shard(index_ivfsq, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_flat) {
-            faiss::IndexFlat idx2 (
-                                   index->d, index->metric_type);
+            faiss::IndexFlat idx2(index->d, index->metric_type);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
             if (index->ntotal > 0) {
                 long i0 = index->ntotal * i / n;
                 long i1 = index->ntotal * (i + 1) / n;
-                shards[i]->add (i1 - i0,
-                                index_flat->xb.data() + i0 * index->d);
+                shards[i]->add(i1 - i0, index_flat->get_xb() + i0 * index->d);
             }
         }
     }
     bool successive_ids = index_flat != nullptr;
-    faiss::IndexShards *res =
-        new faiss::IndexShards(index->d, true,
-                               successive_ids);
+    faiss::IndexShards* res =
+            new faiss::IndexShards(index->d, true, successive_ids);
     for (int i = 0; i < n; i++) {
         res->add_shard(shards[i]);
@@ -341,33 +346,32 @@ Index * ToGpuClonerMultiple::clone_Index_to_shards (const Index *index)
     return res;
 }
-Index *ToGpuClonerMultiple::clone_Index(const Index *index)
-{
+Index* ToGpuClonerMultiple::clone_Index(const Index* index) {
     long n = sub_cloners.size();
     if (n == 1)
         return sub_cloners[0].clone_Index(index);
-    if(dynamic_cast<const IndexFlat *>(index) ||
-       dynamic_cast<const faiss::IndexIVFFlat *>(index) ||
-       dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index) ||
-       dynamic_cast<const faiss::IndexIVFPQ *>(index)) {
-        if(!shard) {
-            IndexReplicas * res = new IndexReplicas();
-            for(auto & sub_cloner: sub_cloners) {
+    if (dynamic_cast<const IndexFlat*>(index) ||
+        dynamic_cast<const faiss::IndexIVFFlat*>(index) ||
+        dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(index) ||
+        dynamic_cast<const faiss::IndexIVFPQ*>(index)) {
+        if (!shard) {
+            IndexReplicas* res = new IndexReplicas();
+            for (auto& sub_cloner : sub_cloners) {
                 res->addIndex(sub_cloner.clone_Index(index));
             }
             res->own_fields = true;
             return res;
         } else {
-            return clone_Index_to_shards (index);
+            return clone_Index_to_shards(index);
         }
-    } else if(auto miq = dynamic_cast<const MultiIndexQuantizer *>(index)) {
+    } else if (auto miq = dynamic_cast<const MultiIndexQuantizer*>(index)) {
         if (verbose) {
             printf("cloning MultiIndexQuantizer: "
                    "will be valid only for search k=1\n");
         }
-        const ProductQuantizer & pq = miq->pq;
-        IndexSplitVectors *splitv = new IndexSplitVectors(pq.d, true);
+        const ProductQuantizer& pq = miq->pq;
+        IndexSplitVectors* splitv = new IndexSplitVectors(pq.d, true);
         splitv->own_fields = true;
         for (int m = 0; m < pq.M; m++) {
@@ -377,12 +381,13 @@ Index *ToGpuClonerMultiple::clone_Index(const Index *index)
             long i1 = pq.M <= n ? (m + 1) * n / pq.M : i0 + 1;
             std::vector<ToGpuCloner> sub_cloners_2;
             sub_cloners_2.insert(
-                                 sub_cloners_2.begin(), sub_cloners.begin() + i0,
-                                 sub_cloners.begin() + i1);
+                    sub_cloners_2.begin(),
+                    sub_cloners.begin() + i0,
+                    sub_cloners.begin() + i1);
             ToGpuClonerMultiple cm(sub_cloners_2, *this);
-            IndexFlatL2 idxc (pq.dsub);
-            idxc.add (pq.ksub, pq.centroids.data() + m * pq.d * pq.ksub);
-            Index *idx2 = cm.clone_Index(&idxc);
+            IndexFlatL2 idxc(pq.dsub);
+            idxc.add(pq.ksub, pq.centroids.data() + m * pq.d * pq.ksub);
+            Index* idx2 = cm.clone_Index(&idxc);
             splitv->add_sub_index(idx2);
         }
         return splitv;
@@ -391,17 +396,39 @@ Index *ToGpuClonerMultiple::clone_Index(const Index *index)
     }
 }
-faiss::Index * index_cpu_to_gpu_multiple(
-       std::vector<GpuResourcesProvider*> & provider,
-       std::vector<int> &devices,
-       const faiss::Index *index,
-       const GpuMultipleClonerOptions *options)
-{
+faiss::Index* index_cpu_to_gpu_multiple(
+        std::vector<GpuResourcesProvider*>& provider,
+        std::vector<int>& devices,
+        const faiss::Index* index,
+        const GpuMultipleClonerOptions* options) {
     GpuMultipleClonerOptions defaults;
     ToGpuClonerMultiple cl(provider, devices, options ? *options : defaults);
     return cl.clone_Index(index);
 }
-} } // namespace
+GpuProgressiveDimIndexFactory::GpuProgressiveDimIndexFactory(int ngpu) {
+    FAISS_THROW_IF_NOT(ngpu >= 1);
+    devices.resize(ngpu);
+    vres.resize(ngpu);
+    for (int i = 0; i < ngpu; i++) {
+        vres[i] = new StandardGpuResources();
+        devices[i] = i;
+    }
+    ncall = 0;
+}
+GpuProgressiveDimIndexFactory::~GpuProgressiveDimIndexFactory() {
+    for (int i = 0; i < vres.size(); i++) {
+        delete vres[i];
+    }
+}
+Index* GpuProgressiveDimIndexFactory::operator()(int dim) {
+    IndexFlatL2 index(dim);
+    ncall++;
+    return index_cpu_to_gpu_multiple(vres, devices, &index, &options);
+}
+} // namespace gpu
+} // namespace faiss