RubyGems - faiss - Versions diffs - 0.1.7 → 0.2.3 - Mend

faiss 0.1.7 → 0.2.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +18 -0
data/README.md +7 -7
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +8 -2
data/ext/faiss/index.cpp +102 -69
data/ext/faiss/index_binary.cpp +24 -30
data/ext/faiss/kmeans.cpp +20 -16
data/ext/faiss/numo.hpp +867 -0
data/ext/faiss/pca_matrix.cpp +13 -14
data/ext/faiss/product_quantizer.cpp +23 -24
data/ext/faiss/utils.cpp +10 -37
data/ext/faiss/utils.h +2 -13
data/lib/faiss/version.rb +1 -1
data/lib/faiss.rb +0 -5
data/vendor/faiss/faiss/AutoTune.cpp +292 -291
data/vendor/faiss/faiss/AutoTune.h +55 -56
data/vendor/faiss/faiss/Clustering.cpp +334 -195
data/vendor/faiss/faiss/Clustering.h +88 -35
data/vendor/faiss/faiss/IVFlib.cpp +171 -195
data/vendor/faiss/faiss/IVFlib.h +48 -51
data/vendor/faiss/faiss/Index.cpp +85 -103
data/vendor/faiss/faiss/Index.h +54 -48
data/vendor/faiss/faiss/Index2Layer.cpp +139 -164
data/vendor/faiss/faiss/Index2Layer.h +22 -22
data/vendor/faiss/faiss/IndexBinary.cpp +45 -37
data/vendor/faiss/faiss/IndexBinary.h +140 -132
data/vendor/faiss/faiss/IndexBinaryFlat.cpp +73 -53
data/vendor/faiss/faiss/IndexBinaryFlat.h +29 -24
data/vendor/faiss/faiss/IndexBinaryFromFloat.cpp +46 -43
data/vendor/faiss/faiss/IndexBinaryFromFloat.h +16 -15
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +215 -232
data/vendor/faiss/faiss/IndexBinaryHNSW.h +25 -24
data/vendor/faiss/faiss/IndexBinaryHash.cpp +182 -177
data/vendor/faiss/faiss/IndexBinaryHash.h +41 -34
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +489 -461
data/vendor/faiss/faiss/IndexBinaryIVF.h +97 -68
data/vendor/faiss/faiss/IndexFlat.cpp +116 -147
data/vendor/faiss/faiss/IndexFlat.h +35 -46
data/vendor/faiss/faiss/IndexHNSW.cpp +372 -348
data/vendor/faiss/faiss/IndexHNSW.h +57 -41
data/vendor/faiss/faiss/IndexIVF.cpp +474 -454
data/vendor/faiss/faiss/IndexIVF.h +146 -113
data/vendor/faiss/faiss/IndexIVFFlat.cpp +248 -250
data/vendor/faiss/faiss/IndexIVFFlat.h +48 -51
data/vendor/faiss/faiss/IndexIVFPQ.cpp +457 -516
data/vendor/faiss/faiss/IndexIVFPQ.h +74 -66
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +406 -372
data/vendor/faiss/faiss/IndexIVFPQFastScan.h +82 -57
data/vendor/faiss/faiss/IndexIVFPQR.cpp +104 -102
data/vendor/faiss/faiss/IndexIVFPQR.h +33 -28
data/vendor/faiss/faiss/IndexIVFSpectralHash.cpp +125 -133
data/vendor/faiss/faiss/IndexIVFSpectralHash.h +19 -21
data/vendor/faiss/faiss/IndexLSH.cpp +75 -96
data/vendor/faiss/faiss/IndexLSH.h +21 -26
data/vendor/faiss/faiss/IndexLattice.cpp +42 -56
data/vendor/faiss/faiss/IndexLattice.h +11 -16
data/vendor/faiss/faiss/IndexNNDescent.cpp +231 -0
data/vendor/faiss/faiss/IndexNNDescent.h +72 -0
data/vendor/faiss/faiss/IndexNSG.cpp +303 -0
data/vendor/faiss/faiss/IndexNSG.h +85 -0
data/vendor/faiss/faiss/IndexPQ.cpp +405 -464
data/vendor/faiss/faiss/IndexPQ.h +64 -67
data/vendor/faiss/faiss/IndexPQFastScan.cpp +143 -170
data/vendor/faiss/faiss/IndexPQFastScan.h +46 -32
data/vendor/faiss/faiss/IndexPreTransform.cpp +120 -150
data/vendor/faiss/faiss/IndexPreTransform.h +33 -36
data/vendor/faiss/faiss/IndexRefine.cpp +115 -131
data/vendor/faiss/faiss/IndexRefine.h +22 -23
data/vendor/faiss/faiss/IndexReplicas.cpp +147 -153
data/vendor/faiss/faiss/IndexReplicas.h +62 -56
data/vendor/faiss/faiss/IndexResidual.cpp +291 -0
data/vendor/faiss/faiss/IndexResidual.h +152 -0
data/vendor/faiss/faiss/IndexScalarQuantizer.cpp +120 -155
data/vendor/faiss/faiss/IndexScalarQuantizer.h +41 -45
data/vendor/faiss/faiss/IndexShards.cpp +256 -240
data/vendor/faiss/faiss/IndexShards.h +85 -73
data/vendor/faiss/faiss/MatrixStats.cpp +112 -97
data/vendor/faiss/faiss/MatrixStats.h +7 -10
data/vendor/faiss/faiss/MetaIndexes.cpp +135 -157
data/vendor/faiss/faiss/MetaIndexes.h +40 -34
data/vendor/faiss/faiss/MetricType.h +7 -7
data/vendor/faiss/faiss/VectorTransform.cpp +652 -474
data/vendor/faiss/faiss/VectorTransform.h +61 -89
data/vendor/faiss/faiss/clone_index.cpp +77 -73
data/vendor/faiss/faiss/clone_index.h +4 -9
data/vendor/faiss/faiss/gpu/GpuAutoTune.cpp +33 -38
data/vendor/faiss/faiss/gpu/GpuAutoTune.h +11 -9
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +197 -170
data/vendor/faiss/faiss/gpu/GpuCloner.h +53 -35
data/vendor/faiss/faiss/gpu/GpuClonerOptions.cpp +12 -14
data/vendor/faiss/faiss/gpu/GpuClonerOptions.h +27 -25
data/vendor/faiss/faiss/gpu/GpuDistance.h +116 -112
data/vendor/faiss/faiss/gpu/GpuFaissAssert.h +1 -2
data/vendor/faiss/faiss/gpu/GpuIndex.h +134 -137
data/vendor/faiss/faiss/gpu/GpuIndexBinaryFlat.h +76 -73
data/vendor/faiss/faiss/gpu/GpuIndexFlat.h +173 -162
data/vendor/faiss/faiss/gpu/GpuIndexIVF.h +67 -64
data/vendor/faiss/faiss/gpu/GpuIndexIVFFlat.h +89 -86
data/vendor/faiss/faiss/gpu/GpuIndexIVFPQ.h +150 -141
data/vendor/faiss/faiss/gpu/GpuIndexIVFScalarQuantizer.h +101 -103
data/vendor/faiss/faiss/gpu/GpuIndicesOptions.h +17 -16
data/vendor/faiss/faiss/gpu/GpuResources.cpp +116 -128
data/vendor/faiss/faiss/gpu/GpuResources.h +182 -186
data/vendor/faiss/faiss/gpu/StandardGpuResources.cpp +433 -422
data/vendor/faiss/faiss/gpu/StandardGpuResources.h +131 -130
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.cpp +468 -456
data/vendor/faiss/faiss/gpu/impl/InterleavedCodes.h +25 -19
data/vendor/faiss/faiss/gpu/impl/RemapIndices.cpp +22 -20
data/vendor/faiss/faiss/gpu/impl/RemapIndices.h +9 -8
data/vendor/faiss/faiss/gpu/perf/IndexWrapper-inl.h +39 -44
data/vendor/faiss/faiss/gpu/perf/IndexWrapper.h +16 -14
data/vendor/faiss/faiss/gpu/perf/PerfClustering.cpp +77 -71
data/vendor/faiss/faiss/gpu/perf/PerfIVFPQAdd.cpp +109 -88
data/vendor/faiss/faiss/gpu/perf/WriteIndex.cpp +75 -64
data/vendor/faiss/faiss/gpu/test/TestCodePacking.cpp +230 -215
data/vendor/faiss/faiss/gpu/test/TestGpuIndexBinaryFlat.cpp +80 -86
data/vendor/faiss/faiss/gpu/test/TestGpuIndexFlat.cpp +284 -277
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFFlat.cpp +416 -416
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFPQ.cpp +611 -517
data/vendor/faiss/faiss/gpu/test/TestGpuIndexIVFScalarQuantizer.cpp +166 -164
data/vendor/faiss/faiss/gpu/test/TestGpuMemoryException.cpp +61 -53
data/vendor/faiss/faiss/gpu/test/TestUtils.cpp +274 -238
data/vendor/faiss/faiss/gpu/test/TestUtils.h +73 -57
data/vendor/faiss/faiss/gpu/test/demo_ivfpq_indexing_gpu.cpp +47 -50
data/vendor/faiss/faiss/gpu/utils/DeviceUtils.h +79 -72
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.cpp +140 -146
data/vendor/faiss/faiss/gpu/utils/StackDeviceMemory.h +69 -71
data/vendor/faiss/faiss/gpu/utils/StaticUtils.h +21 -16
data/vendor/faiss/faiss/gpu/utils/Timer.cpp +25 -29
data/vendor/faiss/faiss/gpu/utils/Timer.h +30 -29
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +270 -0
data/vendor/faiss/faiss/impl/AdditiveQuantizer.h +115 -0
data/vendor/faiss/faiss/impl/AuxIndexStructures.cpp +90 -120
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +81 -65
data/vendor/faiss/faiss/impl/FaissAssert.h +73 -58
data/vendor/faiss/faiss/impl/FaissException.cpp +56 -48
data/vendor/faiss/faiss/impl/FaissException.h +41 -29
data/vendor/faiss/faiss/impl/HNSW.cpp +595 -611
data/vendor/faiss/faiss/impl/HNSW.h +179 -200
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +672 -0
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.h +172 -0
data/vendor/faiss/faiss/impl/NNDescent.cpp +487 -0
data/vendor/faiss/faiss/impl/NNDescent.h +154 -0
data/vendor/faiss/faiss/impl/NSG.cpp +682 -0
data/vendor/faiss/faiss/impl/NSG.h +199 -0
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +484 -454
data/vendor/faiss/faiss/impl/PolysemousTraining.h +52 -55
data/vendor/faiss/faiss/impl/ProductQuantizer-inl.h +26 -47
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +469 -459
data/vendor/faiss/faiss/impl/ProductQuantizer.h +76 -87
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +448 -0
data/vendor/faiss/faiss/impl/ResidualQuantizer.h +130 -0
data/vendor/faiss/faiss/impl/ResultHandler.h +96 -132
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +648 -701
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +48 -46
data/vendor/faiss/faiss/impl/ThreadedIndex-inl.h +129 -131
data/vendor/faiss/faiss/impl/ThreadedIndex.h +61 -55
data/vendor/faiss/faiss/impl/index_read.cpp +547 -479
data/vendor/faiss/faiss/impl/index_write.cpp +497 -407
data/vendor/faiss/faiss/impl/io.cpp +75 -94
data/vendor/faiss/faiss/impl/io.h +31 -41
data/vendor/faiss/faiss/impl/io_macros.h +40 -29
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +137 -186
data/vendor/faiss/faiss/impl/lattice_Zn.h +40 -51
data/vendor/faiss/faiss/impl/platform_macros.h +29 -8
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +77 -124
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +39 -48
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +41 -52
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +80 -117
data/vendor/faiss/faiss/impl/simd_result_handlers.h +109 -137
data/vendor/faiss/faiss/index_factory.cpp +269 -218
data/vendor/faiss/faiss/index_factory.h +6 -7
data/vendor/faiss/faiss/index_io.h +23 -26
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +67 -75
data/vendor/faiss/faiss/invlists/BlockInvertedLists.h +22 -24
data/vendor/faiss/faiss/invlists/DirectMap.cpp +96 -112
data/vendor/faiss/faiss/invlists/DirectMap.h +29 -33
data/vendor/faiss/faiss/invlists/InvertedLists.cpp +307 -364
data/vendor/faiss/faiss/invlists/InvertedLists.h +151 -151
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.cpp +29 -34
data/vendor/faiss/faiss/invlists/InvertedListsIOHook.h +17 -18
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +257 -293
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.h +50 -45
data/vendor/faiss/faiss/python/python_callbacks.cpp +23 -26
data/vendor/faiss/faiss/python/python_callbacks.h +9 -16
data/vendor/faiss/faiss/utils/AlignedTable.h +79 -44
data/vendor/faiss/faiss/utils/Heap.cpp +40 -48
data/vendor/faiss/faiss/utils/Heap.h +186 -209
data/vendor/faiss/faiss/utils/WorkerThread.cpp +67 -76
data/vendor/faiss/faiss/utils/WorkerThread.h +32 -33
data/vendor/faiss/faiss/utils/distances.cpp +301 -310
data/vendor/faiss/faiss/utils/distances.h +133 -118
data/vendor/faiss/faiss/utils/distances_simd.cpp +456 -516
data/vendor/faiss/faiss/utils/extra_distances-inl.h +117 -0
data/vendor/faiss/faiss/utils/extra_distances.cpp +113 -232
data/vendor/faiss/faiss/utils/extra_distances.h +30 -29
data/vendor/faiss/faiss/utils/hamming-inl.h +260 -209
data/vendor/faiss/faiss/utils/hamming.cpp +375 -469
data/vendor/faiss/faiss/utils/hamming.h +62 -85
data/vendor/faiss/faiss/utils/ordered_key_value.h +16 -18
data/vendor/faiss/faiss/utils/partitioning.cpp +393 -318
data/vendor/faiss/faiss/utils/partitioning.h +26 -21
data/vendor/faiss/faiss/utils/quantize_lut.cpp +78 -66
data/vendor/faiss/faiss/utils/quantize_lut.h +22 -20
data/vendor/faiss/faiss/utils/random.cpp +39 -63
data/vendor/faiss/faiss/utils/random.h +13 -16
data/vendor/faiss/faiss/utils/simdlib.h +4 -2
data/vendor/faiss/faiss/utils/simdlib_avx2.h +88 -85
data/vendor/faiss/faiss/utils/simdlib_emulated.h +226 -165
data/vendor/faiss/faiss/utils/simdlib_neon.h +832 -0
data/vendor/faiss/faiss/utils/utils.cpp +304 -287
data/vendor/faiss/faiss/utils/utils.h +53 -48
metadata +26 -12
data/lib/faiss/index.rb +0 -20
data/lib/faiss/index_binary.rb +0 -20
data/lib/faiss/kmeans.rb +0 -15
data/lib/faiss/pca_matrix.rb +0 -15
data/lib/faiss/product_quantizer.rb +0 -22

data/vendor/faiss/faiss/gpu/GpuCloner.cpp CHANGED Viewed

@@ -5,51 +5,52 @@
  * LICENSE file in the root directory of this source tree.
  */
 #include <faiss/gpu/GpuCloner.h>
+#include <faiss/impl/FaissAssert.h>
 #include <typeinfo>
-#include <faiss/gpu/GpuIndex.h>
-#include <faiss/impl/FaissAssert.h>
-#include <faiss/index_io.h>
+#include <faiss/gpu/StandardGpuResources.h>
 #include <faiss/IndexFlat.h>
 #include <faiss/IndexIVF.h>
 #include <faiss/IndexIVFFlat.h>
-#include <faiss/IndexScalarQuantizer.h>
 #include <faiss/IndexIVFPQ.h>
-#include <faiss/IndexReplicas.h>
 #include <faiss/IndexPreTransform.h>
+#include <faiss/IndexReplicas.h>
+#include <faiss/IndexScalarQuantizer.h>
 #include <faiss/MetaIndexes.h>
+#include <faiss/gpu/GpuIndex.h>
 #include <faiss/gpu/GpuIndexFlat.h>
 #include <faiss/gpu/GpuIndexIVFFlat.h>
 #include <faiss/gpu/GpuIndexIVFPQ.h>
 #include <faiss/gpu/GpuIndexIVFScalarQuantizer.h>
 #include <faiss/gpu/utils/DeviceUtils.h>
+#include <faiss/impl/FaissAssert.h>
+#include <faiss/index_io.h>
-namespace faiss { namespace gpu {
+namespace faiss {
+namespace gpu {
 /**********************************************************
  * Cloning to CPU
  **********************************************************/
-void ToCPUCloner::merge_index(Index *dst, Index *src, bool successive_ids)
-{
-    if (auto ifl = dynamic_cast<IndexFlat *>(dst)) {
-        auto ifl2 = dynamic_cast<const IndexFlat *>(src);
+void ToCPUCloner::merge_index(Index* dst, Index* src, bool successive_ids) {
+    if (auto ifl = dynamic_cast<IndexFlat*>(dst)) {
+        auto ifl2 = dynamic_cast<const IndexFlat*>(src);
         FAISS_ASSERT(ifl2);
         FAISS_ASSERT(successive_ids);
         ifl->add(ifl2->ntotal, ifl2->xb.data());
-    } else if(auto ifl = dynamic_cast<IndexIVFFlat *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFFlat *>(src);
+    } else if (auto ifl = dynamic_cast<IndexIVFFlat*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFFlat*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
-    } else if(auto ifl = dynamic_cast<IndexIVFScalarQuantizer *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFScalarQuantizer *>(src);
+    } else if (auto ifl = dynamic_cast<IndexIVFScalarQuantizer*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFScalarQuantizer*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
-    } else if(auto ifl = dynamic_cast<IndexIVFPQ *>(dst)) {
-        auto ifl2 = dynamic_cast<IndexIVFPQ *>(src);
+    } else if (auto ifl = dynamic_cast<IndexIVFPQ*>(dst)) {
+        auto ifl2 = dynamic_cast<IndexIVFPQ*>(src);
         FAISS_ASSERT(ifl2);
         ifl->merge_from(*ifl2, successive_ids ? ifl->ntotal : 0);
     } else {
@@ -57,24 +58,22 @@ void ToCPUCloner::merge_index(Index *dst, Index *src, bool successive_ids)
     }
 }
-Index *ToCPUCloner::clone_Index(const Index *index)
-{
-    if(auto ifl = dynamic_cast<const GpuIndexFlat *>(index)) {
-        IndexFlat *res = new IndexFlat();
+Index* ToCPUCloner::clone_Index(const Index* index) {
+    if (auto ifl = dynamic_cast<const GpuIndexFlat*>(index)) {
+        IndexFlat* res = new IndexFlat();
         ifl->copyTo(res);
         return res;
-    } else if(auto ifl = dynamic_cast<const GpuIndexIVFFlat *>(index)) {
-        IndexIVFFlat *res = new IndexIVFFlat();
+    } else if (auto ifl = dynamic_cast<const GpuIndexIVFFlat*>(index)) {
+        IndexIVFFlat* res = new IndexIVFFlat();
         ifl->copyTo(res);
         return res;
-    } else if(auto ifl =
-              dynamic_cast<const GpuIndexIVFScalarQuantizer *>(index)) {
-        IndexIVFScalarQuantizer *res = new IndexIVFScalarQuantizer();
+    } else if (
+            auto ifl = dynamic_cast<const GpuIndexIVFScalarQuantizer*>(index)) {
+        IndexIVFScalarQuantizer* res = new IndexIVFScalarQuantizer();
         ifl->copyTo(res);
         return res;
-    } else if(auto ipq = dynamic_cast<const GpuIndexIVFPQ *>(index)) {
-        IndexIVFPQ *res = new IndexIVFPQ();
+    } else if (auto ipq = dynamic_cast<const GpuIndexIVFPQ*>(index)) {
+        IndexIVFPQ* res = new IndexIVFPQ();
         ipq->copyTo(res);
         return res;
@@ -82,17 +81,17 @@ Index *ToCPUCloner::clone_Index(const Index *index)
         // objective is to make a single component out of them
         // (inverse op of ToGpuClonerMultiple)
-    } else if(auto ish = dynamic_cast<const IndexShards *>(index)) {
+    } else if (auto ish = dynamic_cast<const IndexShards*>(index)) {
         int nshard = ish->count();
         FAISS_ASSERT(nshard > 0);
-        Index *res = clone_Index(ish->at(0));
-        for(int i = 1; i < ish->count(); i++) {
-            Index *res_i = clone_Index(ish->at(i));
+        Index* res = clone_Index(ish->at(0));
+        for (int i = 1; i < ish->count(); i++) {
+            Index* res_i = clone_Index(ish->at(i));
             merge_index(res, res_i, ish->successive_ids);
             delete res_i;
         }
         return res;
-    } else if(auto ipr = dynamic_cast<const IndexReplicas *>(index)) {
+    } else if (auto ipr = dynamic_cast<const IndexReplicas*>(index)) {
         // just clone one of the replicas
         FAISS_ASSERT(ipr->count() > 0);
         return clone_Index(ipr->at(0));
@@ -101,81 +100,97 @@ Index *ToCPUCloner::clone_Index(const Index *index)
     }
 }
-faiss::Index * index_gpu_to_cpu(const faiss::Index *gpu_index)
-{
+faiss::Index* index_gpu_to_cpu(const faiss::Index* gpu_index) {
     ToCPUCloner cl;
     return cl.clone_Index(gpu_index);
 }
 /**********************************************************
  * Cloning to 1 GPU
  **********************************************************/
-ToGpuCloner::ToGpuCloner(GpuResourcesProvider *prov, int device,
-                         const GpuClonerOptions &options):
-    GpuClonerOptions(options), provider(prov), device(device)
-{}
+ToGpuCloner::ToGpuCloner(
+        GpuResourcesProvider* prov,
+        int device,
+        const GpuClonerOptions& options)
+        : GpuClonerOptions(options), provider(prov), device(device) {}
-Index *ToGpuCloner::clone_Index(const Index *index)
-{
-    if(auto ifl = dynamic_cast<const IndexFlat *>(index)) {
+Index* ToGpuCloner::clone_Index(const Index* index) {
+    using idx_t = Index::idx_t;
+    if (auto ifl = dynamic_cast<const IndexFlat*>(index)) {
         GpuIndexFlatConfig config;
         config.device = device;
         config.useFloat16 = useFloat16;
         config.storeTransposed = storeTransposed;
         return new GpuIndexFlat(provider, ifl, config);
-    } else if(auto ifl = dynamic_cast<const faiss::IndexIVFFlat *>(index)) {
+    } else if (
+            dynamic_cast<const IndexScalarQuantizer*>(index) &&
+            static_cast<const IndexScalarQuantizer*>(index)->sq.qtype ==
+                    ScalarQuantizer::QT_fp16) {
+        GpuIndexFlatConfig config;
+        config.device = device;
+        config.useFloat16 = true;
+        GpuIndexFlat* gif = new GpuIndexFlat(
+                provider, index->d, index->metric_type, config);
+        // transfer data by blocks
+        idx_t bs = 1024 * 1024;
+        for (idx_t i0 = 0; i0 < index->ntotal; i0 += bs) {
+            idx_t i1 = std::min(i0 + bs, index->ntotal);
+            std::vector<float> buffer((i1 - i0) * index->d);
+            index->reconstruct_n(i0, i1 - i0, buffer.data());
+            gif->add(i1 - i0, buffer.data());
+        }
+        assert(gif->getNumVecs() == index->ntotal);
+        return gif;
+    } else if (auto ifl = dynamic_cast<const faiss::IndexIVFFlat*>(index)) {
         GpuIndexIVFFlatConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
         config.flatConfig.useFloat16 = useFloat16CoarseQuantizer;
         config.flatConfig.storeTransposed = storeTransposed;
-        GpuIndexIVFFlat *res =
-            new GpuIndexIVFFlat(provider,
-                                ifl->d,
-                                ifl->nlist,
-                                ifl->metric_type,
-                                config);
-        if(reserveVecs > 0 && ifl->ntotal == 0) {
+        GpuIndexIVFFlat* res = new GpuIndexIVFFlat(
+                provider, ifl->d, ifl->nlist, ifl->metric_type, config);
+        if (reserveVecs > 0 && ifl->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         res->copyFrom(ifl);
         return res;
-    } else if(auto ifl =
-              dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index)) {
+    } else if (
+            auto ifl = dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(
+                    index)) {
         GpuIndexIVFScalarQuantizerConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
         config.flatConfig.useFloat16 = useFloat16CoarseQuantizer;
         config.flatConfig.storeTransposed = storeTransposed;
-        GpuIndexIVFScalarQuantizer *res =
-            new GpuIndexIVFScalarQuantizer(provider,
-                                           ifl->d,
-                                           ifl->nlist,
-                                           ifl->sq.qtype,
-                                           ifl->metric_type,
-                                           ifl->by_residual,
-                                           config);
-        if(reserveVecs > 0 && ifl->ntotal == 0) {
+        GpuIndexIVFScalarQuantizer* res = new GpuIndexIVFScalarQuantizer(
+                provider,
+                ifl->d,
+                ifl->nlist,
+                ifl->sq.qtype,
+                ifl->metric_type,
+                ifl->by_residual,
+                config);
+        if (reserveVecs > 0 && ifl->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         res->copyFrom(ifl);
         return res;
-    } else if(auto ipq = dynamic_cast<const faiss::IndexIVFPQ *>(index)) {
-        if(verbose)
+    } else if (auto ipq = dynamic_cast<const faiss::IndexIVFPQ*>(index)) {
+        if (verbose) {
             printf("  IndexIVFPQ size %ld -> GpuIndexIVFPQ "
                    "indicesOptions=%d "
                    "usePrecomputed=%d useFloat16=%d reserveVecs=%ld\n",
-                   ipq->ntotal, indicesOptions, usePrecomputed,
-                   useFloat16, reserveVecs);
+                   ipq->ntotal,
+                   indicesOptions,
+                   usePrecomputed,
+                   useFloat16,
+                   reserveVecs);
+        }
         GpuIndexIVFPQConfig config;
         config.device = device;
         config.indicesOptions = indicesOptions;
@@ -184,154 +199,144 @@ Index *ToGpuCloner::clone_Index(const Index *index)
         config.useFloat16LookupTables = useFloat16;
         config.usePrecomputedTables = usePrecomputed;
-        GpuIndexIVFPQ *res = new GpuIndexIVFPQ(provider, ipq, config);
+        GpuIndexIVFPQ* res = new GpuIndexIVFPQ(provider, ipq, config);
-        if(reserveVecs > 0 && ipq->ntotal == 0) {
+        if (reserveVecs > 0 && ipq->ntotal == 0) {
             res->reserveMemory(reserveVecs);
         }
         return res;
     } else {
+        // default: use CPU cloner
         return Cloner::clone_Index(index);
     }
 }
-faiss::Index * index_cpu_to_gpu(
-       GpuResourcesProvider* provider, int device,
-       const faiss::Index *index,
-       const GpuClonerOptions *options)
-{
+faiss::Index* index_cpu_to_gpu(
+        GpuResourcesProvider* provider,
+        int device,
+        const faiss::Index* index,
+        const GpuClonerOptions* options) {
     GpuClonerOptions defaults;
     ToGpuCloner cl(provider, device, options ? *options : defaults);
     return cl.clone_Index(index);
 }
 /**********************************************************
  * Cloning to multiple GPUs
  **********************************************************/
 ToGpuClonerMultiple::ToGpuClonerMultiple(
-                        std::vector<GpuResourcesProvider *> & provider,
-                        std::vector<int>& devices,
-                        const GpuMultipleClonerOptions &options):
-    GpuMultipleClonerOptions(options)
-{
+        std::vector<GpuResourcesProvider*>& provider,
+        std::vector<int>& devices,
+        const GpuMultipleClonerOptions& options)
+        : GpuMultipleClonerOptions(options) {
     FAISS_ASSERT(provider.size() == devices.size());
-    for(int i = 0; i < provider.size(); i++) {
+    for (int i = 0; i < provider.size(); i++) {
         sub_cloners.push_back(ToGpuCloner(provider[i], devices[i], options));
     }
 }
 ToGpuClonerMultiple::ToGpuClonerMultiple(
-                        const std::vector<ToGpuCloner> & sub_cloners,
-                        const GpuMultipleClonerOptions &options):
-    GpuMultipleClonerOptions(options),
-    sub_cloners(sub_cloners)
-{}
-void ToGpuClonerMultiple::copy_ivf_shard (
-                         const IndexIVF *index_ivf, IndexIVF *idx2,
-                         long n, long i)
-{
+        const std::vector<ToGpuCloner>& sub_cloners,
+        const GpuMultipleClonerOptions& options)
+        : GpuMultipleClonerOptions(options), sub_cloners(sub_cloners) {}
+void ToGpuClonerMultiple::copy_ivf_shard(
+        const IndexIVF* index_ivf,
+        IndexIVF* idx2,
+        long n,
+        long i) {
     if (shard_type == 2) {
         long i0 = i * index_ivf->ntotal / n;
         long i1 = (i + 1) * index_ivf->ntotal / n;
-        if(verbose)
-            printf("IndexShards shard %ld indices %ld:%ld\n",
-                   i, i0, i1);
+        if (verbose)
+            printf("IndexShards shard %ld indices %ld:%ld\n", i, i0, i1);
         index_ivf->copy_subset_to(*idx2, 2, i0, i1);
         FAISS_ASSERT(idx2->ntotal == i1 - i0);
     } else if (shard_type == 1) {
-        if(verbose)
-            printf("IndexShards shard %ld select modulo %ld = %ld\n",
-                   i, n, i);
+        if (verbose)
+            printf("IndexShards shard %ld select modulo %ld = %ld\n", i, n, i);
         index_ivf->copy_subset_to(*idx2, 1, n, i);
     } else {
-        FAISS_THROW_FMT ("shard_type %d not implemented", shard_type);
+        FAISS_THROW_FMT("shard_type %d not implemented", shard_type);
     }
 }
-Index * ToGpuClonerMultiple::clone_Index_to_shards (const Index *index)
-{
+Index* ToGpuClonerMultiple::clone_Index_to_shards(const Index* index) {
     long n = sub_cloners.size();
-    auto index_ivfpq =
-        dynamic_cast<const faiss::IndexIVFPQ *>(index);
-    auto index_ivfflat =
-        dynamic_cast<const faiss::IndexIVFFlat *>(index);
+    auto index_ivfpq = dynamic_cast<const faiss::IndexIVFPQ*>(index);
+    auto index_ivfflat = dynamic_cast<const faiss::IndexIVFFlat*>(index);
     auto index_ivfsq =
-        dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index);
-    auto index_flat =
-        dynamic_cast<const faiss::IndexFlat *>(index);
-    FAISS_THROW_IF_NOT_MSG (
-        index_ivfpq || index_ivfflat || index_flat || index_ivfsq,
-        "IndexShards implemented only for "
-        "IndexIVFFlat, IndexIVFScalarQuantizer, "
-        "IndexFlat and IndexIVFPQ");
+            dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(index);
+    auto index_flat = dynamic_cast<const faiss::IndexFlat*>(index);
+    FAISS_THROW_IF_NOT_MSG(
+            index_ivfpq || index_ivfflat || index_flat || index_ivfsq,
+            "IndexShards implemented only for "
+            "IndexIVFFlat, IndexIVFScalarQuantizer, "
+            "IndexFlat and IndexIVFPQ");
     std::vector<faiss::Index*> shards(n);
-    for(long i = 0; i < n; i++) {
+    for (long i = 0; i < n; i++) {
         // make a shallow copy
-        if(reserveVecs)
-            sub_cloners[i].reserveVecs =
-                (reserveVecs + n - 1) / n;
+        if (reserveVecs)
+            sub_cloners[i].reserveVecs = (reserveVecs + n - 1) / n;
         if (index_ivfpq) {
             faiss::IndexIVFPQ idx2(
-                       index_ivfpq->quantizer, index_ivfpq->d,
-                       index_ivfpq->nlist, index_ivfpq->code_size,
-                       index_ivfpq->pq.nbits);
+                    index_ivfpq->quantizer,
+                    index_ivfpq->d,
+                    index_ivfpq->nlist,
+                    index_ivfpq->code_size,
+                    index_ivfpq->pq.nbits);
             idx2.metric_type = index_ivfpq->metric_type;
             idx2.pq = index_ivfpq->pq;
             idx2.nprobe = index_ivfpq->nprobe;
             idx2.use_precomputed_table = 0;
             idx2.is_trained = index->is_trained;
-            copy_ivf_shard (index_ivfpq, &idx2, n, i);
+            copy_ivf_shard(index_ivfpq, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_ivfflat) {
             faiss::IndexIVFFlat idx2(
-                       index_ivfflat->quantizer, index->d,
-                       index_ivfflat->nlist, index_ivfflat->metric_type);
+                    index_ivfflat->quantizer,
+                    index->d,
+                    index_ivfflat->nlist,
+                    index_ivfflat->metric_type);
             idx2.nprobe = index_ivfflat->nprobe;
             idx2.is_trained = index->is_trained;
-            copy_ivf_shard (index_ivfflat, &idx2, n, i);
+            copy_ivf_shard(index_ivfflat, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_ivfsq) {
             faiss::IndexIVFScalarQuantizer idx2(
-                       index_ivfsq->quantizer, index->d, index_ivfsq->nlist,
-                       index_ivfsq->sq.qtype,
-                       index_ivfsq->metric_type,
-                       index_ivfsq->by_residual);
+                    index_ivfsq->quantizer,
+                    index->d,
+                    index_ivfsq->nlist,
+                    index_ivfsq->sq.qtype,
+                    index_ivfsq->metric_type,
+                    index_ivfsq->by_residual);
             idx2.nprobe = index_ivfsq->nprobe;
             idx2.is_trained = index->is_trained;
             idx2.sq = index_ivfsq->sq;
-            copy_ivf_shard (index_ivfsq, &idx2, n, i);
+            copy_ivf_shard(index_ivfsq, &idx2, n, i);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
         } else if (index_flat) {
-            faiss::IndexFlat idx2 (
-                                   index->d, index->metric_type);
+            faiss::IndexFlat idx2(index->d, index->metric_type);
             shards[i] = sub_cloners[i].clone_Index(&idx2);
             if (index->ntotal > 0) {
                 long i0 = index->ntotal * i / n;
                 long i1 = index->ntotal * (i + 1) / n;
-                shards[i]->add (i1 - i0,
-                                index_flat->xb.data() + i0 * index->d);
+                shards[i]->add(i1 - i0, index_flat->xb.data() + i0 * index->d);
             }
         }
     }
     bool successive_ids = index_flat != nullptr;
-    faiss::IndexShards *res =
-        new faiss::IndexShards(index->d, true,
-                               successive_ids);
+    faiss::IndexShards* res =
+            new faiss::IndexShards(index->d, true, successive_ids);
     for (int i = 0; i < n; i++) {
         res->add_shard(shards[i]);
@@ -341,33 +346,32 @@ Index * ToGpuClonerMultiple::clone_Index_to_shards (const Index *index)
     return res;
 }
-Index *ToGpuClonerMultiple::clone_Index(const Index *index)
-{
+Index* ToGpuClonerMultiple::clone_Index(const Index* index) {
     long n = sub_cloners.size();
     if (n == 1)
         return sub_cloners[0].clone_Index(index);
-    if(dynamic_cast<const IndexFlat *>(index) ||
-       dynamic_cast<const faiss::IndexIVFFlat *>(index) ||
-       dynamic_cast<const faiss::IndexIVFScalarQuantizer *>(index) ||
-       dynamic_cast<const faiss::IndexIVFPQ *>(index)) {
-        if(!shard) {
-            IndexReplicas * res = new IndexReplicas();
-            for(auto & sub_cloner: sub_cloners) {
+    if (dynamic_cast<const IndexFlat*>(index) ||
+        dynamic_cast<const faiss::IndexIVFFlat*>(index) ||
+        dynamic_cast<const faiss::IndexIVFScalarQuantizer*>(index) ||
+        dynamic_cast<const faiss::IndexIVFPQ*>(index)) {
+        if (!shard) {
+            IndexReplicas* res = new IndexReplicas();
+            for (auto& sub_cloner : sub_cloners) {
                 res->addIndex(sub_cloner.clone_Index(index));
             }
             res->own_fields = true;
             return res;
         } else {
-            return clone_Index_to_shards (index);
+            return clone_Index_to_shards(index);
         }
-    } else if(auto miq = dynamic_cast<const MultiIndexQuantizer *>(index)) {
+    } else if (auto miq = dynamic_cast<const MultiIndexQuantizer*>(index)) {
         if (verbose) {
             printf("cloning MultiIndexQuantizer: "
                    "will be valid only for search k=1\n");
         }
-        const ProductQuantizer & pq = miq->pq;
-        IndexSplitVectors *splitv = new IndexSplitVectors(pq.d, true);
+        const ProductQuantizer& pq = miq->pq;
+        IndexSplitVectors* splitv = new IndexSplitVectors(pq.d, true);
         splitv->own_fields = true;
         for (int m = 0; m < pq.M; m++) {
@@ -377,12 +381,13 @@ Index *ToGpuClonerMultiple::clone_Index(const Index *index)
             long i1 = pq.M <= n ? (m + 1) * n / pq.M : i0 + 1;
             std::vector<ToGpuCloner> sub_cloners_2;
             sub_cloners_2.insert(
-                                 sub_cloners_2.begin(), sub_cloners.begin() + i0,
-                                 sub_cloners.begin() + i1);
+                    sub_cloners_2.begin(),
+                    sub_cloners.begin() + i0,
+                    sub_cloners.begin() + i1);
             ToGpuClonerMultiple cm(sub_cloners_2, *this);
-            IndexFlatL2 idxc (pq.dsub);
-            idxc.add (pq.ksub, pq.centroids.data() + m * pq.d * pq.ksub);
-            Index *idx2 = cm.clone_Index(&idxc);
+            IndexFlatL2 idxc(pq.dsub);
+            idxc.add(pq.ksub, pq.centroids.data() + m * pq.d * pq.ksub);
+            Index* idx2 = cm.clone_Index(&idxc);
             splitv->add_sub_index(idx2);
         }
         return splitv;
@@ -391,17 +396,39 @@ Index *ToGpuClonerMultiple::clone_Index(const Index *index)
     }
 }
-faiss::Index * index_cpu_to_gpu_multiple(
-       std::vector<GpuResourcesProvider*> & provider,
-       std::vector<int> &devices,
-       const faiss::Index *index,
-       const GpuMultipleClonerOptions *options)
-{
+faiss::Index* index_cpu_to_gpu_multiple(
+        std::vector<GpuResourcesProvider*>& provider,
+        std::vector<int>& devices,
+        const faiss::Index* index,
+        const GpuMultipleClonerOptions* options) {
     GpuMultipleClonerOptions defaults;
     ToGpuClonerMultiple cl(provider, devices, options ? *options : defaults);
     return cl.clone_Index(index);
 }
-} } // namespace
+GpuProgressiveDimIndexFactory::GpuProgressiveDimIndexFactory(int ngpu) {
+    FAISS_THROW_IF_NOT(ngpu >= 1);
+    devices.resize(ngpu);
+    vres.resize(ngpu);
+    for (int i = 0; i < ngpu; i++) {
+        vres[i] = new StandardGpuResources();
+        devices[i] = i;
+    }
+    ncall = 0;
+}
+GpuProgressiveDimIndexFactory::~GpuProgressiveDimIndexFactory() {
+    for (int i = 0; i < vres.size(); i++) {
+        delete vres[i];
+    }
+}
+Index* GpuProgressiveDimIndexFactory::operator()(int dim) {
+    IndexFlatL2 index(dim);
+    ncall++;
+    return index_cpu_to_gpu_multiple(vres, devices, &index, &options);
+}
+} // namespace gpu
+} // namespace faiss