RubyGems - faiss - Versions diffs - 0.5.2 → 0.6.0 - Mend

faiss 0.5.2 → 0.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (169) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/LICENSE.txt +1 -1
data/ext/faiss/ext.cpp +1 -1
data/ext/faiss/extconf.rb +5 -6
data/ext/faiss/index_binary.cpp +76 -17
data/ext/faiss/{index.cpp → index_rb.cpp} +108 -35
data/ext/faiss/kmeans.cpp +12 -9
data/ext/faiss/numo.hpp +11 -9
data/ext/faiss/pca_matrix.cpp +10 -8
data/ext/faiss/product_quantizer.cpp +14 -12
data/ext/faiss/{utils.cpp → utils_rb.cpp} +10 -3
data/ext/faiss/{utils.h → utils_rb.h} +6 -0
data/lib/faiss/version.rb +1 -1
data/lib/faiss.rb +1 -1
data/vendor/faiss/faiss/AutoTune.cpp +130 -11
data/vendor/faiss/faiss/AutoTune.h +14 -1
data/vendor/faiss/faiss/Clustering.cpp +59 -10
data/vendor/faiss/faiss/Clustering.h +12 -0
data/vendor/faiss/faiss/IVFlib.cpp +31 -28
data/vendor/faiss/faiss/Index.cpp +20 -8
data/vendor/faiss/faiss/Index.h +25 -3
data/vendor/faiss/faiss/IndexAdditiveQuantizer.cpp +19 -24
data/vendor/faiss/faiss/IndexBinary.cpp +1 -0
data/vendor/faiss/faiss/IndexBinaryHNSW.cpp +9 -4
data/vendor/faiss/faiss/IndexBinaryIVF.cpp +45 -11
data/vendor/faiss/faiss/IndexFastScan.cpp +35 -22
data/vendor/faiss/faiss/IndexFastScan.h +10 -1
data/vendor/faiss/faiss/IndexFlat.cpp +193 -136
data/vendor/faiss/faiss/IndexFlat.h +16 -1
data/vendor/faiss/faiss/IndexFlatCodes.cpp +46 -22
data/vendor/faiss/faiss/IndexFlatCodes.h +7 -1
data/vendor/faiss/faiss/IndexHNSW.cpp +24 -50
data/vendor/faiss/faiss/IndexHNSW.h +14 -12
data/vendor/faiss/faiss/IndexIDMap.cpp +1 -1
data/vendor/faiss/faiss/IndexIVF.cpp +76 -49
data/vendor/faiss/faiss/IndexIVF.h +14 -4
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizerFastScan.cpp +11 -8
data/vendor/faiss/faiss/IndexIVFAdditiveQuantizerFastScan.h +2 -2
data/vendor/faiss/faiss/IndexIVFFastScan.cpp +25 -14
data/vendor/faiss/faiss/IndexIVFFastScan.h +26 -22
data/vendor/faiss/faiss/IndexIVFFlat.cpp +10 -61
data/vendor/faiss/faiss/IndexIVFFlatPanorama.cpp +39 -111
data/vendor/faiss/faiss/IndexIVFPQ.cpp +89 -147
data/vendor/faiss/faiss/IndexIVFPQFastScan.cpp +37 -5
data/vendor/faiss/faiss/IndexIVFPQR.cpp +2 -1
data/vendor/faiss/faiss/IndexIVFRaBitQ.cpp +42 -30
data/vendor/faiss/faiss/IndexIVFRaBitQ.h +2 -2
data/vendor/faiss/faiss/IndexIVFRaBitQFastScan.cpp +246 -97
data/vendor/faiss/faiss/IndexIVFRaBitQFastScan.h +32 -29
data/vendor/faiss/faiss/IndexLSH.cpp +8 -6
data/vendor/faiss/faiss/IndexLattice.cpp +29 -24
data/vendor/faiss/faiss/IndexNNDescent.cpp +1 -0
data/vendor/faiss/faiss/IndexNSG.cpp +2 -1
data/vendor/faiss/faiss/IndexNSG.h +0 -2
data/vendor/faiss/faiss/IndexNeuralNetCodec.cpp +1 -1
data/vendor/faiss/faiss/IndexPQ.cpp +19 -10
data/vendor/faiss/faiss/IndexRaBitQ.cpp +26 -13
data/vendor/faiss/faiss/IndexRaBitQ.h +2 -2
data/vendor/faiss/faiss/IndexRaBitQFastScan.cpp +132 -78
data/vendor/faiss/faiss/IndexRaBitQFastScan.h +14 -12
data/vendor/faiss/faiss/IndexRefine.cpp +0 -30
data/vendor/faiss/faiss/IndexShards.cpp +3 -4
data/vendor/faiss/faiss/MetricType.h +16 -0
data/vendor/faiss/faiss/VectorTransform.cpp +120 -0
data/vendor/faiss/faiss/VectorTransform.h +23 -0
data/vendor/faiss/faiss/clone_index.cpp +7 -4
data/vendor/faiss/faiss/{cppcontrib/factory_tools.cpp → factory_tools.cpp} +1 -1
data/vendor/faiss/faiss/gpu/GpuCloner.cpp +1 -1
data/vendor/faiss/faiss/impl/AdditiveQuantizer.cpp +37 -11
data/vendor/faiss/faiss/impl/AuxIndexStructures.h +0 -28
data/vendor/faiss/faiss/impl/ClusteringInitialization.cpp +367 -0
data/vendor/faiss/faiss/impl/ClusteringInitialization.h +107 -0
data/vendor/faiss/faiss/impl/CodePacker.cpp +4 -0
data/vendor/faiss/faiss/impl/CodePacker.h +11 -3
data/vendor/faiss/faiss/impl/CodePackerRaBitQ.cpp +83 -0
data/vendor/faiss/faiss/impl/CodePackerRaBitQ.h +47 -0
data/vendor/faiss/faiss/impl/FaissAssert.h +60 -2
data/vendor/faiss/faiss/impl/HNSW.cpp +25 -34
data/vendor/faiss/faiss/impl/HNSW.h +8 -6
data/vendor/faiss/faiss/impl/LocalSearchQuantizer.cpp +34 -27
data/vendor/faiss/faiss/impl/NNDescent.cpp +1 -1
data/vendor/faiss/faiss/impl/NSG.cpp +6 -5
data/vendor/faiss/faiss/impl/NSG.h +17 -7
data/vendor/faiss/faiss/impl/Panorama.cpp +53 -46
data/vendor/faiss/faiss/impl/Panorama.h +22 -6
data/vendor/faiss/faiss/impl/PolysemousTraining.cpp +16 -5
data/vendor/faiss/faiss/impl/ProductQuantizer.cpp +70 -58
data/vendor/faiss/faiss/impl/RaBitQUtils.cpp +92 -0
data/vendor/faiss/faiss/impl/RaBitQUtils.h +93 -31
data/vendor/faiss/faiss/impl/RaBitQuantizer.cpp +12 -28
data/vendor/faiss/faiss/impl/RaBitQuantizer.h +3 -10
data/vendor/faiss/faiss/impl/RaBitQuantizerMultiBit.cpp +15 -41
data/vendor/faiss/faiss/impl/RaBitQuantizerMultiBit.h +0 -4
data/vendor/faiss/faiss/impl/ResidualQuantizer.cpp +14 -9
data/vendor/faiss/faiss/impl/ResultHandler.h +131 -50
data/vendor/faiss/faiss/impl/ScalarQuantizer.cpp +67 -2358
data/vendor/faiss/faiss/impl/ScalarQuantizer.h +0 -2
data/vendor/faiss/faiss/impl/VisitedTable.cpp +42 -0
data/vendor/faiss/faiss/impl/VisitedTable.h +69 -0
data/vendor/faiss/faiss/impl/expanded_scanners.h +158 -0
data/vendor/faiss/faiss/impl/index_read.cpp +829 -471
data/vendor/faiss/faiss/impl/index_read_utils.h +0 -1
data/vendor/faiss/faiss/impl/index_write.cpp +17 -8
data/vendor/faiss/faiss/impl/lattice_Zn.cpp +47 -20
data/vendor/faiss/faiss/impl/mapped_io.cpp +9 -2
data/vendor/faiss/faiss/impl/pq4_fast_scan.cpp +7 -2
data/vendor/faiss/faiss/impl/pq4_fast_scan.h +11 -3
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_1.cpp +19 -13
data/vendor/faiss/faiss/impl/pq4_fast_scan_search_qbs.cpp +29 -21
data/vendor/faiss/faiss/impl/{code_distance/code_distance-avx2.h → pq_code_distance/pq_code_distance-avx2.cpp} +42 -215
data/vendor/faiss/faiss/impl/{code_distance/code_distance-avx512.h → pq_code_distance/pq_code_distance-avx512.cpp} +68 -107
data/vendor/faiss/faiss/impl/pq_code_distance/pq_code_distance-generic.cpp +141 -0
data/vendor/faiss/faiss/impl/pq_code_distance/pq_code_distance-inl.h +23 -0
data/vendor/faiss/faiss/impl/{code_distance/code_distance-sve.h → pq_code_distance/pq_code_distance-sve.cpp} +57 -144
data/vendor/faiss/faiss/impl/residual_quantizer_encode_steps.cpp +9 -6
data/vendor/faiss/faiss/impl/scalar_quantizer/codecs.h +121 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/distance_computers.h +136 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/quantizers.h +280 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/scanners.h +164 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/similarities.h +94 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/sq-avx2.cpp +455 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/sq-avx512.cpp +430 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/sq-dispatch.h +329 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/sq-neon.cpp +467 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/training.cpp +203 -0
data/vendor/faiss/faiss/impl/scalar_quantizer/training.h +42 -0
data/vendor/faiss/faiss/impl/simd_dispatch.h +139 -0
data/vendor/faiss/faiss/impl/simd_result_handlers.h +18 -18
data/vendor/faiss/faiss/index_factory.cpp +35 -16
data/vendor/faiss/faiss/index_io.h +29 -3
data/vendor/faiss/faiss/invlists/BlockInvertedLists.cpp +7 -4
data/vendor/faiss/faiss/invlists/OnDiskInvertedLists.cpp +1 -1
data/vendor/faiss/faiss/svs/IndexSVSFaissUtils.h +9 -19
data/vendor/faiss/faiss/svs/IndexSVSFlat.h +2 -0
data/vendor/faiss/faiss/svs/IndexSVSVamana.h +2 -1
data/vendor/faiss/faiss/svs/IndexSVSVamanaLeanVec.cpp +9 -1
data/vendor/faiss/faiss/svs/IndexSVSVamanaLeanVec.h +9 -0
data/vendor/faiss/faiss/utils/Heap.cpp +46 -0
data/vendor/faiss/faiss/utils/Heap.h +21 -0
data/vendor/faiss/faiss/utils/NeuralNet.cpp +10 -7
data/vendor/faiss/faiss/utils/distances.cpp +141 -23
data/vendor/faiss/faiss/utils/distances.h +98 -0
data/vendor/faiss/faiss/utils/distances_dispatch.h +170 -0
data/vendor/faiss/faiss/utils/distances_simd.cpp +74 -3511
data/vendor/faiss/faiss/utils/extra_distances-inl.h +164 -157
data/vendor/faiss/faiss/utils/extra_distances.cpp +52 -95
data/vendor/faiss/faiss/utils/extra_distances.h +47 -1
data/vendor/faiss/faiss/utils/hamming_distance/generic-inl.h +0 -1
data/vendor/faiss/faiss/utils/partitioning.cpp +1 -1
data/vendor/faiss/faiss/utils/pq_code_distance.h +251 -0
data/vendor/faiss/faiss/utils/rabitq_simd.h +260 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_aarch64.cpp +150 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_arm_sve.cpp +568 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_autovec-inl.h +153 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_avx2.cpp +1185 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_avx512.cpp +1092 -0
data/vendor/faiss/faiss/utils/simd_impl/distances_sse-inl.h +391 -0
data/vendor/faiss/faiss/utils/simd_levels.cpp +322 -0
data/vendor/faiss/faiss/utils/simd_levels.h +91 -0
data/vendor/faiss/faiss/utils/simdlib_avx2.h +12 -1
data/vendor/faiss/faiss/utils/simdlib_avx512.h +69 -0
data/vendor/faiss/faiss/utils/simdlib_neon.h +6 -0
data/vendor/faiss/faiss/utils/sorting.cpp +4 -4
data/vendor/faiss/faiss/utils/utils.cpp +16 -9
metadata +47 -18
data/vendor/faiss/faiss/impl/code_distance/code_distance-generic.h +0 -81
data/vendor/faiss/faiss/impl/code_distance/code_distance.h +0 -186
/data/vendor/faiss/faiss/{cppcontrib/factory_tools.h → factory_tools.h} +0 -0

data/vendor/faiss/faiss/utils/extra_distances-inl.h CHANGED Viewed

@@ -12,217 +12,224 @@
 #include <faiss/MetricType.h>
 #include <faiss/impl/FaissAssert.h>
+#include <faiss/impl/simd_dispatch.h>
 #include <faiss/utils/distances.h>
 #include <cmath>
 #include <type_traits>
 namespace faiss {
+/***************************************************************************
+ * VectorDistance base class - contains common data members and type defs
+ **************************************************************************/
 template <MetricType mt>
-struct VectorDistance {
+struct VectorDistanceBase {
     size_t d;
     float metric_arg;
+    static constexpr MetricType metric = mt;
     static constexpr bool is_similarity = is_similarity_metric(mt);
-    inline float operator()(const float* x, const float* y) const;
-    // heap template to use for this type of metric
     using C = typename std::conditional<
             is_similarity_metric(mt),
             CMin<float, int64_t>,
             CMax<float, int64_t>>::type;
 };
-template <>
-inline float VectorDistance<METRIC_L2>::operator()(
-        const float* x,
-        const float* y) const {
-    return fvec_L2sqr(x, y, d);
-}
+/***************************************************************************
+ * VectorDistance struct template - specializations for each metric type
+ **************************************************************************/
-template <>
-inline float VectorDistance<METRIC_INNER_PRODUCT>::operator()(
-        const float* x,
-        const float* y) const {
-    return fvec_inner_product(x, y, d);
-}
+template <MetricType mt, SIMDLevel level>
+struct VectorDistance : VectorDistanceBase<mt> {
+    inline float operator()(const float* x, const float* y) const;
+};
-template <>
-inline float VectorDistance<METRIC_L1>::operator()(
-        const float* x,
-        const float* y) const {
-    return fvec_L1(x, y, d);
-}
+template <SIMDLevel level>
+struct VectorDistance<METRIC_L2, level> : VectorDistanceBase<METRIC_L2> {
+    inline float operator()(const float* x, const float* y) const {
+        return fvec_L2sqr<level>(x, y, this->d);
+    }
+};
-template <>
-inline float VectorDistance<METRIC_Linf>::operator()(
-        const float* x,
-        const float* y) const {
-    return fvec_Linf(x, y, d);
-    /*
-        float vmax = 0;
-        for (size_t i = 0; i < d; i++) {
-            float diff = fabs (x[i] - y[i]);
-            if (diff > vmax) vmax = diff;
-        }
-     return vmax;*/
-}
+template <SIMDLevel level>
+struct VectorDistance<METRIC_INNER_PRODUCT, level>
+        : VectorDistanceBase<METRIC_INNER_PRODUCT> {
+    inline float operator()(const float* x, const float* y) const {
+        return fvec_inner_product<level>(x, y, this->d);
+    }
+};
-template <>
-inline float VectorDistance<METRIC_Lp>::operator()(
-        const float* x,
-        const float* y) const {
-    float accu = 0;
-    for (size_t i = 0; i < d; i++) {
-        float diff = fabs(x[i] - y[i]);
-        accu += powf(diff, metric_arg);
+template <SIMDLevel level>
+struct VectorDistance<METRIC_L1, level> : VectorDistanceBase<METRIC_L1> {
+    inline float operator()(const float* x, const float* y) const {
+        return fvec_L1<level>(x, y, this->d);
     }
-    return accu;
-}
+};
-template <>
-inline float VectorDistance<METRIC_Canberra>::operator()(
-        const float* x,
-        const float* y) const {
-    float accu = 0;
-    for (size_t i = 0; i < d; i++) {
-        float xi = x[i], yi = y[i];
-        accu += fabs(xi - yi) / (fabs(xi) + fabs(yi));
+template <SIMDLevel level>
+struct VectorDistance<METRIC_Linf, level> : VectorDistanceBase<METRIC_Linf> {
+    inline float operator()(const float* x, const float* y) const {
+        return fvec_Linf<level>(x, y, this->d);
     }
-    return accu;
-}
+};
 template <>
-inline float VectorDistance<METRIC_BrayCurtis>::operator()(
-        const float* x,
-        const float* y) const {
-    float accu_num = 0, accu_den = 0;
-    for (size_t i = 0; i < d; i++) {
-        float xi = x[i], yi = y[i];
-        accu_num += fabs(xi - yi);
-        accu_den += fabs(xi + yi);
+struct VectorDistance<METRIC_Lp, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_Lp> {
+    inline float operator()(const float* x, const float* y) const {
+        float accu = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            float diff = fabs(x[i] - y[i]);
+            accu += powf(diff, this->metric_arg);
+        }
+        return accu;
     }
-    return accu_num / accu_den;
-}
+};
 template <>
-inline float VectorDistance<METRIC_JensenShannon>::operator()(
-        const float* x,
-        const float* y) const {
-    float accu = 0;
-    for (size_t i = 0; i < d; i++) {
-        float xi = x[i], yi = y[i];
-        float mi = 0.5 * (xi + yi);
-        float kl1 = -xi * log(mi / xi);
-        float kl2 = -yi * log(mi / yi);
-        accu += kl1 + kl2;
+struct VectorDistance<METRIC_Canberra, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_Canberra> {
+    inline float operator()(const float* x, const float* y) const {
+        float accu = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            float xi = x[i], yi = y[i];
+            accu += fabs(xi - yi) / (fabs(xi) + fabs(yi));
+        }
+        return accu;
     }
-    return 0.5 * accu;
-}
+};
 template <>
-inline float VectorDistance<METRIC_Jaccard>::operator()(
-        const float* x,
-        const float* y) const {
-    // WARNING: this distance is defined only for positive input vectors.
-    // Providing vectors with negative values would lead to incorrect results.
-    float accu_num = 0, accu_den = 0;
-    for (size_t i = 0; i < d; i++) {
-        accu_num += fmin(x[i], y[i]);
-        accu_den += fmax(x[i], y[i]);
+struct VectorDistance<METRIC_BrayCurtis, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_BrayCurtis> {
+    inline float operator()(const float* x, const float* y) const {
+        float accu_num = 0, accu_den = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            float xi = x[i], yi = y[i];
+            accu_num += fabs(xi - yi);
+            accu_den += fabs(xi + yi);
+        }
+        return accu_num / accu_den;
     }
-    return accu_num / accu_den;
-}
+};
 template <>
-inline float VectorDistance<METRIC_NaNEuclidean>::operator()(
-        const float* x,
-        const float* y) const {
-    // https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.nan_euclidean_distances.html
-    float accu = 0;
-    size_t present = 0;
-    for (size_t i = 0; i < d; i++) {
-        if (!std::isnan(x[i]) && !std::isnan(y[i])) {
-            float diff = x[i] - y[i];
-            accu += diff * diff;
-            present++;
+struct VectorDistance<METRIC_JensenShannon, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_JensenShannon> {
+    inline float operator()(const float* x, const float* y) const {
+        float accu = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            float xi = x[i], yi = y[i];
+            float mi = 0.5 * (xi + yi);
+            float kl1 = -xi * log(mi / xi);
+            float kl2 = -yi * log(mi / yi);
+            accu += kl1 + kl2;
         }
+        return 0.5 * accu;
     }
-    if (present == 0) {
-        return NAN;
+};
+template <>
+struct VectorDistance<METRIC_Jaccard, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_Jaccard> {
+    inline float operator()(const float* x, const float* y) const {
+        // WARNING: this distance is defined only for positive input vectors.
+        // Providing vectors with negative values would lead to incorrect
+        // results.
+        float accu_num = 0, accu_den = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            accu_num += fmin(x[i], y[i]);
+            accu_den += fmax(x[i], y[i]);
+        }
+        return accu_num / accu_den;
     }
-    return float(d) / float(present) * accu;
-}
+};
 template <>
-inline float VectorDistance<METRIC_GOWER>::operator()(
-        const float* x,
-        const float* y) const {
-    float accu = 0;
-    size_t valid_dims = 0;
-    for (size_t i = 0; i < d; i++) {
-        if (std::isnan(x[i]) || std::isnan(y[i])) {
-            continue;
+struct VectorDistance<METRIC_NaNEuclidean, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_NaNEuclidean> {
+    inline float operator()(const float* x, const float* y) const {
+        // https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.nan_euclidean_distances.html
+        float accu = 0;
+        size_t present = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            if (!std::isnan(x[i]) && !std::isnan(y[i])) {
+                float diff = x[i] - y[i];
+                accu += diff * diff;
+                present++;
+            }
+        }
+        if (present == 0) {
+            return NAN;
         }
+        return float(this->d) / float(present) * accu;
+    }
+};
-        if (x[i] >= 0 && y[i] >= 0) {
-            if (x[i] > 1 || y[i] > 1) {
+template <>
+struct VectorDistance<METRIC_GOWER, SIMDLevel::NONE>
+        : VectorDistanceBase<METRIC_GOWER> {
+    inline float operator()(const float* x, const float* y) const {
+        float accu = 0;
+        size_t valid_dims = 0;
+        for (size_t i = 0; i < this->d; i++) {
+            if (std::isnan(x[i]) || std::isnan(y[i])) {
+                continue;
+            }
+            if (x[i] >= 0 && y[i] >= 0) {
+                if (x[i] > 1 || y[i] > 1) {
+                    return std::numeric_limits<float>::quiet_NaN();
+                }
+                accu += fabs(x[i] - y[i]);
+            } else if (x[i] < 0 && y[i] < 0) {
+                accu += float(int(x[i] != y[i]));
+            } else {
                 return std::numeric_limits<float>::quiet_NaN();
             }
-            // Numeric dimensions are in [0,1]
-            accu += fabs(x[i] - y[i]);
-        } else if (x[i] < 0 && y[i] < 0) {
-            // Categorical dimensions are negative values
-            accu += float(int(x[i] != y[i]));
-        } else {
-            // Invalid representation
-            return std::numeric_limits<float>::quiet_NaN();
+            valid_dims++;
         }
-        valid_dims++;
-    }
-    if (valid_dims == 0) {
-        return std::numeric_limits<float>::quiet_NaN();
+        if (valid_dims == 0) {
+            return std::numeric_limits<float>::quiet_NaN();
+        }
+        return accu / valid_dims;
     }
-    return accu / valid_dims;
-}
+};
 /***************************************************************************
- * Dispatching function that takes a metric type and a consumer object
- * the consumer object should contain a return type T and a operation template
- * function f() that is called to perform the operation. The first argument
- * of the function is the VectorDistance object. The rest are passed in as is.
+ * Dispatching function that takes a lambda directly.
+ * The lambda should be templated on VectorDistance, eg.:
+ *
+ *   auto result = with_VectorDistance(
+ *       metric, metric_arg, [&]<class VD>(VD vd) {
+ *           return vd(x, y);
+ *       });
  **************************************************************************/
-template <class Consumer, class... Types>
-typename Consumer::T dispatch_VectorDistance(
+template <typename LambdaType>
+auto with_VectorDistance(
         size_t d,
         MetricType metric,
         float metric_arg,
-        Consumer& consumer,
-        Types... args) {
-    switch (metric) {
-#define DISPATCH_VD(mt)                                              \
-    case mt: {                                                       \
-        VectorDistance<mt> vd = {d, metric_arg};                     \
-        return consumer.template f<VectorDistance<mt>>(vd, args...); \
-    }
-        DISPATCH_VD(METRIC_INNER_PRODUCT);
-        DISPATCH_VD(METRIC_L2);
-        DISPATCH_VD(METRIC_L1);
-        DISPATCH_VD(METRIC_Linf);
-        DISPATCH_VD(METRIC_Lp);
-        DISPATCH_VD(METRIC_Canberra);
-        DISPATCH_VD(METRIC_BrayCurtis);
-        DISPATCH_VD(METRIC_JensenShannon);
-        DISPATCH_VD(METRIC_Jaccard);
-        DISPATCH_VD(METRIC_NaNEuclidean);
-        DISPATCH_VD(METRIC_GOWER);
-        default:
-            FAISS_THROW_FMT("Invalid metric %d", metric);
-    }
-#undef DISPATCH_VD
+        LambdaType&& action) {
+    auto dispatch_metric = [&]<MetricType mt>() {
+        auto call = [&]<SIMDLevel level>() {
+            VectorDistance<mt, level> vd = {d, metric_arg};
+            return action(vd);
+        };
+        constexpr bool has_simd = mt == METRIC_INNER_PRODUCT ||
+                mt == METRIC_L2 || mt == METRIC_L1 || mt == METRIC_Linf;
+        if constexpr (!has_simd) {
+            return call.template operator()<SIMDLevel::NONE>();
+        } else {
+            DISPATCH_SIMDLevel(call.template operator());
+        }
+    };
+    return with_metric_type(metric, dispatch_metric);
 }
 } // namespace faiss

data/vendor/faiss/faiss/utils/extra_distances.cpp CHANGED Viewed

@@ -11,10 +11,10 @@
 #include <omp.h>
 #include <algorithm>
-#include <cmath>
 #include <faiss/impl/AuxIndexStructures.h>
 #include <faiss/impl/DistanceComputer.h>
+#include <faiss/impl/IDSelector.h>
 #include <faiss/utils/utils.h>
 namespace faiss {
@@ -25,78 +25,6 @@ namespace faiss {
 namespace {
-struct Run_pairwise_extra_distances {
-    using T = void;
-    template <class VD>
-    void f(VD vd,
-           int64_t nq,
-           const float* xq,
-           int64_t nb,
-           const float* xb,
-           float* dis,
-           int64_t ldq,
-           int64_t ldb,
-           int64_t ldd) {
-#pragma omp parallel for if (nq > 10)
-        for (int64_t i = 0; i < nq; i++) {
-            const float* xqi = xq + i * ldq;
-            const float* xbj = xb;
-            float* disi = dis + ldd * i;
-            for (int64_t j = 0; j < nb; j++) {
-                disi[j] = vd(xqi, xbj);
-                xbj += ldb;
-            }
-        }
-    }
-};
-struct Run_knn_extra_metrics {
-    using T = void;
-    template <class VD>
-    void f(VD vd,
-           const float* x,
-           const float* y,
-           size_t nx,
-           size_t ny,
-           size_t k,
-           float* distances,
-           int64_t* labels) {
-        size_t d = vd.d;
-        using C = typename VD::C;
-        size_t check_period = InterruptCallback::get_period_hint(ny * d);
-        check_period *= omp_get_max_threads();
-        for (size_t i0 = 0; i0 < nx; i0 += check_period) {
-            size_t i1 = std::min(i0 + check_period, nx);
-#pragma omp parallel for
-            for (int64_t i = i0; i < i1; i++) {
-                const float* x_i = x + i * d;
-                const float* y_j = y;
-                size_t j;
-                float* simi = distances + k * i;
-                int64_t* idxi = labels + k * i;
-                // maxheap_heapify(k, simi, idxi);
-                heap_heapify<C>(k, simi, idxi);
-                for (j = 0; j < ny; j++) {
-                    float disij = vd(x_i, y_j);
-                    if (C::cmp(simi[0], disij)) {
-                        heap_replace_top<C>(k, simi, idxi, disij, j);
-                    }
-                    y_j += d;
-                }
-                // maxheap_reorder(k, simi, idxi);
-                heap_reorder<C>(k, simi, idxi);
-            }
-            InterruptCallback::check();
-        }
-    }
-};
 template <class VD>
 struct ExtraDistanceComputer : FlatCodesDistanceComputer {
     VD vd;
@@ -128,19 +56,6 @@ struct ExtraDistanceComputer : FlatCodesDistanceComputer {
     }
 };
-struct Run_get_distance_computer {
-    using T = FlatCodesDistanceComputer*;
-    template <class VD>
-    FlatCodesDistanceComputer* f(
-            VD vd,
-            const float* xb,
-            size_t nb,
-            const float* q = nullptr) {
-        return new ExtraDistanceComputer<VD>(vd, xb, nb, q);
-    }
-};
 } // anonymous namespace
 void pairwise_extra_distances(
@@ -168,9 +83,19 @@ void pairwise_extra_distances(
         ldd = nb;
     }
-    Run_pairwise_extra_distances run;
-    dispatch_VectorDistance(
-            d, mt, metric_arg, run, nq, xq, nb, xb, dis, ldq, ldb, ldd);
+    with_VectorDistance(d, mt, metric_arg, [&](auto vd) {
+#pragma omp parallel for if (nq > 10)
+        for (int64_t i = 0; i < nq; i++) {
+            const float* xqi = xq + i * ldq;
+            const float* xbj = xb;
+            float* disi = dis + ldd * i;
+            for (int64_t j = 0; j < nb; j++) {
+                disi[j] = vd(xqi, xbj);
+                xbj += ldb;
+            }
+        }
+    });
 }
 void knn_extra_metrics(
@@ -183,10 +108,40 @@ void knn_extra_metrics(
         float metric_arg,
         size_t k,
         float* distances,
-        int64_t* indexes) {
-    Run_knn_extra_metrics run;
-    dispatch_VectorDistance(
-            d, mt, metric_arg, run, x, y, nx, ny, k, distances, indexes);
+        int64_t* indexes,
+        const IDSelector* sel) {
+    with_VectorDistance(d, mt, metric_arg, [&](auto vd) {
+        using C = typename decltype(vd)::C;
+        size_t check_period = InterruptCallback::get_period_hint(ny * d);
+        check_period *= omp_get_max_threads();
+        for (size_t i0 = 0; i0 < nx; i0 += check_period) {
+            size_t i1 = std::min(i0 + check_period, nx);
+#pragma omp parallel for
+            for (int64_t i = i0; i < i1; i++) {
+                const float* x_i = x + i * d;
+                const float* y_j = y;
+                size_t j;
+                float* simi = distances + k * i;
+                int64_t* idxi = indexes + k * i;
+                heap_heapify<C>(k, simi, idxi);
+                for (j = 0; j < ny; j++) {
+                    if (!sel || sel->is_member(j)) {
+                        float disij = vd(x_i, y_j);
+                        if (C::cmp(simi[0], disij)) {
+                            heap_replace_top<C>(k, simi, idxi, disij, j);
+                        }
+                    }
+                    y_j += d;
+                }
+                heap_reorder<C>(k, simi, idxi);
+            }
+            InterruptCallback::check();
+        }
+    });
 }
 FlatCodesDistanceComputer* get_extra_distance_computer(
@@ -195,8 +150,10 @@ FlatCodesDistanceComputer* get_extra_distance_computer(
         float metric_arg,
         size_t nb,
         const float* xb) {
-    Run_get_distance_computer run;
-    return dispatch_VectorDistance(d, mt, metric_arg, run, xb, nb);
+    return with_VectorDistance(
+            d, mt, metric_arg, [&](auto vd) -> FlatCodesDistanceComputer* {
+                return new ExtraDistanceComputer<decltype(vd)>(vd, xb, nb);
+            });
 }
 } // namespace faiss

data/vendor/faiss/faiss/utils/extra_distances.h CHANGED Viewed

@@ -13,6 +13,7 @@
 #include <stdint.h>
 #include <faiss/Index.h>
+#include <faiss/impl/IDSelector.h>
 #include <faiss/utils/Heap.h>
@@ -43,7 +44,8 @@ void knn_extra_metrics(
         float metric_arg,
         size_t k,
         float* distances,
-        int64_t* indexes);
+        int64_t* indexes,
+        const IDSelector* sel = nullptr);
 /** get a DistanceComputer that refers to this type of distance and
  *  indexes a flat array of size nb */
@@ -54,6 +56,50 @@ FlatCodesDistanceComputer* get_extra_distance_computer(
         size_t nb,
         const float* xb);
+/// Dispatch to a lambda with MetricType as a compile-time constant.
+/// This allows writing generic code that works with different metrics
+/// while maintaining compile-time optimization.
+///
+/// Example usage:
+///   auto result = with_metric_type(runtime_metric, [&](auto metric_tag) {
+///       constexpr MetricType M = decltype(metric_tag)::value;
+///       return compute_distance<M>(x, y);
+///   });
+#ifndef SWIG
+template <typename LambdaType>
+inline auto with_metric_type(MetricType metric, LambdaType&& action) {
+    switch (metric) {
+        case METRIC_INNER_PRODUCT:
+            return action.template operator()<METRIC_INNER_PRODUCT>();
+        case METRIC_L2:
+            return action.template operator()<METRIC_L2>();
+        case METRIC_L1:
+            return action.template operator()<METRIC_L1>();
+        case METRIC_Linf:
+            return action.template operator()<METRIC_Linf>();
+        case METRIC_Lp:
+            return action.template operator()<METRIC_Lp>();
+        case METRIC_Canberra:
+            return action.template operator()<METRIC_Canberra>();
+        case METRIC_BrayCurtis:
+            return action.template operator()<METRIC_BrayCurtis>();
+        case METRIC_JensenShannon:
+            return action.template operator()<METRIC_JensenShannon>();
+        case METRIC_Jaccard:
+            return action.template operator()<METRIC_Jaccard>();
+        case METRIC_NaNEuclidean:
+            return action.template operator()<METRIC_NaNEuclidean>();
+        case METRIC_GOWER:
+            return action.template operator()<METRIC_GOWER>();
+        default:
+            FAISS_THROW_FMT(
+                    "with_metric_type called with unknown metric %d",
+                    int(metric));
+    }
+}
+#endif // SWIG
 } // namespace faiss
 #include <faiss/utils/extra_distances-inl.h>

data/vendor/faiss/faiss/utils/hamming_distance/generic-inl.h CHANGED Viewed

@@ -312,7 +312,6 @@ struct HammingComputerDefault {
             const uint8_t* a = a8 + 8 * quotient8;
             const uint8_t* b = b8 + 8 * quotient8;
             switch (remainder8) {
-                [[fallthrough]];
                 case 7:
                     accu += hamdis_tab_ham_bytes[a[6] ^ b[6]];
                     [[fallthrough]];

data/vendor/faiss/faiss/utils/partitioning.cpp CHANGED Viewed

@@ -627,7 +627,7 @@ uint16_t simd_partition_fuzzy_with_bounds_histogram(
             n_lt = sum_below - hist[i];
             n_gt = n - sum_below;
         } else {
-            assert(!"not implemented");
+            assert(false && "not implemented");
         }
         IFV printf(