PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (527) hide show

mteb/models/model_implementations/pylate_models.py CHANGED Viewed

@@ -19,6 +19,7 @@ from mteb.types import (
     Array,
     BatchedInput,
     CorpusDatasetType,
+    EncodeKwargs,
     PromptType,
     QueryDatasetType,
     RetrievalOutputType,
@@ -29,7 +30,7 @@ logger = logging.getLogger(__name__)
 class PylateSearchEncoder:
-    """Mixin class to add PyLate-based indexing and search to an encoder. Implements :class:`SearchProtocol`"""
+    """Mixin class to add PyLate-based indexing and search to an encoder. Implements [SearchProtocol][mteb.models.SearchProtocol]"""
     base_index_dir: Path | None = None
     _index_dir: Path | None = None
@@ -45,7 +46,7 @@ class PylateSearchEncoder:
         task_metadata: TaskMetadata,
         hf_split: str,
         hf_subset: str,
-        encode_kwargs: dict[str, Any],
+        encode_kwargs: EncodeKwargs,
     ) -> None:
         """Index the corpus for retrieval.
@@ -78,7 +79,7 @@ class PylateSearchEncoder:
         hf_split: str,
         hf_subset: str,
         top_k: int,
-        encode_kwargs: dict[str, Any],
+        encode_kwargs: EncodeKwargs,
         top_ranked: TopRankedDocumentsType | None = None,
     ) -> RetrievalOutputType:
         queries_dataloader = create_dataloader(
@@ -136,7 +137,7 @@ class PylateSearchEncoder:
         hf_subset: str,
         hf_split: str,
         top_k: int,
-        encode_kwargs: dict[str, Any],
+        encode_kwargs: EncodeKwargs,
     ) -> dict[str, list[tuple[float, str]]]:
         from pylate import indexes, retrieve
@@ -200,7 +201,7 @@ class PylateSearchEncoder:
         task_metadata: TaskMetadata,
         hf_subset: str,
         hf_split: str,
-        encode_kwargs: dict[str, Any],
+        encode_kwargs: EncodeKwargs,
     ) -> dict[str, list[tuple[float, str]]]:
         """Rerank with PyLate's rank.rerank using per-query candidates.
@@ -328,18 +329,16 @@ class MultiVectorModel(AbsEncoder, PylateSearchEncoder):
             inputs,
             prompt_name=prompt_name,
             is_query=prompt_type == PromptType.query,
-            convert_to_tensor=True,
             **kwargs,
         )
-        # encode returns a list of tensors shaped (x, token_dim), pad to uniform length
-        pred = torch.nn.utils.rnn.pad_sequence(pred, batch_first=True, padding_value=0)
-        return pred.cpu().numpy()
+        return pred
 colbert_v2 = ModelMeta(
     loader=MultiVectorModel,
     name="colbert-ir/colbertv2.0",
+    model_type=["late-interaction"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="c1e84128e85ef755c096a95bdb06b47793b13acf",
@@ -352,7 +351,7 @@ colbert_v2 = ModelMeta(
     embed_dim=None,
     license="mit",
     similarity_fn_name=ScoringFunction.MAX_SIM,
-    framework=["PyLate", "ColBERT"],
+    framework=["PyLate", "ColBERT", "Transformers", "ONNX", "safetensors"],
     reference="https://huggingface.co/colbert-ir/colbertv2.0",
     use_instructions=False,
     adapted_from=None,
@@ -372,6 +371,7 @@ jina_colbert_v2 = ModelMeta(
         trust_remote_code=True,
     ),
     name="jinaai/jina-colbert-v2",
+    model_type=["late-interaction"],
     languages=[
         "ara-Arab",
         "ben-Beng",
@@ -407,7 +407,7 @@ jina_colbert_v2 = ModelMeta(
     embed_dim=None,
     license="cc-by-nc-4.0",
     similarity_fn_name=ScoringFunction.MAX_SIM,
-    framework=["PyLate", "ColBERT"],
+    framework=["PyLate", "ColBERT", "ONNX", "safetensors"],
     reference="https://huggingface.co/jinaai/jina-colbert-v2",
     use_instructions=False,
     adapted_from=None,
@@ -418,12 +418,37 @@ jina_colbert_v2 = ModelMeta(
         "DuRetrieval",
         "MIRACL",
     },
+    citation="""@inproceedings{xiao-etal-2024-jina,
+    title = "{J}ina-{C}ol{BERT}-v2: A General-Purpose Multilingual Late Interaction Retriever",
+    author = {Jha, Rohan  and
+      Wang, Bo  and
+      G{\"u}nther, Michael  and
+      Mastrapas, Georgios  and
+      Sturua, Saba  and
+      Mohr, Isabelle  and
+      Koukounas, Andreas  and
+      Wang, Mohammad Kalim  and
+      Wang, Nan  and
+      Xiao, Han},
+    editor = {S{\"a}lev{\"a}, Jonne  and
+      Owodunni, Abraham},
+    booktitle = "Proceedings of the Fourth Workshop on Multilingual Representation Learning (MRL 2024)",
+    month = nov,
+    year = "2024",
+    address = "Miami, Florida, USA",
+    publisher = "Association for Computational Linguistics",
+    url = "https://aclanthology.org/2024.mrl-1.11/",
+    doi = "10.18653/v1/2024.mrl-1.11",
+    pages = "159--166",
+    abstract = "Multi-vector dense models, such as ColBERT, have proven highly effective in information retrieval. ColBERT`s late interaction scoring approximates the joint query-document attention seen in cross-encoders while maintaining inference efficiency closer to traditional dense retrieval models, thanks to its bi-encoder architecture and recent optimizations in indexing and search. In this paper, we introduce a novel architecture and a training framework to support long context window and multilingual retrieval. Leveraging Matryoshka Representation Loss, we further demonstrate that the reducing the embedding dimensionality from 128 to 64 has insignificant impact on the model`s retrieval performance and cut storage requirements by up to 50{\\%}. Our new model, Jina-ColBERT-v2, demonstrates strong performance across a range of English and multilingual retrieval tasks,"
+}""",
 )
 lightonai__gte_moderncolbert_v1 = ModelMeta(
     loader=MultiVectorModel,
     name="lightonai/GTE-ModernColBERT-v1",
+    model_type=["late-interaction"],
     languages=[
         "eng-Latn",
     ],
@@ -438,7 +463,7 @@ lightonai__gte_moderncolbert_v1 = ModelMeta(
     embed_dim=None,
     license="apache-2.0",
     similarity_fn_name="MaxSim",
-    framework=["PyLate", "ColBERT"],
+    framework=["PyLate", "ColBERT", "safetensors", "Sentence Transformers"],
     reference="https://huggingface.co/lightonai/GTE-ModernColBERT-v1",
     use_instructions=False,
     adapted_from="Alibaba-NLP/gte-modernbert-base",
@@ -447,4 +472,13 @@ lightonai__gte_moderncolbert_v1 = ModelMeta(
         "MSMARCO",
         "mMARCO-NL",
     },
+    citation="""@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084"
+}""",
 )

mteb/models/model_implementations/qodo_models.py CHANGED Viewed

@@ -30,6 +30,7 @@ qodo_languages = [
 Qodo_Embed_1_1_5B = ModelMeta(
     loader=sentence_transformers_loader,
     name="Qodo/Qodo-Embed-1-1.5B",
+    model_type=["dense"],
     languages=qodo_languages,
     open_weights=True,
     revision="84bbef079b32e8823ec226d4e9e92902706b0eb6",
@@ -41,7 +42,7 @@ Qodo_Embed_1_1_5B = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/Qodo/Qodo-Embed-1-1.5B",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -52,6 +53,7 @@ Qodo_Embed_1_1_5B = ModelMeta(
 Qodo_Embed_1_7B = ModelMeta(
     loader=sentence_transformers_loader,
     name="Qodo/Qodo-Embed-1-7B",
+    model_type=["dense"],
     languages=qodo_languages,
     open_weights=True,
     revision="f9edd9bf7f687c0e832424058e265120f603cd81",
@@ -63,7 +65,7 @@ Qodo_Embed_1_7B = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/Qodo/Qodo-Embed-1-7B",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/qtack_models.py CHANGED Viewed

@@ -25,6 +25,7 @@ mini_gte_datasets = {
 mini_gte = ModelMeta(
     loader=sentence_transformers_loader,
     name="prdev/mini-gte",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="7fbe6f9b4cc42615e0747299f837ad7769025492",
@@ -36,7 +37,7 @@ mini_gte = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/prdev/mini-gte",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/qwen3_models.py CHANGED Viewed

@@ -134,18 +134,19 @@ def q3e_instruct_loader(
 Qwen3_Embedding_0B6 = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-0.6B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="b22da495047858cce924d27d76261e96be6febc0",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=595776512,
-    memory_usage_mb=2272,
+    memory_usage_mb=1136,
     embed_dim=1024,
     max_tokens=32768,
     license="apache-2.0",
     reference="https://huggingface.co/Qwen/Qwen3-Embedding-0.6B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -156,18 +157,19 @@ Qwen3_Embedding_0B6 = ModelMeta(
 Qwen3_Embedding_4B = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-4B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="636cd9bf47d976946cdbb2b0c3ca0cb2f8eea5ff",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=4021774336,
-    memory_usage_mb=15341,
+    memory_usage_mb=7671,
     embed_dim=2560,
     max_tokens=32768,
     license="apache-2.0",
     reference="https://huggingface.co/Qwen/Qwen3-Embedding-4B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -178,18 +180,19 @@ Qwen3_Embedding_4B = ModelMeta(
 Qwen3_Embedding_8B = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-8B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="4e423935c619ae4df87b646a3ce949610c66241c",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=7567295488,
-    memory_usage_mb=28866,
+    memory_usage_mb=14433,
     embed_dim=4096,
     max_tokens=32768,
     license="apache-2.0",
     reference="https://huggingface.co/Qwen/Qwen3-Embedding-8B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/qzhou_models.py CHANGED Viewed

@@ -58,18 +58,19 @@ QZhou_Embedding = ModelMeta(
         apply_instruction_to_passages=False,
     ),
     name="Kingsoft-LLM/QZhou-Embedding",
+    model_type=["dense"],
     languages=["eng-Latn", "zho-Hans"],
     open_weights=True,
     revision="f1e6c03ee3882e7b9fa5cec91217715272e433b8",
     release_date="2025-08-24",
     n_parameters=7_070_619_136,
-    memory_usage_mb=29070,
+    memory_usage_mb=14436,
     embed_dim=3584,
     license="apache-2.0",
     max_tokens=8192,
     reference="https://huggingface.co/Kingsoft-LLM/QZhou-Embedding",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data="https://huggingface.co/datasets/cfli/bge-full-data",
@@ -91,6 +92,7 @@ QZhou_Embedding_Zh = ModelMeta(
         apply_instruction_to_passages=False,
     ),
     name="Kingsoft-LLM/QZhou-Embedding-Zh",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="0321ccb126413d1e49c5ce908e802b63d35f18e2",
@@ -102,7 +104,7 @@ QZhou_Embedding_Zh = ModelMeta(
     max_tokens=8192,
     reference="http://huggingface.co/Kingsoft-LLM/QZhou-Embedding-Zh",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/random_baseline.py CHANGED Viewed

@@ -1,15 +1,23 @@
+from __future__ import annotations
 import hashlib
-from typing import Any, Literal
+from typing import TYPE_CHECKING, Any, Literal
 import numpy as np
 import torch
-from PIL import Image
 from torch.utils.data import DataLoader
 from mteb.abstasks.task_metadata import TaskMetadata
 from mteb.models.model_meta import ModelMeta
+from mteb.similarity_functions import (
+    select_pairwise_similarity,
+    select_similarity,
+)
 from mteb.types._encoder_io import Array, BatchedInput, PromptType
+if TYPE_CHECKING:
+    from PIL import Image
 def _string_to_vector(text: str | None, size: int) -> np.ndarray:
     """Generate a deterministic random vector based on a string.
@@ -60,7 +68,7 @@ _common_mock_metadata = dict(
     license="mit",
     max_tokens=np.inf,
     reference=None,
-    similarity_fn_name="cosine",  # type: ignore
+    similarity_fn_name="cosine",
     framework=[],
     use_instructions=False,
     public_training_code=None,  # No training code, as this is a random baseline
@@ -155,15 +163,9 @@ class RandomEncoderBaseline:
         Returns:
             Cosine similarity matrix between the two sets of embeddings
         """
-        norm1 = np.linalg.norm(
-            embeddings1.reshape(-1, self.embedding_dim), axis=1, keepdims=True
+        return select_similarity(
+            embeddings1, embeddings2, self.mteb_model_meta.similarity_fn_name
         )
-        norm2 = np.linalg.norm(
-            embeddings2.reshape(-1, self.embedding_dim), axis=1, keepdims=True
-        )
-        normalized1 = embeddings1 / (norm1 + 1e-10)
-        normalized2 = embeddings2 / (norm2 + 1e-10)
-        return np.dot(normalized1, normalized2.T)
     def similarity_pairwise(
         self,
@@ -179,22 +181,15 @@ class RandomEncoderBaseline:
         Returns:
             Cosine similarity for each pair of embeddings
         """
-        norm1 = np.linalg.norm(
-            embeddings1.reshape(-1, self.embedding_dim), axis=1, keepdims=True
-        )
-        norm2 = np.linalg.norm(
-            embeddings2.reshape(-1, self.embedding_dim), axis=1, keepdims=True
+        return select_pairwise_similarity(
+            embeddings1, embeddings2, self.mteb_model_meta.similarity_fn_name
         )
-        normalized1 = embeddings1 / (norm1 + 1e-10)
-        normalized2 = embeddings2 / (norm2 + 1e-10)
-        normalized1 = np.asarray(normalized1)
-        normalized2 = np.asarray(normalized2)
-        return np.sum(normalized1 * normalized2, axis=1)
 random_encoder_baseline = ModelMeta(
-    loader=RandomEncoderBaseline,  # type: ignore
+    loader=RandomEncoderBaseline,
     name="baseline/random-encoder-baseline",
+    model_type=["dense"],
     modalities=["text", "image"],
     **_common_mock_metadata,
 )
@@ -237,9 +232,9 @@ class RandomCrossEncoderBaseline:
 random_cross_encoder_baseline = ModelMeta(
-    loader=RandomCrossEncoderBaseline,  # type: ignore
+    loader=RandomCrossEncoderBaseline,
     name="baseline/random-cross-encoder-baseline",
+    model_type=["cross-encoder"],
     modalities=["text", "image"],
-    is_cross_encoder=True,
     **_common_mock_metadata,
 )

mteb/models/model_implementations/rasgaard_models.py ADDED Viewed

@@ -0,0 +1,34 @@
+import numpy as np
+from mteb.models.model_implementations.model2vec_models import Model2VecModel
+from mteb.models.model_meta import ModelMeta, ScoringFunction
+potion_base_8m = ModelMeta(
+    loader=Model2VecModel,
+    name="rasgaard/m2v-dfm-large",
+    model_type=["dense"],
+    languages=["dan-Latn"],
+    open_weights=True,
+    revision="387897cfb09992e6d45ea9cd7b28b9fcf119e23a",
+    release_date="2025-10-08",
+    n_parameters=22893312,
+    memory_usage_mb=87,
+    max_tokens=np.inf,
+    embed_dim=256,
+    license="mit",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["NumPy", "Sentence Transformers", "safetensors"],
+    reference="https://huggingface.co/rasgaard/m2v-dfm-large",
+    use_instructions=False,
+    adapted_from="KennethEnevoldsen/dfm-sentence-encoder-large",
+    superseded_by=None,
+    training_datasets=set(),  # distilled
+    public_training_code="https://github.com/MinishLab/model2vec",
+    public_training_data="https://huggingface.co/datasets/HuggingFaceFW/fineweb-2",  # distilled on this
+    citation="""@article{minishlab2024model2vec,
+    author = {Tulkens, Stephan and {van Dongen}, Thomas},
+    title = {Model2Vec: Fast State-of-the-Art Static Embeddings},
+    year = {2024},
+    url = {https://github.com/MinishLab/model2vec}
+}""",
+)

mteb/models/model_implementations/reasonir_model.py CHANGED Viewed

@@ -44,6 +44,7 @@ ReasonIR_8B = ModelMeta(
         trust_remote_code=True,
     ),
     name="ReasonIR/ReasonIR-8B",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="c3d0690370ff4a8c3d3882d8dfa85c43650034fa",
@@ -55,7 +56,7 @@ ReasonIR_8B = ModelMeta(
     max_tokens=131072,
     reference="https://huggingface.co/ReasonIR/ReasonIR-8B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     training_datasets=REASONIR_TRAINING_DATA,
     public_training_code="https://github.com/facebookresearch/ReasonIR/tree/main/training",

mteb/models/model_implementations/repllama_models.py CHANGED Viewed

@@ -154,7 +154,7 @@ REPLLAMA_CITATION = """
 """
 repllama_llama2_original = ModelMeta(
-    loader=RepLLaMAModel,  # type: ignore
+    loader=RepLLaMAModel,
     loader_kwargs=dict(
         base_model_name_or_path="meta-llama/Llama-2-7b-hf",
         device_map="auto",
@@ -162,6 +162,7 @@ repllama_llama2_original = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="castorini/repllama-v1-7b-lora-passage",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-6097554dfe6e7d93e92f55010b678bcca1e233a8",  # base-peft revision
@@ -186,7 +187,7 @@ repllama_llama2_original = ModelMeta(
 repllama_llama2_reproduced = ModelMeta(
-    loader=RepLLaMAModel,  # type: ignore
+    loader=RepLLaMAModel,
     loader_kwargs=dict(
         base_model_name_or_path="meta-llama/Llama-2-7b-hf",
         device_map="auto",
@@ -194,6 +195,7 @@ repllama_llama2_reproduced = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/RepLLaMA-reproduced",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-ad5c1d0938a1e02954bcafb4d811ba2f34052e71",  # base-peft revision
@@ -205,7 +207,7 @@ repllama_llama2_reproduced = ModelMeta(
     license="apache-2.0",
     reference="https://huggingface.co/samaya-ai/RepLLaMA-reproduced",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch", "Tevatron"],
+    framework=["PyTorch", "Tevatron", "safetensors"],
     use_instructions=True,
     citation=REPLLAMA_CITATION,
     public_training_code=None,

mteb/models/model_implementations/rerankers_custom.py CHANGED Viewed

@@ -214,11 +214,12 @@ class JinaReranker(RerankerWrapper):
 monobert_large = ModelMeta(
-    loader=MonoBERTReranker,  # type: ignore
+    loader=MonoBERTReranker,
     loader_kwargs=dict(
         fp_options="float16",
     ),
     name="castorini/monobert-large-msmarco",
+    model_type=["cross-encoder"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="0a97706f3827389da43b83348d5d18c9d53876fa",
@@ -233,17 +234,17 @@ monobert_large = ModelMeta(
     similarity_fn_name=None,
     use_instructions=None,
     training_datasets=None,
-    framework=["Sentence Transformers", "PyTorch"],
-    is_cross_encoder=True,
+    framework=["Sentence Transformers", "PyTorch", "Transformers"],
 )
 # languages unclear: https://huggingface.co/jinaai/jina-reranker-v2-base-multilingual/discussions/28
 jina_reranker_multilingual = ModelMeta(
-    loader=JinaReranker,  # type: ignore
+    loader=JinaReranker,
     loader_kwargs=dict(
         fp_options="float16",
     ),
     name="jinaai/jina-reranker-v2-base-multilingual",
+    model_type=["cross-encoder"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="126747772a932960028d9f4dc93bd5d9c4869be4",
@@ -258,16 +259,22 @@ jina_reranker_multilingual = ModelMeta(
     similarity_fn_name=None,
     use_instructions=None,
     training_datasets=None,
-    framework=["Sentence Transformers", "PyTorch"],
-    is_cross_encoder=True,
+    framework=[
+        "Sentence Transformers",
+        "PyTorch",
+        "Transformers",
+        "ONNX",
+        "safetensors",
+    ],
 )
 bge_reranker_v2_m3 = ModelMeta(
-    loader=BGEReranker,  # type: ignore
+    loader=BGEReranker,
     loader_kwargs=dict(
         fp_options="float16",
     ),
     name="BAAI/bge-reranker-v2-m3",
+    model_type=["cross-encoder"],
     languages=[
         "eng-Latn",
         "ara-Arab",
@@ -315,8 +322,7 @@ bge_reranker_v2_m3 = ModelMeta(
     similarity_fn_name=None,
     use_instructions=None,
     training_datasets=bge_m3_training_data,
-    framework=["Sentence Transformers", "PyTorch"],
-    is_cross_encoder=True,
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     citation="""
     @misc{li2023making,
       title={Making Large Language Models A Better Foundation For Dense Retrieval},

mteb 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl