PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (527) hide show

mteb/models/model_implementations/blip_models.py CHANGED Viewed

@@ -10,6 +10,17 @@ from mteb.models.abs_encoder import AbsEncoder
 from mteb.models.model_meta import ModelMeta, ScoringFunction
 from mteb.types import Array, BatchedInput, PromptType
+BLIP_CITATION = """@misc{https://doi.org/10.48550/arxiv.2201.12086,
+    doi = {10.48550/ARXIV.2201.12086},
+    url = {https://arxiv.org/abs/2201.12086},
+    author = {Li, Junnan and Li, Dongxu and Xiong, Caiming and Hoi, Steven},
+    keywords = {Computer Vision and Pattern Recognition (cs.CV), FOS: Computer and information sciences, FOS: Computer and information sciences},
+    title = {BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation},
+    publisher = {arXiv},
+    year = {2022},
+    copyright = {Creative Commons Attribution 4.0 International}
+}"""
 class BLIPModel(AbsEncoder):
     def __init__(
@@ -117,8 +128,9 @@ class BLIPModel(AbsEncoder):
 # in descending order of usage (downloads from huggingface)
 blip_image_captioning_large = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-image-captioning-large",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="2227ac38c9f16105cb0412e7cab4759978a8fd90",
     release_date="2023-12-07",
@@ -131,7 +143,7 @@ blip_image_captioning_large = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers", "safetensors"],
     reference="https://huggingface.co/Salesforce/blip-image-captioning-large",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -140,11 +152,13 @@ blip_image_captioning_large = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_image_captioning_base = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-image-captioning-base",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="89b09ea1789f7addf2f6d6f0dfc4ce10ab58ef84",
     release_date="2023-08-01",
@@ -157,7 +171,7 @@ blip_image_captioning_base = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-image-captioning-base",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -166,12 +180,14 @@ blip_image_captioning_base = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_vqa_base = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-vqa-base",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="c7df8e7cd7aa2ee9af18f56e2b29e59a92651b64",
     release_date="2023-12-07",
@@ -184,7 +200,7 @@ blip_vqa_base = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers", "safetensors"],
     reference="https://huggingface.co/Salesforce/blip-vqa-base",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -192,11 +208,13 @@ blip_vqa_base = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_vqa_capfilt_large = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-vqa-capfilt-large",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="e53f95265aeab69013fabb5380500ab984adbbb4",
     release_date="2023-01-22",
@@ -209,7 +227,7 @@ blip_vqa_capfilt_large = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-vqa-capfilt-large",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -217,11 +235,13 @@ blip_vqa_capfilt_large = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_itm_base_coco = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-base-coco",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="7eaa90c11850c0b17fc38c6a11e7d88bd6ac231f",
     release_date="2023-08-01",
@@ -234,7 +254,7 @@ blip_itm_base_coco = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-itm-base-coco",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -242,11 +262,13 @@ blip_itm_base_coco = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_itm_large_coco = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-large-coco",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="fef05cafc05298067cbbca00b125749394a77a6f",
     release_date="2023-08-01",
@@ -259,7 +281,7 @@ blip_itm_large_coco = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-itm-large-coco",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -268,11 +290,13 @@ blip_itm_large_coco = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )
 blip_itm_base_flickr = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-base-flickr",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="1de29e660d91ae1786c1876212ea805a22eab251",
     release_date="2023-08-01",
@@ -285,7 +309,7 @@ blip_itm_base_flickr = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-itm-base-flickr",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -294,11 +318,13 @@ blip_itm_base_flickr = ModelMeta(
         # LAION115M
         # Flickr30k
     ),
+    citation=BLIP_CITATION,
 )
 blip_itm_large_flickr = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-large-flickr",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="bda12e6506758f54261b5ab174b2c55a3ba143fb",
     release_date="2023-08-01",
@@ -311,7 +337,7 @@ blip_itm_large_flickr = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/salesforce/BLIP",
     public_training_data="https://github.com/salesforce/BLIP",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/Salesforce/blip-itm-large-flickr",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -319,4 +345,5 @@ blip_itm_large_flickr = ModelMeta(
         # CC3M+CC12M+SBU
         # LAION115M
     ),
+    citation=BLIP_CITATION,
 )

mteb/models/model_implementations/bm25.py CHANGED Viewed

@@ -1,5 +1,4 @@
 import logging
-from typing import Any
 from mteb._create_dataloaders import _create_text_queries_dataloader
 from mteb._requires_package import requires_package
@@ -8,6 +7,7 @@ from mteb.models.model_meta import ModelMeta
 from mteb.models.models_protocols import SearchProtocol
 from mteb.types import (
     CorpusDatasetType,
+    EncodeKwargs,
     InstructionDatasetType,
     QueryDatasetType,
     RetrievalOutputType,
@@ -49,7 +49,7 @@ def bm25_loader(model_name, **kwargs) -> SearchProtocol:
             task_metadata: TaskMetadata,
             hf_split: str,
             hf_subset: str,
-            encode_kwargs: dict[str, Any],
+            encode_kwargs: EncodeKwargs,
         ) -> None:
             logger.info("Encoding Corpus...")
             corpus_texts = [
@@ -74,7 +74,7 @@ def bm25_loader(model_name, **kwargs) -> SearchProtocol:
             hf_split: str,
             hf_subset: str,
             top_k: int,
-            encode_kwargs: dict[str, Any],
+            encode_kwargs: EncodeKwargs,
             instructions: InstructionDatasetType | None = None,
             top_ranked: TopRankedDocumentsType | None = None,
         ) -> RetrievalOutputType:
@@ -113,7 +113,7 @@ def bm25_loader(model_name, **kwargs) -> SearchProtocol:
         def encode(self, texts: list[str]):
             """Encode input text as term vectors"""
-            return bm25s.tokenize(texts, stopwords=self.stopwords, stemmer=self.stemmer)  # type: ignore
+            return bm25s.tokenize(texts, stopwords=self.stopwords, stemmer=self.stemmer)
     return BM25Search(**kwargs)
@@ -121,6 +121,7 @@ def bm25_loader(model_name, **kwargs) -> SearchProtocol:
 bm25_s = ModelMeta(
     loader=bm25_loader,
     name="bm25s",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="0_1_10",

mteb/models/model_implementations/bmretriever_models.py CHANGED Viewed

@@ -25,6 +25,7 @@ class BMRetrieverWrapper(InstructSentenceTransformerModel):
         self,
         model_name: str,
         revision: str,
+        device: str | None = None,
         instruction_template: str
         | Callable[[str, PromptType | None], str]
         | None = None,
@@ -52,6 +53,7 @@ class BMRetrieverWrapper(InstructSentenceTransformerModel):
         transformer = Transformer(
             model_name,
+            device=device,
             **kwargs,
         )
         pooling = Pooling(
@@ -90,6 +92,7 @@ BMRetriever_410M = ModelMeta(
         apply_instruction_to_passages=True,
     ),
     name="BMRetriever/BMRetriever-410M",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="e3569bfbcfe3a1bc48c142e11a7b0f38e86065a3",
@@ -101,7 +104,7 @@ BMRetriever_410M = ModelMeta(
     license="mit",
     reference="https://huggingface.co/BMRetriever/BMRetriever-410M",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -119,6 +122,7 @@ BMRetriever_1B = ModelMeta(
         apply_instruction_to_passages=True,
     ),
     name="BMRetriever/BMRetriever-1B",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="1b758c5f4d3af48ef6035cc4088bdbcd7df43ca6",
@@ -130,7 +134,7 @@ BMRetriever_1B = ModelMeta(
     license="mit",
     reference="https://huggingface.co/BMRetriever/BMRetriever-1B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -148,6 +152,7 @@ BMRetriever_2B = ModelMeta(
         apply_instruction_to_passages=True,
     ),
     name="BMRetriever/BMRetriever-2B",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="718179afd57926369c347f46eee616db81084941",
@@ -159,7 +164,7 @@ BMRetriever_2B = ModelMeta(
     license="mit",
     reference="https://huggingface.co/BMRetriever/BMRetriever-2B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -177,6 +182,7 @@ BMRetriever_7B = ModelMeta(
         apply_instruction_to_passages=True,
     ),
     name="BMRetriever/BMRetriever-7B",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="13e6adb9273c5f254e037987d6b44e9e4b005b9a",
@@ -188,7 +194,7 @@ BMRetriever_7B = ModelMeta(
     license="mit",
     reference="https://huggingface.co/BMRetriever/BMRetriever-7B",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/cadet_models.py CHANGED Viewed

@@ -3,6 +3,13 @@ from mteb.models.sentence_transformer_wrapper import sentence_transformers_loade
 from .bge_models import bge_m3_training_data
+CADET_CITATION = """@article{tamber2025conventionalcontrastivelearningfalls,
+    title={Conventional Contrastive Learning Often Falls Short: Improving Dense Retrieval with Cross-Encoder Listwise Distillation and Synthetic Data},
+    author={Manveer Singh Tamber and Suleman Kazi and Vivek Sourabh and Jimmy Lin},
+    journal={arXiv:2505.19274},
+    year={2025}
+}"""
 cadet_training_data = {
     # we train with the corpora of FEVER, MSMARCO, and DBPEDIA. We only train with synthetic generated queries.
     # However, we do use queries from MSMARCO as examples for synthetic query generation.
@@ -28,6 +35,7 @@ cadet_embed = ModelMeta(
         },
     ),
     name="manveertamber/cadet-embed-base-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="8056d118be37a566f20972a5f35cda815f6bc47e",
     open_weights=True,
@@ -39,11 +47,12 @@ cadet_embed = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/manveertamber/cadet-embed-base-v1",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code="https://github.com/manveertamber/cadet-dense-retrieval",
     # we provide the code to generate the training data
     public_training_data="https://github.com/manveertamber/cadet-dense-retrieval",
     training_datasets=cadet_training_data,
     adapted_from="intfloat/e5-base-unsupervised",
+    citation=CADET_CITATION,
 )

mteb/models/model_implementations/cde_models.py CHANGED Viewed

@@ -24,6 +24,16 @@ if TYPE_CHECKING:
     )
 logger = logging.getLogger(__name__)
+CDE_CITATION = """@misc{morris2024contextualdocumentembeddings,
+    title={Contextual Document Embeddings},
+    author={John X. Morris and Alexander M. Rush},
+    year={2024},
+    eprint={2410.02525},
+    archivePrefix={arXiv},
+    primaryClass={cs.CL},
+    url={https://arxiv.org/abs/2410.02525},
+}"""
 class CDEWrapper(SentenceTransformerEncoderWrapper):
     dataset_embeddings: torch.Tensor | None = None
@@ -39,10 +49,17 @@ class CDEWrapper(SentenceTransformerEncoderWrapper):
         "InstructionReranking",
     )
-    def __init__(self, model: str, *args, **kwargs: Any) -> None:
+    def __init__(
+        self,
+        model: str,
+        revision: str | None = None,
+        device: str | None = None,
+        *args,
+        **kwargs: Any,
+    ) -> None:
         from transformers import AutoConfig
-        super().__init__(model, *args, **kwargs)
+        super().__init__(model, revision=revision, device=device, *args, **kwargs)
         model_config = AutoConfig.from_pretrained(model, trust_remote_code=True)
         self.max_sentences = model_config.transductive_corpus_size
@@ -199,6 +216,7 @@ cde_small_v1 = ModelMeta(
         trust_remote_code=True,
     ),
     name="jxm/cde-small-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="e151df18af0d7f1d1c37b074fee58406ececf19f",
@@ -209,7 +227,7 @@ cde_small_v1 = ModelMeta(
     embed_dim=768,
     license="mit",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers"],
+    framework=["Sentence Transformers", "safetensors", "Transformers"],
     reference="https://huggingface.co/jxm/cde-small-v1",
     use_instructions=True,
     adapted_from="nomic-ai/nomic-bert-2048",
@@ -217,6 +235,7 @@ cde_small_v1 = ModelMeta(
     training_datasets=bge_full_data,
     public_training_code="https://github.com/jxmorris12/cde",
     public_training_data="https://huggingface.co/datasets/cfli/bge-full-data",
+    citation=CDE_CITATION,
 )
 cde_small_v2 = ModelMeta(
@@ -226,6 +245,7 @@ cde_small_v2 = ModelMeta(
         trust_remote_code=True,
     ),
     name="jxm/cde-small-v2",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="4e1d021a6c3fd7ce8aa0a7204057eee5ae61d390",
@@ -236,7 +256,7 @@ cde_small_v2 = ModelMeta(
     embed_dim=768,
     license="mit",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers"],
+    framework=["Sentence Transformers", "safetensors", "Transformers"],
     reference="https://huggingface.co/jxm/cde-small-v1",
     use_instructions=True,
     adapted_from="answerdotai/ModernBERT-base",
@@ -244,4 +264,5 @@ cde_small_v2 = ModelMeta(
     training_datasets=bge_full_data,
     public_training_code="https://github.com/jxmorris12/cde",
     public_training_data="https://huggingface.co/datasets/cfli/bge-full-data",
+    citation=CDE_CITATION,
 )

mteb/models/model_implementations/clip_models.py CHANGED Viewed

@@ -115,8 +115,9 @@ CLIP_CITATION = """
 clip_vit_large_patch14 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-large-patch14",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="32bd64288804d66eefd0ccbe215aa642df71cc41",
     release_date="2021-02-26",
@@ -129,7 +130,7 @@ clip_vit_large_patch14 = ModelMeta(
     open_weights=True,
     public_training_code=None,
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers", "safetensors"],
     reference="https://huggingface.co/openai/clip-vit-large-patch14",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -138,8 +139,9 @@ clip_vit_large_patch14 = ModelMeta(
 )
 clip_vit_base_patch32 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-base-patch32",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="3d74acf9a28c67741b2f4f2ea7635f0aaf6f0268",
     release_date="2021-02-26",
@@ -152,7 +154,7 @@ clip_vit_base_patch32 = ModelMeta(
     open_weights=True,
     public_training_code=None,
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/openai/clip-vit-base-patch32",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
@@ -161,8 +163,9 @@ clip_vit_base_patch32 = ModelMeta(
 )
 clip_vit_base_patch16 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-base-patch16",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="57c216476eefef5ab752ec549e440a49ae4ae5f3",
     release_date="2021-02-26",
@@ -175,7 +178,7 @@ clip_vit_base_patch16 = ModelMeta(
     open_weights=True,
     public_training_code=None,
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers"],
     reference="https://huggingface.co/openai/clip-vit-base-patch16",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,

mteb/models/model_implementations/clips_models.py ADDED Viewed

@@ -0,0 +1,100 @@
+from mteb.models.model_meta import (
+    ModelMeta,
+    ScoringFunction,
+)
+from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
+from .e5_models import ME5_TRAINING_DATA, model_prompts
+E5_NL_CITATION = """
+@misc{banar2025mtebnle5nlembeddingbenchmark,
+  archiveprefix = {arXiv},
+  author = {Nikolay Banar and Ehsan Lotfi and Jens Van Nooten and Cristina Arhiliuc and Marija Kliocaite and Walter Daelemans},
+  eprint = {2509.12340},
+  primaryclass = {cs.CL},
+  title = {MTEB-NL and E5-NL: Embedding Benchmark and Models for Dutch},
+  url = {https://arxiv.org/abs/2509.12340},
+  year = {2025},
+}
+"""
+e5_nl_small = ModelMeta(
+    loader=sentence_transformers_loader,
+    loader_kwargs=dict(
+        model_prompts=model_prompts,
+    ),
+    name="clips/e5-small-trm-nl",
+    model_type=["dense"],
+    languages=["nld-Latn"],
+    open_weights=True,
+    revision="0243664a6c5e12eef854b091eb283e51833c3e9f",
+    release_date="2025-09-23",
+    n_parameters=40_800_000,
+    memory_usage_mb=78,
+    embed_dim=384,
+    license="mit",
+    max_tokens=512,
+    reference="https://huggingface.co/clips/e5-small-trm-nl",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
+    use_instructions=True,
+    public_training_code="https://github.com/ELotfi/e5-nl",
+    public_training_data="https://huggingface.co/collections/clips/beir-nl",
+    training_datasets=ME5_TRAINING_DATA,  # mMARCO-NL, HotpotQA-NL, FEVER-NL, and LLM generated data
+    adapted_from="intfloat/multilingual-e5-small",
+    citation=E5_NL_CITATION,
+)
+e5_nl_base = ModelMeta(
+    loader=sentence_transformers_loader,
+    loader_kwargs=dict(
+        model_prompts=model_prompts,
+    ),
+    name="clips/e5-base-trm-nl",
+    model_type=["dense"],
+    languages=["nld-Latn"],
+    open_weights=True,
+    revision="6bd5722f236da48b4b8bcb28cc1fc478f7089956",
+    release_date="2025-09-23",
+    n_parameters=124_400_000,
+    memory_usage_mb=237,
+    embed_dim=768,
+    license="mit",
+    max_tokens=514,
+    reference="https://huggingface.co/clips/e5-base-trm-nl",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
+    use_instructions=True,
+    public_training_code="https://github.com/ELotfi/e5-nl",
+    public_training_data="https://huggingface.co/collections/clips/beir-nl",
+    adapted_from="intfloat/multilingual-e5-base",
+    training_datasets=ME5_TRAINING_DATA,  # mMARCO-NL, HotpotQA-NL, FEVER-NL, and LLM generated data
+    citation=E5_NL_CITATION,
+)
+e5_nl_large = ModelMeta(
+    loader=sentence_transformers_loader,
+    loader_kwargs=dict(
+        model_prompts=model_prompts,
+    ),
+    name="clips/e5-large-trm-nl",
+    model_type=["dense"],
+    languages=["nld-Latn"],
+    open_weights=True,
+    revision="683333f86ed9eb3699b5567f0fdabeb958d412b0",
+    release_date="2025-09-23",
+    n_parameters=355_000_000,
+    memory_usage_mb=1355,
+    embed_dim=1024,
+    license="mit",
+    max_tokens=514,
+    reference="https://huggingface.co/clips/e5-large-trm-nl",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
+    use_instructions=True,
+    public_training_code="https://github.com/ELotfi/e5-nl",
+    public_training_data="https://huggingface.co/collections/clips/beir-nl",
+    training_datasets=ME5_TRAINING_DATA,  # mMARCO-NL, HotpotQA-NL, FEVER-NL, and LLM generated data
+    adapted_from="intfloat/multilingual-e5-large",
+    citation=E5_NL_CITATION,
+)

mteb 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl