PyPI - mteb - Versions diffs - 2.5.3__py3-none-any.whl → 2.5.5__py3-none-any.whl - Mend

mteb 2.5.3py3-none-any.whl → 2.5.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (105) hide show

mteb/_create_dataloaders.py +10 -15
mteb/_evaluators/any_sts_evaluator.py +1 -4
mteb/_evaluators/evaluator.py +2 -1
mteb/_evaluators/image/imagetext_pairclassification_evaluator.py +5 -6
mteb/_evaluators/pair_classification_evaluator.py +3 -1
mteb/_evaluators/retrieval_metrics.py +17 -16
mteb/_evaluators/sklearn_evaluator.py +9 -8
mteb/_evaluators/text/bitext_mining_evaluator.py +23 -16
mteb/_evaluators/text/summarization_evaluator.py +20 -16
mteb/abstasks/_data_filter/filters.py +1 -1
mteb/abstasks/_data_filter/task_pipelines.py +3 -0
mteb/abstasks/_statistics_calculation.py +18 -10
mteb/abstasks/_stratification.py +18 -18
mteb/abstasks/abstask.py +27 -21
mteb/abstasks/aggregate_task_metadata.py +1 -9
mteb/abstasks/aggregated_task.py +3 -16
mteb/abstasks/classification.py +10 -4
mteb/abstasks/clustering.py +18 -14
mteb/abstasks/clustering_legacy.py +8 -8
mteb/abstasks/image/image_text_pair_classification.py +5 -3
mteb/abstasks/multilabel_classification.py +20 -16
mteb/abstasks/pair_classification.py +18 -9
mteb/abstasks/regression.py +3 -3
mteb/abstasks/retrieval.py +12 -9
mteb/abstasks/sts.py +6 -3
mteb/abstasks/task_metadata.py +20 -16
mteb/abstasks/text/bitext_mining.py +36 -25
mteb/abstasks/text/reranking.py +7 -5
mteb/abstasks/text/summarization.py +8 -3
mteb/abstasks/zeroshot_classification.py +5 -2
mteb/benchmarks/benchmark.py +4 -2
mteb/benchmarks/benchmarks/benchmarks.py +22 -1
mteb/benchmarks/get_benchmark.py +14 -55
mteb/cache.py +21 -18
mteb/cli/_display_tasks.py +2 -2
mteb/cli/build_cli.py +8 -8
mteb/cli/generate_model_card.py +39 -20
mteb/deprecated_evaluator.py +56 -43
mteb/evaluate.py +35 -29
mteb/filter_tasks.py +25 -26
mteb/get_tasks.py +25 -27
mteb/languages/language_scripts.py +5 -3
mteb/leaderboard/app.py +1 -1
mteb/load_results.py +12 -12
mteb/models/abs_encoder.py +2 -2
mteb/models/cache_wrappers/cache_backend_protocol.py +3 -5
mteb/models/cache_wrappers/cache_backends/_hash_utils.py +5 -4
mteb/models/cache_wrappers/cache_backends/faiss_cache.py +2 -1
mteb/models/cache_wrappers/cache_backends/numpy_cache.py +30 -13
mteb/models/cache_wrappers/cache_wrapper.py +2 -2
mteb/models/get_model_meta.py +8 -1
mteb/models/instruct_wrapper.py +11 -5
mteb/models/model_implementations/andersborges.py +2 -2
mteb/models/model_implementations/blip_models.py +8 -8
mteb/models/model_implementations/bm25.py +1 -1
mteb/models/model_implementations/clip_models.py +3 -3
mteb/models/model_implementations/cohere_models.py +1 -1
mteb/models/model_implementations/cohere_v.py +2 -2
mteb/models/model_implementations/dino_models.py +23 -23
mteb/models/model_implementations/emillykkejensen_models.py +3 -3
mteb/models/model_implementations/jina_clip.py +1 -1
mteb/models/model_implementations/jina_models.py +1 -1
mteb/models/model_implementations/kennethenevoldsen_models.py +2 -2
mteb/models/model_implementations/llm2clip_models.py +3 -3
mteb/models/model_implementations/moco_models.py +2 -2
mteb/models/model_implementations/model2vec_models.py +1 -1
mteb/models/model_implementations/nomic_models.py +8 -8
mteb/models/model_implementations/openclip_models.py +7 -7
mteb/models/model_implementations/random_baseline.py +3 -3
mteb/models/model_implementations/rasgaard_models.py +1 -1
mteb/models/model_implementations/repllama_models.py +2 -2
mteb/models/model_implementations/rerankers_custom.py +3 -3
mteb/models/model_implementations/rerankers_monot5_based.py +3 -3
mteb/models/model_implementations/seed_1_6_embedding_models_1215.py +113 -146
mteb/models/model_implementations/siglip_models.py +10 -10
mteb/models/model_implementations/vlm2vec_models.py +1 -1
mteb/models/model_implementations/voyage_v.py +4 -4
mteb/models/model_meta.py +30 -14
mteb/models/search_encoder_index/search_indexes/faiss_search_index.py +5 -5
mteb/models/search_wrappers.py +22 -10
mteb/models/sentence_transformer_wrapper.py +9 -4
mteb/py.typed +0 -0
mteb/results/benchmark_results.py +25 -19
mteb/results/model_result.py +49 -21
mteb/results/task_result.py +45 -51
mteb/similarity_functions.py +11 -7
mteb/tasks/classification/dan/dk_hate_classification.py +1 -1
mteb/tasks/classification/est/estonian_valence.py +1 -1
mteb/tasks/classification/multilingual/scala_classification.py +1 -1
mteb/tasks/image_text_pair_classification/eng/sugar_crepe.py +1 -1
mteb/tasks/retrieval/code/code_rag.py +12 -12
mteb/tasks/retrieval/dan/dan_fever_retrieval.py +1 -1
mteb/tasks/retrieval/dan/tv2_nordretrieval.py +2 -2
mteb/tasks/retrieval/dan/twitter_hjerne_retrieval.py +2 -2
mteb/tasks/retrieval/nob/norquad.py +2 -2
mteb/tasks/retrieval/nob/snl_retrieval.py +2 -2
mteb/tasks/retrieval/tur/tur_hist_quad.py +1 -1
mteb/types/_result.py +2 -1
mteb/types/statistics.py +9 -3
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/METADATA +1 -1
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/RECORD +105 -104
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/WHEEL +0 -0
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/entry_points.txt +0 -0
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/licenses/LICENSE +0 -0
{mteb-2.5.3.dist-info → mteb-2.5.5.dist-info}/top_level.txt +0 -0

mteb/models/get_model_meta.py CHANGED Viewed

@@ -93,7 +93,14 @@ def get_model(
     meta = get_model_meta(model_name, revision)
     model = meta.load_model(**kwargs)
-    model.mteb_model_meta = meta  # type: ignore
+    if kwargs:
+        logger.info(
+            f"Model '{model_name}' loaded with additional arguments: {list(kwargs.keys())}"
+        )
+        meta = meta.model_copy(deep=True)
+        meta.loader_kwargs |= kwargs
+    model.mteb_model_meta = meta  # type: ignore[misc]
     return model

mteb/models/instruct_wrapper.py CHANGED Viewed

@@ -17,7 +17,7 @@ logger = logging.getLogger(__name__)
 def instruct_wrapper(
     model_name_or_path: str,
     mode: str,
-    instruction_template: str | Callable[[str], str] | None = None,
+    instruction_template: str | Callable[[str, PromptType | None], str] | None = None,
     **kwargs,
 ):
     """Instruct wrapper for models. Uses GritLM to pass instructions to the model.
@@ -40,7 +40,9 @@ def instruct_wrapper(
             self,
             model_name_or_path: str,
             mode: str,
-            instruction_template: str | Callable[[str, PromptType], str] | None = None,
+            instruction_template: str
+            | Callable[[str, PromptType | None], str]
+            | None = None,
             **kwargs,
         ):
             if (
@@ -82,8 +84,11 @@ def instruct_wrapper(
             logger.info(
                 f"Using instruction: '{instruction}' for task: '{task_metadata.name}'"
             )
-            embeddings = super().encode(
-                _inputs, instruction=instruction, *args, **kwargs
+            embeddings = super().encode(  # type: ignore[safe-super]
+                _inputs,  # type: ignore[arg-type]
+                instruction=instruction,
+                *args,
+                **kwargs,
             )
             if isinstance(embeddings, torch.Tensor):
                 # sometimes in kwargs can be return_tensors=True
@@ -141,7 +146,7 @@ class InstructSentenceTransformerModel(AbsEncoder):
             )
         self.instruction_template = instruction_template
-        tokenizer_params = {}
+        tokenizer_params: dict[str, Any] = {}
         if add_eos_token:
             tokenizer_params["add_eos_token"] = add_eos_token
         if max_seq_length is not None:
@@ -193,6 +198,7 @@ class InstructSentenceTransformerModel(AbsEncoder):
             The encoded input in a numpy array or torch tensor of the shape (Number of sentences) x (Embedding dimension).
         """
         sentences = [text for batch in inputs for text in batch["text"]]
+        instruction: str | None
         instruction = self.get_task_instruction(task_metadata, prompt_type)
         # to passage prompts won't be applied to passages

mteb/models/model_implementations/andersborges.py CHANGED Viewed

@@ -4,7 +4,7 @@ from mteb.models.model_implementations.model2vec_models import Model2VecModel
 from mteb.models.model_meta import ModelMeta, ScoringFunction
 model2vecdk = ModelMeta(
-    loader=Model2VecModel,  # type: ignore
+    loader=Model2VecModel,
     name="andersborges/model2vecdk",
     model_type=["dense"],
     languages=["dan-Latn"],
@@ -35,7 +35,7 @@ model2vecdk = ModelMeta(
 model2vecdk_stem = ModelMeta(
-    loader=Model2VecModel,  # type: ignore
+    loader=Model2VecModel,
     name="andersborges/model2vecdk-stem",
     model_type=["dense"],
     languages=["dan-Latn"],

mteb/models/model_implementations/blip_models.py CHANGED Viewed

@@ -128,7 +128,7 @@ class BLIPModel(AbsEncoder):
 # in descending order of usage (downloads from huggingface)
 blip_image_captioning_large = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-image-captioning-large",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -156,7 +156,7 @@ blip_image_captioning_large = ModelMeta(
 )
 blip_image_captioning_base = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-image-captioning-base",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -185,7 +185,7 @@ blip_image_captioning_base = ModelMeta(
 blip_vqa_base = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-vqa-base",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -212,7 +212,7 @@ blip_vqa_base = ModelMeta(
 )
 blip_vqa_capfilt_large = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-vqa-capfilt-large",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -239,7 +239,7 @@ blip_vqa_capfilt_large = ModelMeta(
 )
 blip_itm_base_coco = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-base-coco",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -266,7 +266,7 @@ blip_itm_base_coco = ModelMeta(
 )
 blip_itm_large_coco = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-large-coco",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -294,7 +294,7 @@ blip_itm_large_coco = ModelMeta(
 )
 blip_itm_base_flickr = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-base-flickr",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -322,7 +322,7 @@ blip_itm_base_flickr = ModelMeta(
 )
 blip_itm_large_flickr = ModelMeta(
-    loader=BLIPModel,  # type: ignore
+    loader=BLIPModel,
     name="Salesforce/blip-itm-large-flickr",
     model_type=["dense"],
     languages=["eng-Latn"],

mteb/models/model_implementations/bm25.py CHANGED Viewed

@@ -113,7 +113,7 @@ def bm25_loader(model_name, **kwargs) -> SearchProtocol:
         def encode(self, texts: list[str]):
             """Encode input text as term vectors"""
-            return bm25s.tokenize(texts, stopwords=self.stopwords, stemmer=self.stemmer)  # type: ignore
+            return bm25s.tokenize(texts, stopwords=self.stopwords, stemmer=self.stemmer)
     return BM25Search(**kwargs)

mteb/models/model_implementations/clip_models.py CHANGED Viewed

@@ -115,7 +115,7 @@ CLIP_CITATION = """
 clip_vit_large_patch14 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-large-patch14",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -139,7 +139,7 @@ clip_vit_large_patch14 = ModelMeta(
 )
 clip_vit_base_patch32 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-base-patch32",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -163,7 +163,7 @@ clip_vit_base_patch32 = ModelMeta(
 )
 clip_vit_base_patch16 = ModelMeta(
-    loader=CLIPModel,  # type: ignore
+    loader=CLIPModel,
     name="openai/clip-vit-base-patch16",
     model_type=["dense"],
     languages=["eng-Latn"],

mteb/models/model_implementations/cohere_models.py CHANGED Viewed

@@ -222,7 +222,7 @@ class CohereTextEmbeddingModel(AbsEncoder):
     ) -> None:
         requires_package(self, "cohere", model_name, "pip install 'mteb[cohere]'")
-        import cohere  # type: ignore
+        import cohere
         self.model_name = model_name.removeprefix("Cohere/Cohere-")
         self.sep = sep

mteb/models/model_implementations/cohere_v.py CHANGED Viewed

@@ -378,7 +378,7 @@ def cohere_v_loader(model_name, **kwargs):
 cohere_mult_3 = ModelMeta(
-    loader=cohere_v_loader,  # type: ignore
+    loader=cohere_v_loader,
     loader_kwargs={"model_name": "embed-multilingual-v3.0"},
     name="cohere/embed-multilingual-v3.0",
     model_type=["dense"],
@@ -402,7 +402,7 @@ cohere_mult_3 = ModelMeta(
 )
 cohere_eng_3 = ModelMeta(
-    loader=cohere_v_loader,  # type: ignore
+    loader=cohere_v_loader,
     loader_kwargs={"model_name": "embed-english-v3.0"},
     name="cohere/embed-english-v3.0",
     model_type=["dense"],

mteb/models/model_implementations/dino_models.py CHANGED Viewed

@@ -104,7 +104,7 @@ dinov2_training_datasets = set(
 dinov2_small = ModelMeta(
-    loader=DINOModel,  # type: ignore
+    loader=DINOModel,
     name="facebook/dinov2-small",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -125,7 +125,7 @@ dinov2_small = ModelMeta(
     use_instructions=False,
     training_datasets=dinov2_training_datasets,
     citation="""@misc{oquab2023dinov2,
-      title={DINOv2: Learning Robust Visual Features without Supervision},
+      title={DINOv2: Learning Robust Visual Features without Supervision},
       author={Maxime Oquab and Timothée Darcet and Théo Moutakanni and Huy Vo and Marc Szafraniec and Vasil Khalidov and Pierre Fernandez and Daniel Haziza and Francisco Massa and Alaaeldin El-Nouby and Mahmoud Assran and Nicolas Ballas and Wojciech Galuba and Russell Howes and Po-Yao Huang and Shang-Wen Li and Ishan Misra and Michael Rabbat and Vasu Sharma and Gabriel Synnaeve and Hu Xu and Hervé Jegou and Julien Mairal and Patrick Labatut and Armand Joulin and Piotr Bojanowski},
       year={2023},
       eprint={2304.07193},
@@ -135,7 +135,7 @@ dinov2_small = ModelMeta(
 )
 dinov2_base = ModelMeta(
-    loader=DINOModel,  # type: ignore
+    loader=DINOModel,
     name="facebook/dinov2-base",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -156,7 +156,7 @@ dinov2_base = ModelMeta(
     use_instructions=False,
     training_datasets=dinov2_training_datasets,
     citation="""@misc{oquab2023dinov2,
-      title={DINOv2: Learning Robust Visual Features without Supervision},
+      title={DINOv2: Learning Robust Visual Features without Supervision},
       author={Maxime Oquab and Timothée Darcet and Théo Moutakanni and Huy Vo and Marc Szafraniec and Vasil Khalidov and Pierre Fernandez and Daniel Haziza and Francisco Massa and Alaaeldin El-Nouby and Mahmoud Assran and Nicolas Ballas and Wojciech Galuba and Russell Howes and Po-Yao Huang and Shang-Wen Li and Ishan Misra and Michael Rabbat and Vasu Sharma and Gabriel Synnaeve and Hu Xu and Hervé Jegou and Julien Mairal and Patrick Labatut and Armand Joulin and Piotr Bojanowski},
       year={2023},
       eprint={2304.07193},
@@ -166,7 +166,7 @@ dinov2_base = ModelMeta(
 )
 dinov2_large = ModelMeta(
-    loader=DINOModel,  # type: ignore
+    loader=DINOModel,
     name="facebook/dinov2-large",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -187,7 +187,7 @@ dinov2_large = ModelMeta(
     use_instructions=False,
     training_datasets=dinov2_training_datasets,
     citation="""@misc{oquab2023dinov2,
-      title={DINOv2: Learning Robust Visual Features without Supervision},
+      title={DINOv2: Learning Robust Visual Features without Supervision},
       author={Maxime Oquab and Timothée Darcet and Théo Moutakanni and Huy Vo and Marc Szafraniec and Vasil Khalidov and Pierre Fernandez and Daniel Haziza and Francisco Massa and Alaaeldin El-Nouby and Mahmoud Assran and Nicolas Ballas and Wojciech Galuba and Russell Howes and Po-Yao Huang and Shang-Wen Li and Ishan Misra and Michael Rabbat and Vasu Sharma and Gabriel Synnaeve and Hu Xu and Hervé Jegou and Julien Mairal and Patrick Labatut and Armand Joulin and Piotr Bojanowski},
       year={2023},
       eprint={2304.07193},
@@ -197,7 +197,7 @@ dinov2_large = ModelMeta(
 )
 dinov2_giant = ModelMeta(
-    loader=DINOModel,  # type: ignore
+    loader=DINOModel,
     name="facebook/dinov2-giant",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -218,7 +218,7 @@ dinov2_giant = ModelMeta(
     use_instructions=False,
     training_datasets=dinov2_training_datasets,
     citation="""@misc{oquab2023dinov2,
-      title={DINOv2: Learning Robust Visual Features without Supervision},
+      title={DINOv2: Learning Robust Visual Features without Supervision},
       author={Maxime Oquab and Timothée Darcet and Théo Moutakanni and Huy Vo and Marc Szafraniec and Vasil Khalidov and Pierre Fernandez and Daniel Haziza and Francisco Massa and Alaaeldin El-Nouby and Mahmoud Assran and Nicolas Ballas and Wojciech Galuba and Russell Howes and Po-Yao Huang and Shang-Wen Li and Ishan Misra and Michael Rabbat and Vasu Sharma and Gabriel Synnaeve and Hu Xu and Hervé Jegou and Julien Mairal and Patrick Labatut and Armand Joulin and Piotr Bojanowski},
       year={2023},
       eprint={2304.07193},
@@ -253,7 +253,7 @@ webssl_dino300m_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -284,7 +284,7 @@ webssl_dino1b_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -315,7 +315,7 @@ webssl_dino2b_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -346,7 +346,7 @@ webssl_dino3b_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -377,7 +377,7 @@ webssl_dino5b_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -408,7 +408,7 @@ webssl_dino7b_full8b_224 = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -439,7 +439,7 @@ webssl_dino7b_full8b_378 = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -470,7 +470,7 @@ webssl_dino7b_full8b_518 = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -502,7 +502,7 @@ webssl_dino2b_light2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -533,7 +533,7 @@ webssl_dino2b_heavy2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -564,7 +564,7 @@ webssl_dino3b_light2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -595,7 +595,7 @@ webssl_dino3b_heavy2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -626,7 +626,7 @@ webssl_mae300m_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -657,7 +657,7 @@ webssl_mae700m_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},
@@ -688,7 +688,7 @@ webssl_mae1b_full2b = ModelMeta(
     use_instructions=False,
     training_datasets=webssl_dino_training_datasets,
     citation="""@article{fan2025scaling,
-  title={Scaling Language-Free Visual Representation Learning},
+  title={Scaling Language-Free Visual Representation Learning},
   author={David Fan and Shengbang Tong and Jiachen Zhu and Koustuv Sinha and Zhuang Liu and Xinlei Chen and Michael Rabbat and Nicolas Ballas and Yann LeCun and Amir Bar and Saining Xie},
   year={2025},
   eprint={2504.01017},

mteb/models/model_implementations/emillykkejensen_models.py CHANGED Viewed

@@ -2,7 +2,7 @@ from mteb.models.model_meta import ModelMeta
 from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
 embedding_gemma_300m_scandi = ModelMeta(
-    loader=sentence_transformers_loader,  # type: ignore
+    loader=sentence_transformers_loader,
     name="emillykkejensen/EmbeddingGemma-Scandi-300m",
     model_type=["dense"],
     languages=["dan-Latn", "swe-Latn", "nor-Latn", "nob-Latn", "nno-Latn"],
@@ -35,7 +35,7 @@ embedding_gemma_300m_scandi = ModelMeta(
 qwen_scandi = ModelMeta(
-    loader=sentence_transformers_loader,  # type: ignore
+    loader=sentence_transformers_loader,
     name="emillykkejensen/Qwen3-Embedding-Scandi-0.6B",
     model_type=["dense"],
     languages=["dan-Latn", "swe-Latn", "nor-Latn", "nob-Latn", "nno-Latn"],
@@ -59,7 +59,7 @@ qwen_scandi = ModelMeta(
 mmbert_scandi = ModelMeta(
-    loader=sentence_transformers_loader,  # type: ignore
+    loader=sentence_transformers_loader,
     name="emillykkejensen/mmBERTscandi-base-embedding",
     model_type=["dense"],
     languages=["dan-Latn", "swe-Latn", "nor-Latn", "nob-Latn", "nno-Latn"],

mteb/models/model_implementations/jina_clip.py CHANGED Viewed

@@ -121,7 +121,7 @@ class JinaCLIPModel(AbsEncoder):
 jina_clip_v1 = ModelMeta(
-    loader=JinaCLIPModel,  # type: ignore
+    loader=JinaCLIPModel,
     name="jinaai/jina-clip-v1",
     model_type=["dense"],
     languages=["eng-Latn"],

mteb/models/model_implementations/jina_models.py CHANGED Viewed

@@ -795,7 +795,7 @@ jina_embeddings_v4 = ModelMeta(
 jina_embeddings_v3 = ModelMeta(
-    loader=JinaWrapper,  # type: ignore
+    loader=JinaWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts={

mteb/models/model_implementations/kennethenevoldsen_models.py CHANGED Viewed

@@ -4,7 +4,7 @@ from mteb.models.sentence_transformer_wrapper import (
 )
 dfm_enc_large = ModelMeta(
-    loader=sentence_transformers_loader,  # type: ignore
+    loader=sentence_transformers_loader,
     name="KennethEnevoldsen/dfm-sentence-encoder-large",
     model_type=["dense"],
     languages=["dan-Latn"],
@@ -39,7 +39,7 @@ dfm_enc_large = ModelMeta(
 )
 dfm_enc_med = ModelMeta(
-    loader=sentence_transformers_loader,  # type: ignore
+    loader=sentence_transformers_loader,
     name="KennethEnevoldsen/dfm-sentence-encoder-medium",
     model_type=["dense"],
     languages=["dan-Latn"],

mteb/models/model_implementations/llm2clip_models.py CHANGED Viewed

@@ -181,7 +181,7 @@ llm2clip_training_sets = set(
 )
 llm2clip_openai_l_14_336 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-L-14-336",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -206,7 +206,7 @@ llm2clip_openai_l_14_336 = ModelMeta(
 # NOTE: https://huggingface.co/microsoft/LLM2CLIP-Openai-L-14-224/discussions/1
 llm2clip_openai_l_14_224 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-L-14-224",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -230,7 +230,7 @@ llm2clip_openai_l_14_224 = ModelMeta(
 )
 llm2clip_openai_b_16 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-B-16",
     model_type=["dense"],
     languages=["eng-Latn"],

mteb/models/model_implementations/moco_models.py CHANGED Viewed

@@ -117,7 +117,7 @@ mocov3_training_datasets = set(
 )
 mocov3_vit_base = ModelMeta(
-    loader=mocov3_loader,  # type: ignore
+    loader=mocov3_loader,
     name="nyu-visionx/moco-v3-vit-b",
     model_type=["dense"],
     languages=["eng-Latn"],
@@ -141,7 +141,7 @@ mocov3_vit_base = ModelMeta(
 )
 mocov3_vit_large = ModelMeta(
-    loader=mocov3_loader,  # type: ignore
+    loader=mocov3_loader,
     name="nyu-visionx/moco-v3-vit-l",
     model_type=["dense"],
     languages=["eng-Latn"],

mteb/models/model_implementations/model2vec_models.py CHANGED Viewed

@@ -139,7 +139,7 @@ class Model2VecModel(AbsEncoder):
             **kwargs: Additional arguments to pass to the wrapper.
         """
         requires_package(self, "model2vec", model_name, "pip install 'mteb[model2vec]'")
-        from model2vec import StaticModel  # type: ignore
+        from model2vec import StaticModel
         self.model_name = model_name
         self.model = StaticModel.from_pretrained(self.model_name)

mteb/models/model_implementations/nomic_models.py CHANGED Viewed

@@ -193,7 +193,7 @@ NOMIC_CITATION = """
 """
 nomic_embed_v1_5 = ModelMeta(
-    loader=NomicWrapper,  # type: ignore
+    loader=NomicWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts=model_prompts,
@@ -222,7 +222,7 @@ nomic_embed_v1_5 = ModelMeta(
 )
 nomic_embed_v1 = ModelMeta(
-    loader=NomicWrapper,  # type: ignore
+    loader=NomicWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts=model_prompts,
@@ -251,7 +251,7 @@ nomic_embed_v1 = ModelMeta(
 )
 nomic_embed_v1_ablated = ModelMeta(
-    loader=NomicWrapper,  # type: ignore
+    loader=NomicWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts=model_prompts,
@@ -279,7 +279,7 @@ nomic_embed_v1_ablated = ModelMeta(
 )
 nomic_embed_v1_unsupervised = ModelMeta(
-    loader=NomicWrapper,  # type: ignore
+    loader=NomicWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts=model_prompts,
@@ -334,7 +334,7 @@ nomic_modern_bert_embed = ModelMeta(
     training_datasets=nomic_training_data,
     public_training_data=None,
     citation="""@misc{nussbaum2024nomic,
-      title={Nomic Embed: Training a Reproducible Long Context Text Embedder},
+      title={Nomic Embed: Training a Reproducible Long Context Text Embedder},
       author={Zach Nussbaum and John X. Morris and Brandon Duderstadt and Andriy Mulyar},
       year={2024},
       eprint={2402.01613},
@@ -446,7 +446,7 @@ m_languages = [
 ]
 nomic_embed_text_v2_moe = ModelMeta(
-    loader=NomicWrapper,  # type: ignore
+    loader=NomicWrapper,
     loader_kwargs=dict(
         trust_remote_code=True,
         model_prompts=model_prompts,
@@ -472,12 +472,12 @@ nomic_embed_text_v2_moe = ModelMeta(
     training_datasets=None,  # did not look into this further
     superseded_by=None,
     citation="""@misc{nussbaum2025trainingsparsemixtureexperts,
-      title={Training Sparse Mixture Of Experts Text Embedding Models},
+      title={Training Sparse Mixture Of Experts Text Embedding Models},
       author={Zach Nussbaum and Brandon Duderstadt},
       year={2025},
       eprint={2502.07972},
       archivePrefix={arXiv},
       primaryClass={cs.CL},
-      url={https://arxiv.org/abs/2502.07972},
+      url={https://arxiv.org/abs/2502.07972},
 }""",
 )

mteb 2.5.3__py3-none-any.whl → 2.5.5__py3-none-any.whl

mteb 2.5.3py3-none-any.whl → 2.5.5py3-none-any.whl