PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (527) hide show

mteb/models/model_implementations/listconranker.py CHANGED Viewed

@@ -112,6 +112,7 @@ listconranker = ModelMeta(
         fp_options="float16",
     ),
     name="ByteDance/ListConRanker",
+    model_type=["cross-encoder"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="95ae6a5f422a916bc36520f0f3e198e7d91520a0",
@@ -124,10 +125,9 @@ listconranker = ModelMeta(
     license="mit",
     max_tokens=512,
     reference="https://huggingface.co/ByteDance/ListConRanker",
-    framework=["PyTorch"],
+    framework=["PyTorch", "Sentence Transformers", "safetensors", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
-    is_cross_encoder=True,
     citation=LISTCONRANKER_CITATION,
 )

mteb/models/model_implementations/llm2clip_models.py CHANGED Viewed

@@ -181,8 +181,9 @@ llm2clip_training_sets = set(
 )
 llm2clip_openai_l_14_336 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-L-14-336",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="92512331f393a003c3d98404677f991c188162c9",
     release_date="2024-11-07",
@@ -195,7 +196,7 @@ llm2clip_openai_l_14_336 = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/microsoft/LLM2CLIP",
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/microsoft/LLM2CLIP-Openai-L-14-336",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=True,
@@ -205,8 +206,9 @@ llm2clip_openai_l_14_336 = ModelMeta(
 # NOTE: https://huggingface.co/microsoft/LLM2CLIP-Openai-L-14-224/discussions/1
 llm2clip_openai_l_14_224 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-L-14-224",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="6b8a11a94ff380fa220dfefe73ac9293d2677575",
     release_date="2024-11-07",
@@ -219,7 +221,7 @@ llm2clip_openai_l_14_224 = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/microsoft/LLM2CLIP",
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/microsoft/LLM2CLIP-Openai-L-14-224",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=True,
@@ -228,8 +230,9 @@ llm2clip_openai_l_14_224 = ModelMeta(
 )
 llm2clip_openai_b_16 = ModelMeta(
-    loader=llm2clip_loader,  # type: ignore
+    loader=llm2clip_loader,
     name="microsoft/LLM2CLIP-Openai-B-16",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="ecfb347eb3dcfeb2fbc2a2eae7de6ac5a001aaf8",
     release_date="2024-11-07",
@@ -242,7 +245,7 @@ llm2clip_openai_b_16 = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/microsoft/LLM2CLIP",
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/microsoft/LLM2CLIP-Openai-B-16",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=True,

mteb/models/model_implementations/llm2vec_models.py CHANGED Viewed

@@ -132,6 +132,7 @@ llm2vec_llama3_8b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="baa8ebf04a1c2500e61288e7dad65e8ae42601a7",
@@ -144,7 +145,7 @@ llm2vec_llama3_8b_supervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-supervised",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
     training_datasets=llm2vec_supervised_training_data,
@@ -161,6 +162,7 @@ llm2vec_llama3_8b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="1cb7b735326d13a8541db8f57f35da5373f5e9c6",
@@ -172,7 +174,7 @@ llm2vec_llama3_8b_unsupervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-unsup-simcse",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
@@ -189,6 +191,7 @@ llm2vec_mistral7b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="0ae69bdd5816105778b971c3138e8f8a18eaa3ae",
@@ -200,7 +203,7 @@ llm2vec_mistral7b_supervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-supervised",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
@@ -217,6 +220,7 @@ llm2vec_mistral7b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="2c055a5d77126c0d3dc6cd8ffa30e2908f4f45f8",
@@ -228,7 +232,7 @@ llm2vec_mistral7b_unsupervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-unsup-simcse",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
@@ -245,6 +249,7 @@ llm2vec_llama2_7b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="2c055a5d77126c0d3dc6cd8ffa30e2908f4f45f8",
@@ -256,7 +261,7 @@ llm2vec_llama2_7b_supervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-supervised",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
@@ -273,6 +278,7 @@ llm2vec_llama2_7b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a76944871d169ebe7c97eb921764cd063afed785",
@@ -284,7 +290,7 @@ llm2vec_llama2_7b_unsupervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-unsup-simcse",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
     training_datasets=set(),
@@ -301,6 +307,7 @@ llm2vec_sheared_llama_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a5943d406c6b016fef3f07906aac183cf1a0b47d",
@@ -312,7 +319,7 @@ llm2vec_sheared_llama_supervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-supervised",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",
@@ -329,6 +336,7 @@ llm2vec_sheared_llama_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a5943d406c6b016fef3f07906aac183cf1a0b47d",
@@ -340,7 +348,7 @@ llm2vec_sheared_llama_unsupervised = ModelMeta(
     license="mit",
     reference="https://huggingface.co/McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-unsup-simcse",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["LLM2Vec", "PyTorch"],
+    framework=["LLM2Vec", "PyTorch", "safetensors"],
     use_instructions=True,
     citation=LLM2VEC_CITATION,
     public_training_code="https://github.com/McGill-NLP/llm2vec/tree/250292a307428240d801fadd85825464e71c3277/train_configs",

mteb/models/model_implementations/mcinext_models.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import logging
 import os
 import time
+import warnings
 from typing import Any
 import numpy as np
@@ -246,7 +247,9 @@ class HakimModelWrapper(AbsEncoder):
         task_prompt, task_id = DATASET_TASKS.get(task_name, (None, None))
         if not task_prompt:
-            logger.warning(f"Unknown dataset: {task_name}, no preprocessing applied.")
+            msg = f"Unknown dataset: {task_name}, no preprocessing applied."
+            logger.warning(msg)
+            warnings.warn(msg)
             return sample
         task_prompt = f"مسئله : {task_prompt}"
@@ -344,6 +347,7 @@ hakim = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim",
     languages=["fas-Arab"],
@@ -411,6 +415,7 @@ hakim_small = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim-small",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim-small",
     languages=["fas-Arab"],
@@ -477,6 +482,7 @@ hakim_unsup = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim-unsup",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim-unsup",
     languages=["fas-Arab"],

mteb/models/model_implementations/mdbr_models.py CHANGED Viewed

@@ -1,5 +1,7 @@
 from mteb.models.model_implementations.arctic_models import arctic_v1_training_datasets
-from mteb.models.model_implementations.mxbai_models import mixedbread_training_data
+from mteb.models.model_implementations.mixedbread_ai_models import (
+    mixedbread_training_data,
+)
 from mteb.models.model_meta import ModelMeta
 from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
@@ -30,11 +32,18 @@ mdbr_leaf_ir = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="MongoDB/mdbr-leaf-ir",
+    model_type=["dense"],
     revision="2e46f5aac796e621d51f678c306a66ede4712ecb",
     release_date="2025-08-27",
     languages=["eng-Latn"],
     open_weights=True,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=[
+        "Sentence Transformers",
+        "PyTorch",
+        "ONNX",
+        "safetensors",
+        "Transformers",
+    ],
     n_parameters=22_861_056,
     memory_usage_mb=86,
     max_tokens=512,
@@ -57,11 +66,18 @@ mdbr_leaf_mt = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="MongoDB/mdbr-leaf-mt",
+    model_type=["dense"],
     revision="66c47ba6d753efc208d54412b5af6c744a39a4df",
     release_date="2025-08-27",
     languages=["eng-Latn"],
     open_weights=True,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=[
+        "Sentence Transformers",
+        "PyTorch",
+        "ONNX",
+        "safetensors",
+        "Transformers",
+    ],
     n_parameters=22_958_592,
     memory_usage_mb=86,
     max_tokens=512,

mteb 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl