PyPI - mteb - Versions diffs - 2.5.1__py3-none-any.whl → 2.5.3__py3-none-any.whl - Mend

mteb 2.5.1py3-none-any.whl → 2.5.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (148) hide show

mteb/models/model_implementations/inf_models.py CHANGED Viewed

@@ -50,6 +50,7 @@ inf_retriever_v1 = ModelMeta(
         trust_remote_code=True,
     ),
     name="infly/inf-retriever-v1",
+    model_type=["dense"],
     languages=["eng-Latn", "zho-Hans"],
     open_weights=True,
     revision="cb70ca7c31dfa866b2eff2dad229c144d8ddfd91",
@@ -76,6 +77,7 @@ inf_retriever_v1_1_5b = ModelMeta(
         trust_remote_code=True,
     ),
     name="infly/inf-retriever-v1-1.5b",
+    model_type=["dense"],
     languages=["eng-Latn", "zho-Hans"],
     open_weights=True,
     revision="c9c05c2dd50707a486966ba81703021ae2094a06",

mteb/models/model_implementations/jasper_models.py CHANGED Viewed

@@ -286,6 +286,7 @@ jasper_en_v1 = ModelMeta(
         instruction_template="Instruct: {instruction}\nQuery: ",
     ),
     name="NovaSearch/jasper_en_vision_language_v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="d6330ce98f8a0d741e781df845904c9484f00efa",
@@ -332,6 +333,7 @@ Jasper_Token_Compression_600M = ModelMeta(
     loader=InstructSentenceTransformerModel,
     loader_kwargs=jasper_token_compression_600m_loader_kwargs,
     name="infgrad/Jasper-Token-Compression-600M",
+    model_type=["dense"],
     languages=["eng-Latn", "zho-Hans"],
     open_weights=True,
     revision="06a100f753a5a96d9e583b3af79c6fcdfacc4719",

mteb/models/model_implementations/jina_clip.py CHANGED Viewed

@@ -123,6 +123,7 @@ class JinaCLIPModel(AbsEncoder):
 jina_clip_v1 = ModelMeta(
     loader=JinaCLIPModel,  # type: ignore
     name="jinaai/jina-clip-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="06150c7c382d7a4faedc7d5a0d8cdb59308968f4",
     release_date="2024-05-30",

mteb/models/model_implementations/jina_models.py CHANGED Viewed

@@ -720,6 +720,7 @@ jina_reranker_v3 = ModelMeta(
         trust_remote_code=True,
     ),
     name="jinaai/jina-reranker-v3",
+    model_type=["cross-encoder"],
     languages=multilingual_langs,
     open_weights=True,
     revision="050e171c4f75dfec5b648ed8470a2475e5a30f30",
@@ -734,7 +735,6 @@ jina_reranker_v3 = ModelMeta(
     framework=["PyTorch"],
     use_instructions=None,
     reference="https://huggingface.co/jinaai/jina-reranker-v3",
-    is_cross_encoder=True,
     public_training_code=None,
     public_training_data=None,
     training_datasets=JINARerankerV3_TRAINING_DATA,
@@ -763,6 +763,7 @@ jina_embeddings_v4 = ModelMeta(
         },
     ),
     name="jinaai/jina-embeddings-v4",
+    model_type=["dense"],
     languages=XLMR_LANGUAGES,
     open_weights=True,
     revision="4a58ca57710c49f51896e4bc820e202fbf64904b",
@@ -811,6 +812,7 @@ jina_embeddings_v3 = ModelMeta(
         },
     ),
     name="jinaai/jina-embeddings-v3",
+    model_type=["dense"],
     languages=XLMR_LANGUAGES,
     open_weights=True,
     revision="215a6e121fa0183376388ac6b1ae230326bfeaed",
@@ -864,6 +866,7 @@ jina_embeddings_v2_base_en = ModelMeta(
         trust_remote_code=True,
     ),
     name="jinaai/jina-embeddings-v2-base-en",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="6e85f575bc273f1fd840a658067d0157933c83f0",
@@ -927,6 +930,7 @@ jina_embeddings_v2_small_en = ModelMeta(
         trust_remote_code=True,
     ),
     name="jinaai/jina-embeddings-v2-small-en",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="44e7d1d6caec8c883c2d4b207588504d519788d0",
@@ -987,6 +991,7 @@ jina_embeddings_v2_small_en = ModelMeta(
 jina_embedding_b_en_v1 = ModelMeta(
     loader=SentenceTransformerEncoderWrapper,
     name="jinaai/jina-embedding-b-en-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="32aa658e5ceb90793454d22a57d8e3a14e699516",
@@ -1043,6 +1048,7 @@ jina_embedding_b_en_v1 = ModelMeta(
 jina_embedding_s_en_v1 = ModelMeta(
     loader=SentenceTransformerEncoderWrapper,
     name="jinaai/jina-embedding-s-en-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="5ac6cd473e2324c6d5f9e558a6a9f65abb57143e",

mteb/models/model_implementations/kalm_models.py CHANGED Viewed

@@ -769,6 +769,7 @@ HIT_TMG__KaLM_embedding_multilingual_mini_instruct_v1 = ModelMeta(
         prompts_dict=KaLM_task_prompts,
     ),
     name="HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1",
+    model_type=["dense"],
     revision="45e42c89990c40aca042659133fc8b13c28634b5",
     release_date="2024-10-23",
     languages=["eng-Latn", "zho-Hans"],
@@ -793,6 +794,7 @@ HIT_TMG__KaLM_embedding_multilingual_mini_instruct_v1 = ModelMeta(
 HIT_TMG__KaLM_embedding_multilingual_mini_v1 = ModelMeta(
     loader=sentence_transformers_loader,
     name="HIT-TMG/KaLM-embedding-multilingual-mini-v1",
+    model_type=["dense"],
     revision="8a82a0cd2b322b91723e252486f7cce6fd8ac9d3",
     release_date="2024-08-27",
     languages=["eng-Latn", "zho-Hans"],
@@ -823,6 +825,7 @@ HIT_TMG__KaLM_embedding_multilingual_mini_instruct_v1_5 = ModelMeta(
         prompts_dict=KaLM_task_prompts,
     ),
     name="HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1.5",
+    model_type=["dense"],
     revision="fcff2f8a54e4cd96b7766fef1ee960a43d42bb3c",
     release_date="2024-12-26",
     languages=["eng-Latn", "zho-Hans"],
@@ -853,6 +856,7 @@ HIT_TMG__KaLM_embedding_multilingual_mini_instruct_v2 = ModelMeta(
         prompts_dict=KaLM_v2_task_prompts,
     ),
     name="HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v2",
+    model_type=["dense"],
     revision="d2a21c232dc712ae8230af56d1027cf21b7864bf",
     release_date="2025-06-25",
     languages=["eng-Latn", "zho-Hans"],
@@ -883,6 +887,7 @@ KaLM_Embedding_KaLM_embedding_multilingual_mini_instruct_v2_5 = ModelMeta(
         prompts_dict=KaLM_v2_task_prompts,
     ),
     name="KaLM-Embedding/KaLM-embedding-multilingual-mini-instruct-v2.5",
+    model_type=["dense"],
     revision="6a4cfc1084cb459ebd4729b53a8656a61448c720",
     release_date="2025-09-30",
     languages=["eng-Latn", "zho-Hans"],
@@ -931,6 +936,7 @@ KaLM_Embedding_gemma_3_12b_2511 = ModelMeta(
         prompts_dict=KaLM_Embedding_gemma_3_12b_task_prompts,
     ),
     name="tencent/KaLM-Embedding-Gemma3-12B-2511",
+    model_type=["dense"],
     revision="edf22f4753f58b05e3f5495818d31f12db63056d",
     languages=None,
     open_weights=True,

mteb/models/model_implementations/kblab.py CHANGED Viewed

@@ -4,6 +4,7 @@ from mteb.models.model_meta import ModelMeta, ScoringFunction
 sbert_swedish = ModelMeta(
     loader=sentence_transformers_loader,  # type: ignore[arg-type]
     name="KBLab/sentence-bert-swedish-cased",
+    model_type=["dense"],
     languages=["swe-Latn"],
     open_weights=True,
     revision="6b5e83cd29c03729cfdc33d13b1423399b0efb5c",

mteb/models/model_implementations/kennethenevoldsen_models.py CHANGED Viewed

@@ -6,6 +6,7 @@ from mteb.models.sentence_transformer_wrapper import (
 dfm_enc_large = ModelMeta(
     loader=sentence_transformers_loader,  # type: ignore
     name="KennethEnevoldsen/dfm-sentence-encoder-large",
+    model_type=["dense"],
     languages=["dan-Latn"],
     open_weights=True,
     revision="132c53391e7a780dc6a2f9a03724d0158fe7122c",
@@ -40,6 +41,7 @@ dfm_enc_large = ModelMeta(
 dfm_enc_med = ModelMeta(
     loader=sentence_transformers_loader,  # type: ignore
     name="KennethEnevoldsen/dfm-sentence-encoder-medium",
+    model_type=["dense"],
     languages=["dan-Latn"],
     open_weights=True,
     revision="701bce95d499fa97610d57e8823c54fd1fb79930",

mteb/models/model_implementations/kfst.py CHANGED Viewed

@@ -4,6 +4,7 @@ from mteb.models.model_meta import ModelMeta, ScoringFunction
 xlmr_scandi = ModelMeta(
     loader=sentence_transformers_loader,  # type: ignore[arg-type]
     name="KFST/XLMRoberta-en-da-sv-nb",
+    model_type=["dense"],
     languages=["swe-Latn", "nob-Latn", "nno-Latn", "dan-Latn", "eng-Latn"],
     open_weights=True,
     revision="d40c10ca7b1e68b5a8372f2d112dac9eb3279df1",

mteb/models/model_implementations/kowshik24_models.py CHANGED Viewed

@@ -3,6 +3,7 @@ from mteb.models import ModelMeta, sentence_transformers_loader
 kowshik24_bangla_embedding_model = ModelMeta(
     loader=sentence_transformers_loader,
     name="Kowshik24/bangla-sentence-transformer-ft-matryoshka-paraphrase-multilingual-mpnet-base-v2",
+    model_type=["dense"],
     languages=["ben-Beng"],  # Bengali using Bengali script
     open_weights=True,
     revision="6689c21e69be5950596bad084457cbaa138728d8",

mteb/models/model_implementations/lens_models.py CHANGED Viewed

@@ -12,6 +12,7 @@ LENS_CITATION = """@article{lei2025lens,
 lens_d4000 = ModelMeta(
     loader=None,
     name="yibinlei/LENS-d4000",
+    model_type=["dense"],
     languages=None,
     open_weights=True,
     revision="e473b33364e6c48a324796fd1411d3b93670c6fe",
@@ -34,6 +35,7 @@ lens_d4000 = ModelMeta(
 lens_d8000 = ModelMeta(
     loader=None,
     name="yibinlei/LENS-d8000",
+    model_type=["dense"],
     languages=None,
     open_weights=True,
     revision="a0b87bd91cb27b6f2f0b0fe22c28026da1d464ef",

mteb/models/model_implementations/lgai_embedding_models.py CHANGED Viewed

@@ -44,6 +44,7 @@ LGAI_EMBEDDING_TRAINING_DATA = {
 lgai_embedding_en = ModelMeta(
     loader=sentence_transformers_loader,
     name="annamodels/LGAI-Embedding-Preview",
+    model_type=["dense"],
     languages=[
         "eng-Latn",
     ],

mteb/models/model_implementations/linq_models.py CHANGED Viewed

@@ -32,6 +32,7 @@ Linq_Embed_Mistral = ModelMeta(
         normalized=True,
     ),
     name="Linq-AI-Research/Linq-Embed-Mistral",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="0c1a0b0589177079acc552433cad51d7c9132379",

mteb/models/model_implementations/listconranker.py CHANGED Viewed

@@ -112,6 +112,7 @@ listconranker = ModelMeta(
         fp_options="float16",
     ),
     name="ByteDance/ListConRanker",
+    model_type=["cross-encoder"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="95ae6a5f422a916bc36520f0f3e198e7d91520a0",
@@ -128,6 +129,5 @@ listconranker = ModelMeta(
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
-    is_cross_encoder=True,
     citation=LISTCONRANKER_CITATION,
 )

mteb/models/model_implementations/llm2clip_models.py CHANGED Viewed

@@ -183,6 +183,7 @@ llm2clip_training_sets = set(
 llm2clip_openai_l_14_336 = ModelMeta(
     loader=llm2clip_loader,  # type: ignore
     name="microsoft/LLM2CLIP-Openai-L-14-336",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="92512331f393a003c3d98404677f991c188162c9",
     release_date="2024-11-07",
@@ -207,6 +208,7 @@ llm2clip_openai_l_14_336 = ModelMeta(
 llm2clip_openai_l_14_224 = ModelMeta(
     loader=llm2clip_loader,  # type: ignore
     name="microsoft/LLM2CLIP-Openai-L-14-224",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="6b8a11a94ff380fa220dfefe73ac9293d2677575",
     release_date="2024-11-07",
@@ -230,6 +232,7 @@ llm2clip_openai_l_14_224 = ModelMeta(
 llm2clip_openai_b_16 = ModelMeta(
     loader=llm2clip_loader,  # type: ignore
     name="microsoft/LLM2CLIP-Openai-B-16",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="ecfb347eb3dcfeb2fbc2a2eae7de6ac5a001aaf8",
     release_date="2024-11-07",

mteb/models/model_implementations/llm2vec_models.py CHANGED Viewed

@@ -132,6 +132,7 @@ llm2vec_llama3_8b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="baa8ebf04a1c2500e61288e7dad65e8ae42601a7",
@@ -161,6 +162,7 @@ llm2vec_llama3_8b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="1cb7b735326d13a8541db8f57f35da5373f5e9c6",
@@ -189,6 +191,7 @@ llm2vec_mistral7b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="0ae69bdd5816105778b971c3138e8f8a18eaa3ae",
@@ -217,6 +220,7 @@ llm2vec_mistral7b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="2c055a5d77126c0d3dc6cd8ffa30e2908f4f45f8",
@@ -245,6 +249,7 @@ llm2vec_llama2_7b_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="2c055a5d77126c0d3dc6cd8ffa30e2908f4f45f8",
@@ -273,6 +278,7 @@ llm2vec_llama2_7b_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a76944871d169ebe7c97eb921764cd063afed785",
@@ -301,6 +307,7 @@ llm2vec_sheared_llama_supervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-supervised",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a5943d406c6b016fef3f07906aac183cf1a0b47d",
@@ -329,6 +336,7 @@ llm2vec_sheared_llama_unsupervised = ModelMeta(
         torch_dtype=torch.bfloat16,
     ),
     name="McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-unsup-simcse",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a5943d406c6b016fef3f07906aac183cf1a0b47d",

mteb/models/model_implementations/mcinext_models.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import logging
 import os
 import time
+import warnings
 from typing import Any
 import numpy as np
@@ -246,7 +247,9 @@ class HakimModelWrapper(AbsEncoder):
         task_prompt, task_id = DATASET_TASKS.get(task_name, (None, None))
         if not task_prompt:
-            logger.warning(f"Unknown dataset: {task_name}, no preprocessing applied.")
+            msg = f"Unknown dataset: {task_name}, no preprocessing applied."
+            logger.warning(msg)
+            warnings.warn(msg)
             return sample
         task_prompt = f"مسئله : {task_prompt}"
@@ -344,6 +347,7 @@ hakim = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim",
     languages=["fas-Arab"],
@@ -411,6 +415,7 @@ hakim_small = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim-small",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim-small",
     languages=["fas-Arab"],
@@ -477,6 +482,7 @@ hakim_unsup = ModelMeta(
     loader=HakimModelWrapper,
     loader_kwargs=dict(
         api_model_name="hakim-unsup",
+        model_type=["dense"],
     ),
     name="MCINext/Hakim-unsup",
     languages=["fas-Arab"],

mteb/models/model_implementations/mdbr_models.py CHANGED Viewed

@@ -30,6 +30,7 @@ mdbr_leaf_ir = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="MongoDB/mdbr-leaf-ir",
+    model_type=["dense"],
     revision="2e46f5aac796e621d51f678c306a66ede4712ecb",
     release_date="2025-08-27",
     languages=["eng-Latn"],
@@ -57,6 +58,7 @@ mdbr_leaf_mt = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="MongoDB/mdbr-leaf-mt",
+    model_type=["dense"],
     revision="66c47ba6d753efc208d54412b5af6c744a39a4df",
     release_date="2025-08-27",
     languages=["eng-Latn"],

mteb 2.5.1__py3-none-any.whl → 2.5.3__py3-none-any.whl

mteb 2.5.1py3-none-any.whl → 2.5.3py3-none-any.whl