PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.5.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.5.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (458) hide show

mteb/models/model_implementations/openclip_models.py CHANGED Viewed

@@ -10,6 +10,14 @@ from mteb.models.abs_encoder import AbsEncoder
 from mteb.models.model_meta import ModelMeta, ScoringFunction
 from mteb.types import Array, BatchedInput, PromptType
+OPENCLIP_CITATION = """@inproceedings{cherti2023reproducible,
+    title={Reproducible scaling laws for contrastive language-image learning},
+    author={Cherti, Mehdi and Beaumont, Romain and Wightman, Ross and Wortsman, Mitchell and Ilharco, Gabriel and Gordon, Cade and Schuhmann, Christoph and Schmidt, Ludwig and Jitsev, Jenia},
+    booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
+    pages={2818--2829},
+    year={2023}
+}"""
 def openclip_loader(model_name, **kwargs):
     requires_package(
@@ -114,6 +122,7 @@ def openclip_loader(model_name, **kwargs):
 CLIP_ViT_L_14_DataComp_XL_s13B_b90K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-L-14-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="84c9828e63dc9a9351d1fe637c346d4c1c4db341",
     release_date="2023-04-26",
@@ -133,11 +142,13 @@ CLIP_ViT_L_14_DataComp_XL_s13B_b90K = ModelMeta(
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_32_DataComp_XL_s13B_b90K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-B-32-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="f0e2ffa09cbadab3db6a261ec1ec56407ce42912",
     release_date="2023-04-26",
@@ -157,11 +168,13 @@ CLIP_ViT_B_32_DataComp_XL_s13B_b90K = ModelMeta(
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_16_DataComp_XL_s13B_b90K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-B-16-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="d110532e8d4ff91c574ee60a342323f28468b287",
     release_date="2023-04-26",
@@ -181,11 +194,13 @@ CLIP_ViT_B_16_DataComp_XL_s13B_b90K = ModelMeta(
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_bigG_14_laion2B_39B_b160k = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-bigG-14-laion2B-39B-b160k",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="bc7788f151930d91b58474715fdce5524ad9a189",
     release_date="2023-01-23",
@@ -205,11 +220,13 @@ CLIP_ViT_bigG_14_laion2B_39B_b160k = ModelMeta(
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_g_14_laion2B_s34B_b88K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-g-14-laion2B-s34B-b88K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="15efd0f6ac0c40c0f9da7becca03c974d7012604",
     release_date="2023-03-06",
@@ -229,11 +246,13 @@ CLIP_ViT_g_14_laion2B_s34B_b88K = ModelMeta(
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_H_14_laion2B_s32B_b79K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-H-14-laion2B-s32B-b79K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="de081ac0a0ca8dc9d1533eed1ae884bb8ae1404b",
     release_date="2022-09-15",
@@ -253,11 +272,13 @@ CLIP_ViT_H_14_laion2B_s32B_b79K = ModelMeta(
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_L_14_laion2B_s32B_b82K = ModelMeta(
     loader=openclip_loader,  # type: ignore
     name="laion/CLIP-ViT-L-14-laion2B-s32B-b82K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="1627032197142fbe2a7cfec626f4ced3ae60d07a",
     release_date="2022-09-15",
@@ -277,11 +298,13 @@ CLIP_ViT_L_14_laion2B_s32B_b82K = ModelMeta(
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_32_laion2B_s34B_b79K = ModelMeta(
     loader=openclip_loader,
     name="laion/CLIP-ViT-B-32-laion2B-s34B-b79K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="08f73555f1b2fb7c82058aebbd492887a94968ef",
     release_date="2022-09-15",
@@ -301,4 +324,5 @@ CLIP_ViT_B_32_laion2B_s34B_b79K = ModelMeta(
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )

mteb/models/model_implementations/opensearch_neural_sparse_models.py CHANGED Viewed

@@ -128,6 +128,7 @@ class SparseEncoderWrapper(AbsEncoder):
 opensearch_neural_sparse_encoding_doc_v3_gte = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v3-gte",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a8abaa916125ee512a7a8f4d706d07eb0128a8e6",
@@ -153,6 +154,7 @@ opensearch_neural_sparse_encoding_doc_v3_gte = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v3_distill = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v3-distill",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="babf71f3c48695e2e53a978208e8aba48335e3c0",
@@ -174,6 +176,7 @@ opensearch_neural_sparse_encoding_doc_v3_distill = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v2_distill = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v2-distill",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="8921a26c78b8559d6604eb1f5c0b74c079bee38f",
@@ -196,6 +199,7 @@ opensearch_neural_sparse_encoding_doc_v2_distill = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v2_mini = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v2-mini",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="4af867a426867dfdd744097531046f4289a32fdd",
@@ -217,6 +221,7 @@ opensearch_neural_sparse_encoding_doc_v2_mini = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v1 = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="98cdcbd72867c547f72f2b7b7bed9cdf9f09922d",

mteb/models/model_implementations/ops_moa_models.py CHANGED Viewed

@@ -22,12 +22,13 @@ class OPSWrapper(AbsEncoder):
 ops_moa_conan_embedding = ModelMeta(
     name="OpenSearch-AI/Ops-MoA-Conan-embedding-v1",
+    model_type=["dense"],
     revision="46dcd58753f3daa920c66f89e47086a534089350",
     release_date="2025-03-26",
     languages=["zho-Hans"],
     loader=OPSWrapper,
     n_parameters=int(343 * 1e6),
-    memory_usage_mb=2e3,
+    memory_usage_mb=1308,
     max_tokens=512,
     embed_dim=1536,
     license="cc-by-nc-4.0",
@@ -53,12 +54,13 @@ ops_moa_conan_embedding = ModelMeta(
 ops_moa_yuan_embedding = ModelMeta(
     name="OpenSearch-AI/Ops-MoA-Yuan-embedding-1.0",
+    model_type=["dense"],
     revision="23712d0766417b0eb88a2513c6e212a58b543268",
     release_date="2025-03-26",
     languages=["zho-Hans"],
     loader=OPSWrapper,
     n_parameters=int(343 * 1e6),
-    memory_usage_mb=2e3,
+    memory_usage_mb=1242,
     max_tokens=512,
     embed_dim=1536,
     license="cc-by-nc-4.0",

mteb/models/model_implementations/pawan_models.py ADDED Viewed

@@ -0,0 +1,39 @@
+from mteb.models.model_meta import (
+    ModelMeta,
+    ScoringFunction,
+)
+from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
+PAWAN_EMBD_CITATION = """@misc{medhi2025pawanembd,
+    title={PawanEmbd-68M: Distilled Embedding Model},
+    author={Medhi, D.},
+    year={2025},
+    url={https://huggingface.co/dmedhi/PawanEmbd-68M}
+}"""
+pawan_embd_68m = ModelMeta(
+    loader=sentence_transformers_loader,
+    name="dmedhi/PawanEmbd-68M",
+    model_type=["dense"],
+    languages=["eng-Latn"],
+    open_weights=True,
+    revision="32f295145802bdbd65699ad65fd27d2a5b69a909",
+    release_date="2025-12-08",
+    n_parameters=68_000_000,
+    memory_usage_mb=260,
+    embed_dim=768,
+    license="apache-2.0",
+    max_tokens=512,
+    reference="https://huggingface.co/dmedhi/PawanEmbd-68M",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["Sentence Transformers", "PyTorch"],
+    adapted_from="ibm-granite/granite-embedding-278m-multilingual",
+    superseded_by=None,
+    public_training_code=None,
+    public_training_data=None,
+    use_instructions=False,
+    training_datasets={
+        "AllNLI",
+    },
+    citation=PAWAN_EMBD_CITATION,
+)

mteb/models/model_implementations/piccolo_models.py CHANGED Viewed

@@ -6,6 +6,7 @@ from mteb.models.sentence_transformer_wrapper import sentence_transformers_loade
 piccolo_base_zh = ModelMeta(
     loader=sentence_transformers_loader,
     name="sensenova/piccolo-base-zh",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="47c0a63b8f667c3482e05b2fd45577bb19252196",
@@ -29,6 +30,7 @@ piccolo_base_zh = ModelMeta(
 piccolo_large_zh_v2 = ModelMeta(
     loader=sentence_transformers_loader,
     name="sensenova/piccolo-large-zh-v2",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=False,  # They "temporarily" removed it in may last year
     # "Due to certain internal company considerations"
@@ -48,4 +50,10 @@ piccolo_large_zh_v2 = ModelMeta(
     public_training_code=None,
     public_training_data=None,
     training_datasets=None,  # They don't say
+    citation="""@misc{2405.06932,
+    Author = {Junqin Huang and Zhongjie Hu and Zihao Jing and Mengya Gao and Yichao Wu},
+    Title = {Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training},
+    Year = {2024},
+    Eprint = {arXiv:2405.06932},
+}""",
 )

mteb/models/model_implementations/promptriever_models.py CHANGED Viewed

@@ -75,12 +75,13 @@ promptriever_llama2 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama2-7b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-30b14e3813c0fa45facfd01a594580c3fe5ecf23",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=7_000_000_000,
-    memory_usage_mb=27,
+    memory_usage_mb=26703,
     max_tokens=4096,
     embed_dim=4096,
     license="apache-2.0",
@@ -106,6 +107,7 @@ promptriever_llama3 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama3.1-8b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="48d6d0fc4e02fb1269b36940650a1b7233035cbb-2ead22cfb1b0e0c519c371c63c2ab90ffc511b8a",  # base-peft revision
@@ -115,7 +117,7 @@ promptriever_llama3 = ModelMeta(
     },
     release_date="2024-09-15",
     n_parameters=8_000_000_000,
-    memory_usage_mb=31,
+    memory_usage_mb=30518,
     max_tokens=8192,
     embed_dim=4096,
     license="apache-2.0",
@@ -138,12 +140,13 @@ promptriever_llama3_instruct = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama3.1-8b-instruct-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="5206a32e0bd3067aef1ce90f5528ade7d866253f-8b677258615625122c2eb7329292b8c402612c21",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=8_000_000_000,
-    memory_usage_mb=31,
+    memory_usage_mb=30518,
     max_tokens=8192,
     embed_dim=4096,
     training_datasets={
@@ -170,12 +173,13 @@ promptriever_mistral_v1 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-mistral-v0.1-7b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="7231864981174d9bee8c7687c24c8344414eae6b-876d63e49b6115ecb6839893a56298fadee7e8f5",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=7_000_000_000,
-    memory_usage_mb=27,
+    memory_usage_mb=26703,
     training_datasets={
         # "samaya-ai/msmarco-w-instructions",
         "mMARCO-NL",  # translation not trained on

mteb/models/model_implementations/pylate_models.py CHANGED Viewed

@@ -328,18 +328,16 @@ class MultiVectorModel(AbsEncoder, PylateSearchEncoder):
             inputs,
             prompt_name=prompt_name,
             is_query=prompt_type == PromptType.query,
-            convert_to_tensor=True,
             **kwargs,
         )
-        # encode returns a list of tensors shaped (x, token_dim), pad to uniform length
-        pred = torch.nn.utils.rnn.pad_sequence(pred, batch_first=True, padding_value=0)
-        return pred.cpu().numpy()
+        return pred
 colbert_v2 = ModelMeta(
     loader=MultiVectorModel,
     name="colbert-ir/colbertv2.0",
+    model_type=["late-interaction"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="c1e84128e85ef755c096a95bdb06b47793b13acf",
@@ -372,6 +370,7 @@ jina_colbert_v2 = ModelMeta(
         trust_remote_code=True,
     ),
     name="jinaai/jina-colbert-v2",
+    model_type=["late-interaction"],
     languages=[
         "ara-Arab",
         "ben-Beng",
@@ -418,12 +417,37 @@ jina_colbert_v2 = ModelMeta(
         "DuRetrieval",
         "MIRACL",
     },
+    citation="""@inproceedings{xiao-etal-2024-jina,
+    title = "{J}ina-{C}ol{BERT}-v2: A General-Purpose Multilingual Late Interaction Retriever",
+    author = {Jha, Rohan  and
+      Wang, Bo  and
+      G{\"u}nther, Michael  and
+      Mastrapas, Georgios  and
+      Sturua, Saba  and
+      Mohr, Isabelle  and
+      Koukounas, Andreas  and
+      Wang, Mohammad Kalim  and
+      Wang, Nan  and
+      Xiao, Han},
+    editor = {S{\"a}lev{\"a}, Jonne  and
+      Owodunni, Abraham},
+    booktitle = "Proceedings of the Fourth Workshop on Multilingual Representation Learning (MRL 2024)",
+    month = nov,
+    year = "2024",
+    address = "Miami, Florida, USA",
+    publisher = "Association for Computational Linguistics",
+    url = "https://aclanthology.org/2024.mrl-1.11/",
+    doi = "10.18653/v1/2024.mrl-1.11",
+    pages = "159--166",
+    abstract = "Multi-vector dense models, such as ColBERT, have proven highly effective in information retrieval. ColBERT`s late interaction scoring approximates the joint query-document attention seen in cross-encoders while maintaining inference efficiency closer to traditional dense retrieval models, thanks to its bi-encoder architecture and recent optimizations in indexing and search. In this paper, we introduce a novel architecture and a training framework to support long context window and multilingual retrieval. Leveraging Matryoshka Representation Loss, we further demonstrate that the reducing the embedding dimensionality from 128 to 64 has insignificant impact on the model`s retrieval performance and cut storage requirements by up to 50{\%}. Our new model, Jina-ColBERT-v2, demonstrates strong performance across a range of English and multilingual retrieval tasks,"
+}""",
 )
 lightonai__gte_moderncolbert_v1 = ModelMeta(
     loader=MultiVectorModel,
     name="lightonai/GTE-ModernColBERT-v1",
+    model_type=["late-interaction"],
     languages=[
         "eng-Latn",
     ],
@@ -447,4 +471,13 @@ lightonai__gte_moderncolbert_v1 = ModelMeta(
         "MSMARCO",
         "mMARCO-NL",
     },
+    citation="""@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084"
+}""",
 )

mteb/models/model_implementations/qodo_models.py CHANGED Viewed

@@ -30,6 +30,7 @@ qodo_languages = [
 Qodo_Embed_1_1_5B = ModelMeta(
     loader=sentence_transformers_loader,
     name="Qodo/Qodo-Embed-1-1.5B",
+    model_type=["dense"],
     languages=qodo_languages,
     open_weights=True,
     revision="84bbef079b32e8823ec226d4e9e92902706b0eb6",
@@ -52,6 +53,7 @@ Qodo_Embed_1_1_5B = ModelMeta(
 Qodo_Embed_1_7B = ModelMeta(
     loader=sentence_transformers_loader,
     name="Qodo/Qodo-Embed-1-7B",
+    model_type=["dense"],
     languages=qodo_languages,
     open_weights=True,
     revision="f9edd9bf7f687c0e832424058e265120f603cd81",

mteb/models/model_implementations/qtack_models.py CHANGED Viewed

@@ -25,6 +25,7 @@ mini_gte_datasets = {
 mini_gte = ModelMeta(
     loader=sentence_transformers_loader,
     name="prdev/mini-gte",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="7fbe6f9b4cc42615e0747299f837ad7769025492",

mteb/models/model_implementations/qwen3_models.py CHANGED Viewed

@@ -134,12 +134,13 @@ def q3e_instruct_loader(
 Qwen3_Embedding_0B6 = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-0.6B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="b22da495047858cce924d27d76261e96be6febc0",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=595776512,
-    memory_usage_mb=2272,
+    memory_usage_mb=1136,
     embed_dim=1024,
     max_tokens=32768,
     license="apache-2.0",
@@ -156,12 +157,13 @@ Qwen3_Embedding_0B6 = ModelMeta(
 Qwen3_Embedding_4B = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-4B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="636cd9bf47d976946cdbb2b0c3ca0cb2f8eea5ff",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=4021774336,
-    memory_usage_mb=15341,
+    memory_usage_mb=7671,
     embed_dim=2560,
     max_tokens=32768,
     license="apache-2.0",
@@ -178,12 +180,13 @@ Qwen3_Embedding_4B = ModelMeta(
 Qwen3_Embedding_8B = ModelMeta(
     loader=q3e_instruct_loader,
     name="Qwen/Qwen3-Embedding-8B",
+    model_type=["dense"],
     languages=multilingual_langs,
     open_weights=True,
     revision="4e423935c619ae4df87b646a3ce949610c66241c",  # Commit of @tomaarsen
     release_date="2025-06-05",
     n_parameters=7567295488,
-    memory_usage_mb=28866,
+    memory_usage_mb=14433,
     embed_dim=4096,
     max_tokens=32768,
     license="apache-2.0",

mteb/models/model_implementations/qzhou_models.py CHANGED Viewed

@@ -58,12 +58,13 @@ QZhou_Embedding = ModelMeta(
         apply_instruction_to_passages=False,
     ),
     name="Kingsoft-LLM/QZhou-Embedding",
+    model_type=["dense"],
     languages=["eng-Latn", "zho-Hans"],
     open_weights=True,
     revision="f1e6c03ee3882e7b9fa5cec91217715272e433b8",
     release_date="2025-08-24",
     n_parameters=7_070_619_136,
-    memory_usage_mb=29070,
+    memory_usage_mb=14436,
     embed_dim=3584,
     license="apache-2.0",
     max_tokens=8192,
@@ -91,6 +92,7 @@ QZhou_Embedding_Zh = ModelMeta(
         apply_instruction_to_passages=False,
     ),
     name="Kingsoft-LLM/QZhou-Embedding-Zh",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="0321ccb126413d1e49c5ce908e802b63d35f18e2",

mteb/models/model_implementations/random_baseline.py CHANGED Viewed

@@ -1,15 +1,23 @@
+from __future__ import annotations
 import hashlib
-from typing import Any, Literal
+from typing import TYPE_CHECKING, Any, Literal
 import numpy as np
 import torch
-from PIL import Image
 from torch.utils.data import DataLoader
 from mteb.abstasks.task_metadata import TaskMetadata
 from mteb.models.model_meta import ModelMeta
+from mteb.similarity_functions import (
+    select_pairwise_similarity,
+    select_similarity,
+)
 from mteb.types._encoder_io import Array, BatchedInput, PromptType
+if TYPE_CHECKING:
+    from PIL import Image
 def _string_to_vector(text: str | None, size: int) -> np.ndarray:
     """Generate a deterministic random vector based on a string.
@@ -155,15 +163,9 @@ class RandomEncoderBaseline:
         Returns:
             Cosine similarity matrix between the two sets of embeddings
         """
-        norm1 = np.linalg.norm(
-            embeddings1.reshape(-1, self.embedding_dim), axis=1, keepdims=True
+        return select_similarity(
+            embeddings1, embeddings2, self.mteb_model_meta.similarity_fn_name
         )
-        norm2 = np.linalg.norm(
-            embeddings2.reshape(-1, self.embedding_dim), axis=1, keepdims=True
-        )
-        normalized1 = embeddings1 / (norm1 + 1e-10)
-        normalized2 = embeddings2 / (norm2 + 1e-10)
-        return np.dot(normalized1, normalized2.T)
     def similarity_pairwise(
         self,
@@ -179,22 +181,15 @@ class RandomEncoderBaseline:
         Returns:
             Cosine similarity for each pair of embeddings
         """
-        norm1 = np.linalg.norm(
-            embeddings1.reshape(-1, self.embedding_dim), axis=1, keepdims=True
-        )
-        norm2 = np.linalg.norm(
-            embeddings2.reshape(-1, self.embedding_dim), axis=1, keepdims=True
+        return select_pairwise_similarity(
+            embeddings1, embeddings2, self.mteb_model_meta.similarity_fn_name
         )
-        normalized1 = embeddings1 / (norm1 + 1e-10)
-        normalized2 = embeddings2 / (norm2 + 1e-10)
-        normalized1 = np.asarray(normalized1)
-        normalized2 = np.asarray(normalized2)
-        return np.sum(normalized1 * normalized2, axis=1)
 random_encoder_baseline = ModelMeta(
     loader=RandomEncoderBaseline,  # type: ignore
     name="baseline/random-encoder-baseline",
+    model_type=["dense"],
     modalities=["text", "image"],
     **_common_mock_metadata,
 )
@@ -239,7 +234,7 @@ class RandomCrossEncoderBaseline:
 random_cross_encoder_baseline = ModelMeta(
     loader=RandomCrossEncoderBaseline,  # type: ignore
     name="baseline/random-cross-encoder-baseline",
+    model_type=["cross-encoder"],
     modalities=["text", "image"],
-    is_cross_encoder=True,
     **_common_mock_metadata,
 )

mteb/models/model_implementations/rasgaard_models.py ADDED Viewed

@@ -0,0 +1,34 @@
+import numpy as np
+from mteb.models.model_implementations.model2vec_models import Model2VecModel
+from mteb.models.model_meta import ModelMeta, ScoringFunction
+potion_base_8m = ModelMeta(
+    loader=Model2VecModel,  # type: ignore
+    name="rasgaard/m2v-dfm-large",
+    model_type=["dense"],
+    languages=["dan-Latn"],
+    open_weights=True,
+    revision="387897cfb09992e6d45ea9cd7b28b9fcf119e23a",
+    release_date="2025-10-08",
+    n_parameters=22893312,
+    memory_usage_mb=87,
+    max_tokens=np.inf,
+    embed_dim=256,
+    license="mit",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["NumPy", "Sentence Transformers"],
+    reference="https://huggingface.co/rasgaard/m2v-dfm-large",
+    use_instructions=False,
+    adapted_from="KennethEnevoldsen/dfm-sentence-encoder-large",
+    superseded_by=None,
+    training_datasets=set(),  # distilled
+    public_training_code="https://github.com/MinishLab/model2vec",
+    public_training_data="https://huggingface.co/datasets/HuggingFaceFW/fineweb-2",  # distilled on this
+    citation="""@article{minishlab2024model2vec,
+    author = {Tulkens, Stephan and {van Dongen}, Thomas},
+    title = {Model2Vec: Fast State-of-the-Art Static Embeddings},
+    year = {2024},
+    url = {https://github.com/MinishLab/model2vec}
+}""",
+)

mteb/models/model_implementations/reasonir_model.py CHANGED Viewed

@@ -44,6 +44,7 @@ ReasonIR_8B = ModelMeta(
         trust_remote_code=True,
     ),
     name="ReasonIR/ReasonIR-8B",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="c3d0690370ff4a8c3d3882d8dfa85c43650034fa",

mteb/models/model_implementations/repllama_models.py CHANGED Viewed

@@ -162,6 +162,7 @@ repllama_llama2_original = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="castorini/repllama-v1-7b-lora-passage",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-6097554dfe6e7d93e92f55010b678bcca1e233a8",  # base-peft revision
@@ -194,6 +195,7 @@ repllama_llama2_reproduced = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/RepLLaMA-reproduced",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-ad5c1d0938a1e02954bcafb4d811ba2f34052e71",  # base-peft revision

mteb 2.1.4__py3-none-any.whl → 2.5.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.5.2py3-none-any.whl