PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (527) hide show

mteb/models/model_implementations/fa_models.py CHANGED Viewed

@@ -6,6 +6,7 @@ from mteb.models.sentence_transformer_wrapper import sentence_transformers_loade
 parsbert = ModelMeta(
     loader=sentence_transformers_loader,
     name="HooshvareLab/bert-base-parsbert-uncased",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="d73a0e2c7492c33bd5819bcdb23eba207404dd19",
@@ -17,7 +18,7 @@ parsbert = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/HooshvareLab/bert-base-parsbert-uncased",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -41,6 +42,7 @@ parsbert = ModelMeta(
 bert_zwnj = ModelMeta(
     loader=sentence_transformers_loader,
     name="m3hrdadfi/bert-zwnj-wnli-mean-tokens",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="b9506ddc579ac8c398ae6dae680401ae0a1a5b23",
@@ -52,7 +54,7 @@ bert_zwnj = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/m3hrdadfi/bert-zwnj-wnli-mean-tokens",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -66,6 +68,7 @@ bert_zwnj = ModelMeta(
 roberta_zwnj = ModelMeta(
     loader=sentence_transformers_loader,
     name="m3hrdadfi/roberta-zwnj-wnli-mean-tokens",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="36f912ac44e22250aee16ea533a4ff8cd848c1a1",
@@ -77,7 +80,7 @@ roberta_zwnj = ModelMeta(
     max_tokens=514,
     reference="https://huggingface.co/m3hrdadfi/roberta-zwnj-wnli-mean-tokens",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -90,6 +93,7 @@ roberta_zwnj = ModelMeta(
 sentence_transformer_parsbert = ModelMeta(
     loader=sentence_transformers_loader,
     name="myrkur/sentence-transformer-parsbert-fa",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="72bd0a3557622f0ae08a092f4643609e0b950cdd",
@@ -101,7 +105,7 @@ sentence_transformer_parsbert = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/myrkur/sentence-transformer-parsbert-fa",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -125,7 +129,7 @@ tooka_bert_base = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/PartAI/TookaBERT-Base",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -140,6 +144,7 @@ tooka_bert_base = ModelMeta(
 tooka_sbert = ModelMeta(
     loader=sentence_transformers_loader,
     name="PartAI/Tooka-SBERT",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="5d07f0c543aca654373b931ae07cd197769110fd",
@@ -151,16 +156,26 @@ tooka_sbert = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/PartAI/Tooka-SBERT",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
     training_datasets=None,
+    citation="""@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}""",
 )
 fa_bert = ModelMeta(
     loader=sentence_transformers_loader,
     name="sbunlp/fabert",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="a0e3973064c97768e121b9b95f21adc94e0ca3fb",
@@ -172,7 +187,7 @@ fa_bert = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/sbunlp/fabert",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
@@ -180,11 +195,35 @@ fa_bert = ModelMeta(
         # It's just a base model
         # https://huggingface.co/datasets/sbunlp/hmblogs-v3
     ),
+    citation="""@inproceedings{masumi-etal-2025-fabert,
+    title = "{F}a{BERT}: Pre-training {BERT} on {P}ersian Blogs",
+    author = "Masumi, Mostafa  and
+      Majd, Seyed Soroush  and
+      Shamsfard, Mehrnoush  and
+      Beigy, Hamid",
+    editor = "Bak, JinYeong  and
+      Goot, Rob van der  and
+      Jang, Hyeju  and
+      Buaphet, Weerayut  and
+      Ramponi, Alan  and
+      Xu, Wei  and
+      Ritter, Alan",
+    booktitle = "Proceedings of the Tenth Workshop on Noisy and User-generated Text",
+    month = may,
+    year = "2025",
+    address = "Albuquerque, New Mexico, USA",
+    publisher = "Association for Computational Linguistics",
+    url = "https://aclanthology.org/2025.wnut-1.10/",
+    doi = "10.18653/v1/2025.wnut-1.10",
+    pages = "85--96",
+    ISBN = "979-8-89176-232-9",
+}""",
 )
 tooka_sbert_v2_small = ModelMeta(
     loader=sentence_transformers_loader,
     name="PartAI/Tooka-SBERT-V2-Small",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="8bbed87e36669387f71437c061430ba56d1b496f",
@@ -196,16 +235,26 @@ tooka_sbert_v2_small = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/PartAI/Tooka-SBERT-V2-Small",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
     training_datasets=None,
+    citation="""@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}""",
 )
 tooka_sbert_v2_large = ModelMeta(
     loader=sentence_transformers_loader,
     name="PartAI/Tooka-SBERT-V2-Large",
+    model_type=["dense"],
     languages=["fas-Arab"],
     open_weights=True,
     revision="b59682efa961122cc0e4408296d5852870c82eae",
@@ -217,9 +266,18 @@ tooka_sbert_v2_large = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/PartAI/Tooka-SBERT-V2-Large",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_code=None,
     public_training_data=None,
     training_datasets=None,
+    citation="""@inproceedings{reimers-2019-sentence-bert,
+    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
+    author = "Reimers, Nils and Gurevych, Iryna",
+    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
+    month = "11",
+    year = "2019",
+    publisher = "Association for Computational Linguistics",
+    url = "https://arxiv.org/abs/1908.10084",
+}""",
 )

mteb/models/model_implementations/facebookai.py ADDED Viewed

@@ -0,0 +1,205 @@
+from mteb.models import sentence_transformers_loader
+from mteb.models.model_meta import ModelMeta, ScoringFunction
+XLMR_LANGUAGES = [
+    "afr-Latn",
+    "amh-Latn",
+    "ara-Latn",
+    "asm-Latn",
+    "aze-Latn",
+    "bel-Latn",
+    "bul-Latn",
+    "ben-Latn",
+    "ben-Beng",
+    "bre-Latn",
+    "bos-Latn",
+    "cat-Latn",
+    "ces-Latn",
+    "cym-Latn",
+    "dan-Latn",
+    "deu-Latn",
+    "ell-Latn",
+    "eng-Latn",
+    "epo-Latn",
+    "spa-Latn",
+    "est-Latn",
+    "eus-Latn",
+    "fas-Latn",
+    "fin-Latn",
+    "fra-Latn",
+    "fry-Latn",
+    "gle-Latn",
+    "gla-Latn",
+    "glg-Latn",
+    "guj-Latn",
+    "hau-Latn",
+    "heb-Latn",
+    "hin-Latn",
+    "hin-Deva",
+    "hrv-Latn",
+    "hun-Latn",
+    "hye-Latn",
+    "ind-Latn",
+    "isl-Latn",
+    "ita-Latn",
+    "jpn-Latn",
+    "jav-Latn",
+    "kat-Latn",
+    "kaz-Latn",
+    "khm-Latn",
+    "kan-Latn",
+    "kor-Latn",
+    "kur-Latn",
+    "kir-Latn",
+    "lat-Latn",
+    "lao-Latn",
+    "lit-Latn",
+    "lav-Latn",
+    "mlg-Latn",
+    "mkd-Latn",
+    "mal-Latn",
+    "mon-Latn",
+    "mar-Latn",
+    "msa-Latn",
+    "mya-Latn",
+    "nep-Latn",
+    "nld-Latn",
+    "nob-Latn",
+    "orm-Latn",
+    "ori-Latn",
+    "pan-Latn",
+    "pol-Latn",
+    "pus-Latn",
+    "por-Latn",
+    "ron-Latn",
+    "rus-Latn",
+    "san-Latn",
+    "snd-Latn",
+    "sin-Latn",
+    "slk-Latn",
+    "slv-Latn",
+    "som-Latn",
+    "sqi-Latn",
+    "srp-Latn",
+    "sun-Latn",
+    "swe-Latn",
+    "swa-Latn",
+    "tam-Latn",
+    "tam-Taml",
+    "tel-Latn",
+    "tel-Telu",
+    "tha-Latn",
+    "tgl-Latn",
+    "tur-Latn",
+    "uig-Latn",
+    "ukr-Latn",
+    "urd-Latn",
+    "urd-Arab",
+    "uzb-Latn",
+    "vie-Latn",
+    "xho-Latn",
+    "yid-Latn",
+    "zho-Hant",
+    "zho-Hans",
+]
+xlmr_base = ModelMeta(
+    loader=sentence_transformers_loader,  # type: ignore[arg-type]
+    name="FacebookAI/xlm-roberta-base",
+    model_type=["dense"],
+    languages=XLMR_LANGUAGES,
+    open_weights=True,
+    revision="e73636d4f797dec63c3081bb6ed5c7b0bb3f2089",
+    release_date="2019-11-05",  # arxiv paper release
+    n_parameters=278043648,
+    memory_usage_mb=1064,
+    embed_dim=768,
+    license="mit",
+    max_tokens=512,
+    reference="https://huggingface.co/FacebookAI/xlm-roberta-base",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=[
+        "Sentence Transformers",
+        "PyTorch",
+        "Transformers",
+        "ONNX",
+        "safetensors",
+    ],
+    use_instructions=False,
+    public_training_code=None,
+    public_training_data=None,
+    training_datasets=set(),
+    citation="""@article{DBLP:journals/corr/abs-1911-02116,
+  author    = {Alexis Conneau and
+               Kartikay Khandelwal and
+               Naman Goyal and
+               Vishrav Chaudhary and
+               Guillaume Wenzek and
+               Francisco Guzm{\'{a}}n and
+               Edouard Grave and
+               Myle Ott and
+               Luke Zettlemoyer and
+               Veselin Stoyanov},
+  title     = {Unsupervised Cross-lingual Representation Learning at Scale},
+  journal   = {CoRR},
+  volume    = {abs/1911.02116},
+  year      = {2019},
+  url       = {http://arxiv.org/abs/1911.02116},
+  eprinttype = {arXiv},
+  eprint    = {1911.02116},
+  timestamp = {Mon, 11 Nov 2019 18:38:09 +0100},
+  biburl    = {https://dblp.org/rec/journals/corr/abs-1911-02116.bib},
+  bibsource = {dblp computer science bibliography, https://dblp.org}
+}""",
+)
+xlmr_large = ModelMeta(
+    loader=sentence_transformers_loader,  # type: ignore[arg-type]
+    name="FacebookAI/xlm-roberta-large",
+    model_type=["dense"],
+    languages=XLMR_LANGUAGES,
+    open_weights=True,
+    revision="c23d21b0620b635a76227c604d44e43a9f0ee389",
+    release_date="2019-11-05",  # arxiv paper release
+    n_parameters=559890432,
+    memory_usage_mb=2141,
+    embed_dim=1024,
+    license="mit",
+    max_tokens=512,
+    reference="https://huggingface.co/FacebookAI/xlm-roberta-large",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=[
+        "Sentence Transformers",
+        "PyTorch",
+        "Transformers",
+        "ONNX",
+        "safetensors",
+    ],
+    use_instructions=False,
+    public_training_code=None,
+    public_training_data=None,
+    training_datasets=set(),
+    citation="""@article{DBLP:journals/corr/abs-1911-02116,
+  author    = {Alexis Conneau and
+               Kartikay Khandelwal and
+               Naman Goyal and
+               Vishrav Chaudhary and
+               Guillaume Wenzek and
+               Francisco Guzm{\'{a}}n and
+               Edouard Grave and
+               Myle Ott and
+               Luke Zettlemoyer and
+               Veselin Stoyanov},
+  title     = {Unsupervised Cross-lingual Representation Learning at Scale},
+  journal   = {CoRR},
+  volume    = {abs/1911.02116},
+  year      = {2019},
+  url       = {http://arxiv.org/abs/1911.02116},
+  eprinttype = {arXiv},
+  eprint    = {1911.02116},
+  timestamp = {Mon, 11 Nov 2019 18:38:09 +0100},
+  biburl    = {https://dblp.org/rec/journals/corr/abs-1911-02116.bib},
+  bibsource = {dblp computer science bibliography, https://dblp.org}
+}""",
+)

mteb/models/model_implementations/geogpt_models.py CHANGED Viewed

@@ -7,6 +7,7 @@ from mteb.models.model_meta import ModelMeta
 geoembedding = ModelMeta(
     name="GeoGPT-Research-Project/GeoEmbedding",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="29803c28ea7ef6871194a8ebc85ad7bfe174928e",
@@ -25,7 +26,7 @@ geoembedding = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/GeoGPT-Research-Project/GeoEmbedding",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/gme_v_models.py CHANGED Viewed

@@ -1,9 +1,11 @@
+from __future__ import annotations
 import logging
 import math
-from typing import Any
+import warnings
+from typing import TYPE_CHECKING, Any
 import torch
-from PIL import Image
 from torch.utils.data import DataLoader
 from tqdm.autonotebook import tqdm
@@ -12,6 +14,9 @@ from mteb.models.abs_encoder import AbsEncoder
 from mteb.models.model_meta import ModelMeta, ScoringFunction
 from mteb.types import Array, BatchedInput, PromptType
+if TYPE_CHECKING:
+    from PIL import Image
 logger = logging.getLogger(__name__)
 GME_CITATION = """@misc{zhang2024gme,
@@ -257,9 +262,9 @@ def smart_resize(
         w_bar = ceil_by_factor(width * beta, factor)
     if max(h_bar, w_bar) / min(h_bar, w_bar) > MAX_RATIO:
-        logger.warning(
-            f"Absolute aspect ratio must be smaller than {MAX_RATIO}, got {max(h_bar, w_bar) / min(h_bar, w_bar)}"
-        )
+        msg = f"Absolute aspect ratio must be smaller than {MAX_RATIO}, got {max(h_bar, w_bar) / min(h_bar, w_bar)}"
+        logger.warning(msg)
+        warnings.warn(msg)
         if h_bar > w_bar:
             h_bar = w_bar * MAX_RATIO
         else:
@@ -267,9 +272,9 @@ def smart_resize(
     return h_bar, w_bar
-def fetch_image(
-    image: str | Image.Image, size_factor: int = IMAGE_FACTOR
-) -> Image.Image:
+def fetch_image(image: Image.Image, size_factor: int = IMAGE_FACTOR) -> Image.Image:
+    from PIL import Image
     image_obj = None
     if isinstance(image, Image.Image):
         image_obj = image
@@ -342,6 +347,7 @@ training_data = {
 gme_qwen2vl_2b = ModelMeta(
     loader=GmeQwen2VL,
     name="Alibaba-NLP/gme-Qwen2-VL-2B-Instruct",
+    model_type=["dense"],
     languages=["eng-Latn", "cmn-Hans"],
     open_weights=True,
     revision="ce765ae71b8cdb208203cd8fb64a170b1b84293a",
@@ -354,7 +360,7 @@ gme_qwen2vl_2b = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/Alibaba-NLP/gme-Qwen2-VL-2B-Instruct",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Sentence Transformers", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
@@ -365,6 +371,7 @@ gme_qwen2vl_2b = ModelMeta(
 gme_qwen2vl_7b = ModelMeta(
     loader=GmeQwen2VL,
     name="Alibaba-NLP/gme-Qwen2-VL-7B-Instruct",
+    model_type=["dense"],
     languages=["eng-Latn", "cmn-Hans"],
     open_weights=True,
     revision="477027a6480f8630363be77751f169cc3434b673",
@@ -377,7 +384,7 @@ gme_qwen2vl_7b = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/Alibaba-NLP/gme-Qwen2-VL-7B-Instruct",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Sentence Transformers", "safetensors", "Transformers"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,

mteb/models/model_implementations/google_models.py CHANGED Viewed

@@ -147,10 +147,10 @@ class GoogleTextEmbeddingModel(AbsEncoder):
 google_text_emb_004 = ModelMeta(
     loader=GoogleTextEmbeddingModel,  # type: ignore[call-arg]
     loader_kwargs=dict(
-        model_name="text-embedding-004",
         model_prompts=MODEL_PROMPTS,
     ),
     name="google/text-embedding-004",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=False,
     revision="1",  # revision is intended for implementation
@@ -172,10 +172,10 @@ google_text_emb_004 = ModelMeta(
 google_text_emb_005 = ModelMeta(
     loader=GoogleTextEmbeddingModel,  # type: ignore[call-arg]
     loader_kwargs=dict(
-        model_name="text-embedding-005",
         model_prompts=MODEL_PROMPTS,
     ),
     name="google/text-embedding-005",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=False,
     revision="1",  # revision is intended for implementation
@@ -197,10 +197,10 @@ google_text_emb_005 = ModelMeta(
 google_text_multilingual_emb_002 = ModelMeta(
     loader=GoogleTextEmbeddingModel,  # type: ignore[call-arg]
     loader_kwargs=dict(
-        model_name="text-embedding-002",
         model_prompts=MODEL_PROMPTS,
     ),
     name="google/text-multilingual-embedding-002",
+    model_type=["dense"],
     languages=MULTILINGUAL_EVALUATED_LANGUAGES,  # From the list of evaluated languages in https://cloud.google.com/vertex-ai/generative-ai/docs/model-reference/text-embeddings-api#supported_text_languages
     open_weights=False,
     revision="1",
@@ -222,10 +222,10 @@ google_text_multilingual_emb_002 = ModelMeta(
 google_gemini_embedding_001 = ModelMeta(
     loader=GoogleTextEmbeddingModel,  # type: ignore[call-arg]
     loader_kwargs=dict(
-        model_name="gemini-embedding-001",
         model_prompts=MODEL_PROMPTS,
     ),
     name="google/gemini-embedding-001",
+    model_type=["dense"],
     languages=MULTILINGUAL_EVALUATED_LANGUAGES,
     open_weights=False,
     revision="1",
@@ -260,6 +260,7 @@ def gemma_embedding_loader(model_name: str, revision: str, **kwargs):
 embedding_gemma_300m = ModelMeta(
     loader=gemma_embedding_loader,
     name="google/embeddinggemma-300m",
+    model_type=["dense"],
     languages=MULTILINGUAL_EVALUATED_LANGUAGES,
     open_weights=True,
     revision="64614b0b8b64f0c6c1e52b07e4e9a4e8fe4d2da2",
@@ -269,11 +270,21 @@ embedding_gemma_300m = ModelMeta(
     max_tokens=2048,
     license="gemma",
     reference="https://ai.google.dev/gemma/docs/embeddinggemma/model_card",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=True,
     public_training_code=None,
     public_training_data=None,
     training_datasets=GECKO_TRAINING_DATA,
     similarity_fn_name="cosine",
-    memory_usage_mb=578,
+    memory_usage_mb=1155,
+    citation="""
+@misc{vera2025embeddinggemmapowerfullightweighttext,
+      title={EmbeddingGemma: Powerful and Lightweight Text Representations},
+      author={Henrique Schechter Vera and Sahil Dua and Biao Zhang and Daniel Salz and Ryan Mullins and Sindhu Raghuram Panyam and Sara Smoot and Iftekhar Naim and Joe Zou and Feiyang Chen and Daniel Cer and Alice Lisak and Min Choi and Lucas Gonzalez and Omar Sanseviero and Glenn Cameron and Ian Ballantyne and Kat Black and Kaifeng Chen and Weiyi Wang and Zhe Li and Gus Martins and Jinhyuk Lee and Mark Sherwood and Juyeong Ji and Renjie Wu and Jingxiao Zheng and Jyotinder Singh and Abheesht Sharma and Divyashree Sreepathihalli and Aashi Jain and Adham Elarabawy and AJ Co and Andreas Doumanoglou and Babak Samari and Ben Hora and Brian Potetz and Dahun Kim and Enrique Alfonseca and Fedor Moiseev and Feng Han and Frank Palma Gomez and Gustavo Hernández Ábrego and Hesen Zhang and Hui Hui and Jay Han and Karan Gill and Ke Chen and Koert Chen and Madhuri Shanbhogue and Michael Boratko and Paul Suganthan and Sai Meher Karthik Duddu and Sandeep Mariserla and Setareh Ariafar and Shanfeng Zhang and Shijie Zhang and Simon Baumgartner and Sonam Goenka and Steve Qiu and Tanmaya Dabral and Trevor Walker and Vikram Rao and Waleed Khawaja and Wenlei Zhou and Xiaoqi Ren and Ye Xia and Yichang Chen and Yi-Ting Chen and Zhe Dong and Zhongli Ding and Francesco Visin and Gaël Liu and Jiageng Zhang and Kathleen Kenealy and Michelle Casbon and Ravin Kumar and Thomas Mesnard and Zach Gleicher and Cormac Brick and Olivier Lacombe and Adam Roberts and Qin Yin and Yunhsuan Sung and Raphael Hoffmann and Tris Warkentin and Armand Joulin and Tom Duerig and Mojtaba Seyedhosseini},
+      year={2025},
+      eprint={2509.20354},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL},
+      url={https://arxiv.org/abs/2509.20354},
+}""",
 )

mteb/models/model_implementations/granite_vision_embedding_models.py CHANGED Viewed

@@ -1,8 +1,9 @@
+from __future__ import annotations
 import logging
-from typing import Any
+from typing import TYPE_CHECKING, Any
 import torch
-from PIL import Image
 from torch.utils.data import DataLoader
 from tqdm.auto import tqdm
@@ -15,6 +16,9 @@ from mteb.types import Array, BatchedInput, PromptType
 logger = logging.getLogger(__name__)
+if TYPE_CHECKING:
+    from PIL import Image
 class GraniteVisionEmbeddingWrapper:
     def __init__(
@@ -162,6 +166,7 @@ granite_vision_embedding = ModelMeta(
         torch_dtype=torch.float16,
     ),
     name="ibm-granite/granite-vision-3.3-2b-embedding",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="cee615db64d89d1552a4ee39c50f25c0fc5c66ca",
     release_date="2025-06-11",
@@ -174,7 +179,7 @@ granite_vision_embedding = ModelMeta(
     open_weights=True,
     public_training_code=None,
     public_training_data=None,
-    framework=["PyTorch"],
+    framework=["PyTorch", "Transformers", "safetensors"],
     reference="https://huggingface.co/ibm-granite/granite-vision-3.3-2b-embedding",
     similarity_fn_name="MaxSim",
     use_instructions=True,

mteb/models/model_implementations/gritlm_models.py CHANGED Viewed

@@ -38,6 +38,7 @@ gritlm7b = ModelMeta(
         torch_dtype="auto",
     ),
     name="GritLM/GritLM-7B",
+    model_type=["dense"],
     languages=["eng-Latn", "fra-Latn", "deu-Latn", "ita-Latn", "spa-Latn"],
     open_weights=True,
     revision="13f00a0e36500c80ce12870ea513846a066004af",
@@ -49,7 +50,7 @@ gritlm7b = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/GritLM/GritLM-7B",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["GritLM", "PyTorch"],
+    framework=["GritLM", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     training_datasets=GRIT_LM_TRAINING_DATA,
     # section 3.1 "We finetune our final models from Mistral 7B [68] and Mixtral 8x7B [69] using adaptations of E5 [160] and the Tülu 2 data
@@ -66,6 +67,7 @@ gritlm8x7b = ModelMeta(
         torch_dtype="auto",
     ),
     name="GritLM/GritLM-8x7B",
+    model_type=["dense"],
     languages=["eng-Latn", "fra-Latn", "deu-Latn", "ita-Latn", "spa-Latn"],
     open_weights=True,
     revision="7f089b13e3345510281733ca1e6ff871b5b4bc76",
@@ -77,7 +79,7 @@ gritlm8x7b = ModelMeta(
     max_tokens=32768,
     reference="https://huggingface.co/GritLM/GritLM-8x7B",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["GritLM", "PyTorch"],
+    framework=["GritLM", "PyTorch", "Transformers", "safetensors"],
     use_instructions=True,
     training_datasets=GRIT_LM_TRAINING_DATA,
     citation=GRITLM_CITATION,

mteb 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl