PyPI - mteb - Versions diffs - 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl - Mend

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (527) hide show

mteb/models/model_implementations/openai_models.py CHANGED Viewed

@@ -91,10 +91,6 @@ class OpenAIModel(AbsEncoder):
         from openai import NotGiven
-        if self.model_name == "text-embedding-ada-002" and self._embed_dim is not None:
-            logger.warning(
-                "Reducing embedding size available only for text-embedding-3-* models"
-            )
         sentences = [text for batch in inputs for text in batch["text"]]
         mask_sents = [(i, t) for i, t in enumerate(sentences) if t.strip()]
@@ -122,13 +118,22 @@ class OpenAIModel(AbsEncoder):
         no_empty_embeddings = []
+        # Set dimensions only for models that support it
+        dimensions = (
+            self._embed_dim or NotGiven()
+            if not self.model_name == "text-embedding-ada-002"
+            else NotGiven()
+        )
+        default_kwargs = dict(
+            model=self.model_name,
+            encoding_format="float",
+            dimensions=dimensions,
+        )
         for sublist in tqdm(sublists, leave=False, disable=not show_progress_bar):
             try:
                 response = self._client.embeddings.create(
-                    input=sublist,
-                    model=self.model_name,
-                    encoding_format="float",
-                    dimensions=self._embed_dim or NotGiven(),
+                    input=sublist, **default_kwargs
                 )
             except Exception as e:
                 # Sleep due to too many requests
@@ -138,19 +143,13 @@ class OpenAIModel(AbsEncoder):
                 time.sleep(10)
                 try:
                     response = self._client.embeddings.create(
-                        input=sublist,
-                        model=self.model_name,
-                        encoding_format="float",
-                        dimensions=self._embed_dim or NotGiven(),
+                        input=sublist, **default_kwargs
                     )
                 except Exception as e:
                     logger.info("Sleeping for 60 seconds due to error", e)
                     time.sleep(60)
                     response = self._client.embeddings.create(
-                        input=sublist,
-                        model=self.model_name,
-                        encoding_format="float",
-                        dimensions=self._embed_dim or NotGiven(),
+                        input=sublist, **default_kwargs
                     )
             no_empty_embeddings.extend(self._to_numpy(response))
@@ -168,6 +167,7 @@ class OpenAIModel(AbsEncoder):
 text_embedding_3_small = ModelMeta(
     name="openai/text-embedding-3-small",
+    model_type=["dense"],
     revision="3",
     release_date="2024-01-25",
     languages=None,  # supported languages not specified
@@ -192,6 +192,7 @@ text_embedding_3_small = ModelMeta(
 )
 text_embedding_3_large = ModelMeta(
     name="openai/text-embedding-3-large",
+    model_type=["dense"],
     revision="3",
     release_date="2024-01-25",
     languages=None,  # supported languages not specified
@@ -216,6 +217,7 @@ text_embedding_3_large = ModelMeta(
 )
 text_embedding_ada_002 = ModelMeta(
     name="openai/text-embedding-ada-002",
+    model_type=["dense"],
     revision="3",
     release_date="2022-12-15",
     languages=None,  # supported languages not specified
@@ -241,6 +243,7 @@ text_embedding_ada_002 = ModelMeta(
 text_embedding_3_small_512 = ModelMeta(
     name="openai/text-embedding-3-small (embed_dim=512)",
+    model_type=["dense"],
     revision="3",
     release_date="2024-01-25",
     languages=None,  # supported languages not specified
@@ -267,6 +270,7 @@ text_embedding_3_small_512 = ModelMeta(
 text_embedding_3_large_512 = ModelMeta(
     name="openai/text-embedding-3-large (embed_dim=512)",
+    model_type=["dense"],
     revision="3",
     release_date="2024-01-25",
     languages=None,  # supported languages not specified

mteb/models/model_implementations/openclip_models.py CHANGED Viewed

@@ -10,6 +10,14 @@ from mteb.models.abs_encoder import AbsEncoder
 from mteb.models.model_meta import ModelMeta, ScoringFunction
 from mteb.types import Array, BatchedInput, PromptType
+OPENCLIP_CITATION = """@inproceedings{cherti2023reproducible,
+    title={Reproducible scaling laws for contrastive language-image learning},
+    author={Cherti, Mehdi and Beaumont, Romain and Wightman, Ross and Wortsman, Mitchell and Ilharco, Gabriel and Gordon, Cade and Schuhmann, Christoph and Schmidt, Ludwig and Jitsev, Jenia},
+    booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
+    pages={2818--2829},
+    year={2023}
+}"""
 def openclip_loader(model_name, **kwargs):
     requires_package(
@@ -112,8 +120,9 @@ def openclip_loader(model_name, **kwargs):
 CLIP_ViT_L_14_DataComp_XL_s13B_b90K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-L-14-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="84c9828e63dc9a9351d1fe637c346d4c1c4db341",
     release_date="2023-04-26",
@@ -133,11 +142,13 @@ CLIP_ViT_L_14_DataComp_XL_s13B_b90K = ModelMeta(
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_32_DataComp_XL_s13B_b90K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-B-32-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="f0e2ffa09cbadab3db6a261ec1ec56407ce42912",
     release_date="2023-04-26",
@@ -150,18 +161,20 @@ CLIP_ViT_B_32_DataComp_XL_s13B_b90K = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://huggingface.co/datasets/mlfoundations/datacomp_1b",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-B-32-DataComp.XL-s13B-b90K",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_16_DataComp_XL_s13B_b90K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-B-16-DataComp.XL-s13B-b90K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="d110532e8d4ff91c574ee60a342323f28468b287",
     release_date="2023-04-26",
@@ -181,11 +194,13 @@ CLIP_ViT_B_16_DataComp_XL_s13B_b90K = ModelMeta(
     training_datasets=set(
         # DataComp-1B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_bigG_14_laion2B_39B_b160k = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-bigG-14-laion2B-39B-b160k",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="bc7788f151930d91b58474715fdce5524ad9a189",
     release_date="2023-01-23",
@@ -198,18 +213,20 @@ CLIP_ViT_bigG_14_laion2B_39B_b160k = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://laion.ai/blog/laion-5b/",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-bigG-14-laion2B-39B-b160k",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_g_14_laion2B_s34B_b88K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-g-14-laion2B-s34B-b88K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="15efd0f6ac0c40c0f9da7becca03c974d7012604",
     release_date="2023-03-06",
@@ -222,18 +239,20 @@ CLIP_ViT_g_14_laion2B_s34B_b88K = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://laion.ai/blog/laion-5b/",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-g-14-laion2B-s34B-b88K",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_H_14_laion2B_s32B_b79K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-H-14-laion2B-s32B-b79K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="de081ac0a0ca8dc9d1533eed1ae884bb8ae1404b",
     release_date="2022-09-15",
@@ -246,18 +265,20 @@ CLIP_ViT_H_14_laion2B_s32B_b79K = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://laion.ai/blog/laion-5b/",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-H-14-laion2B-s32B-b79K",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_L_14_laion2B_s32B_b82K = ModelMeta(
-    loader=openclip_loader,  # type: ignore
+    loader=openclip_loader,
     name="laion/CLIP-ViT-L-14-laion2B-s32B-b82K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="1627032197142fbe2a7cfec626f4ced3ae60d07a",
     release_date="2022-09-15",
@@ -270,18 +291,20 @@ CLIP_ViT_L_14_laion2B_s32B_b82K = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://laion.ai/blog/laion-5b/",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-L-14-laion2B-s32B-b82K",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )
 CLIP_ViT_B_32_laion2B_s34B_b79K = ModelMeta(
     loader=openclip_loader,
     name="laion/CLIP-ViT-B-32-laion2B-s34B-b79K",
+    model_type=["dense"],
     languages=["eng-Latn"],
     revision="08f73555f1b2fb7c82058aebbd492887a94968ef",
     release_date="2022-09-15",
@@ -294,11 +317,12 @@ CLIP_ViT_B_32_laion2B_s34B_b79K = ModelMeta(
     open_weights=True,
     public_training_code="https://github.com/mlfoundations/open_clip",
     public_training_data="https://laion.ai/blog/laion-5b/",
-    framework=["PyTorch"],
+    framework=["PyTorch", "safetensors"],
     reference="https://huggingface.co/laion/CLIP-ViT-B-32-laion2B-s34B-b79K",
     similarity_fn_name=ScoringFunction.COSINE,
     use_instructions=False,
     training_datasets=set(
         # 2 Billion sample English subset of LAION-5B
     ),
+    citation=OPENCLIP_CITATION,
 )

mteb/models/model_implementations/opensearch_neural_sparse_models.py CHANGED Viewed

@@ -128,6 +128,7 @@ class SparseEncoderWrapper(AbsEncoder):
 opensearch_neural_sparse_encoding_doc_v3_gte = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v3-gte",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="a8abaa916125ee512a7a8f4d706d07eb0128a8e6",
@@ -139,7 +140,7 @@ opensearch_neural_sparse_encoding_doc_v3_gte = ModelMeta(
     max_tokens=8192,
     reference="https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-doc-v3-gte",
     similarity_fn_name="dot",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     public_training_code="https://github.com/zhichao-aws/opensearch-sparse-model-tuning-sample",
     public_training_data=True,
     use_instructions=True,
@@ -153,6 +154,7 @@ opensearch_neural_sparse_encoding_doc_v3_gte = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v3_distill = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v3-distill",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="babf71f3c48695e2e53a978208e8aba48335e3c0",
@@ -164,7 +166,7 @@ opensearch_neural_sparse_encoding_doc_v3_distill = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-doc-v3-distill",
     similarity_fn_name="dot",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     public_training_code="https://github.com/zhichao-aws/opensearch-sparse-model-tuning-sample",
     public_training_data=True,
     use_instructions=True,
@@ -174,6 +176,7 @@ opensearch_neural_sparse_encoding_doc_v3_distill = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v2_distill = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v2-distill",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="8921a26c78b8559d6604eb1f5c0b74c079bee38f",
@@ -185,7 +188,7 @@ opensearch_neural_sparse_encoding_doc_v2_distill = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-doc-v2-distill",
     similarity_fn_name="dot",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     public_training_code="https://github.com/zhichao-aws/opensearch-sparse-model-tuning-sample",
     public_training_data=True,
     use_instructions=True,
@@ -196,6 +199,7 @@ opensearch_neural_sparse_encoding_doc_v2_distill = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v2_mini = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v2-mini",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="4af867a426867dfdd744097531046f4289a32fdd",
@@ -207,7 +211,7 @@ opensearch_neural_sparse_encoding_doc_v2_mini = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-doc-v2-mini",
     similarity_fn_name="dot",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     public_training_code="https://github.com/zhichao-aws/opensearch-sparse-model-tuning-sample",
     public_training_data=True,
     use_instructions=True,
@@ -217,6 +221,7 @@ opensearch_neural_sparse_encoding_doc_v2_mini = ModelMeta(
 opensearch_neural_sparse_encoding_doc_v1 = ModelMeta(
     name="opensearch-project/opensearch-neural-sparse-encoding-doc-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="98cdcbd72867c547f72f2b7b7bed9cdf9f09922d",
@@ -228,7 +233,7 @@ opensearch_neural_sparse_encoding_doc_v1 = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-doc-v1",
     similarity_fn_name="dot",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors", "Transformers"],
     public_training_code="https://github.com/zhichao-aws/opensearch-sparse-model-tuning-sample",
     public_training_data=True,
     use_instructions=True,

mteb/models/model_implementations/ops_moa_models.py CHANGED Viewed

@@ -22,12 +22,13 @@ class OPSWrapper(AbsEncoder):
 ops_moa_conan_embedding = ModelMeta(
     name="OpenSearch-AI/Ops-MoA-Conan-embedding-v1",
+    model_type=["dense"],
     revision="46dcd58753f3daa920c66f89e47086a534089350",
     release_date="2025-03-26",
     languages=["zho-Hans"],
     loader=OPSWrapper,
     n_parameters=int(343 * 1e6),
-    memory_usage_mb=2e3,
+    memory_usage_mb=1308,
     max_tokens=512,
     embed_dim=1536,
     license="cc-by-nc-4.0",
@@ -53,19 +54,20 @@ ops_moa_conan_embedding = ModelMeta(
 ops_moa_yuan_embedding = ModelMeta(
     name="OpenSearch-AI/Ops-MoA-Yuan-embedding-1.0",
+    model_type=["dense"],
     revision="23712d0766417b0eb88a2513c6e212a58b543268",
     release_date="2025-03-26",
     languages=["zho-Hans"],
     loader=OPSWrapper,
     n_parameters=int(343 * 1e6),
-    memory_usage_mb=2e3,
+    memory_usage_mb=1242,
     max_tokens=512,
     embed_dim=1536,
     license="cc-by-nc-4.0",
     open_weights=True,
     public_training_code=None,
     public_training_data=None,
-    framework=["PyTorch", "Sentence Transformers"],
+    framework=["PyTorch", "Sentence Transformers", "safetensors"],
     reference="https://huggingface.co/OpenSearch-AI/Ops-MoA-Yuan-embedding-1.0",
     similarity_fn_name="cosine",
     use_instructions=False,

mteb/models/model_implementations/ordalietech_solon_embeddings_mini_beta_1_1.py CHANGED Viewed

@@ -14,7 +14,7 @@ solon_embeddings_1_1 = ModelMeta(
     max_tokens=8192,
     reference="https://huggingface.co/OrdalieTech/Solon-embeddings-mini-beta-1.1",
     similarity_fn_name="cosine",
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
     use_instructions=False,
     public_training_data=(
         "https://huggingface.co/datasets/PleIAs/common_corpus; "

mteb/models/model_implementations/pawan_models.py ADDED Viewed

@@ -0,0 +1,39 @@
+from mteb.models.model_meta import (
+    ModelMeta,
+    ScoringFunction,
+)
+from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
+PAWAN_EMBD_CITATION = """@misc{medhi2025pawanembd,
+    title={PawanEmbd-68M: Distilled Embedding Model},
+    author={Medhi, D.},
+    year={2025},
+    url={https://huggingface.co/dmedhi/PawanEmbd-68M}
+}"""
+pawan_embd_68m = ModelMeta(
+    loader=sentence_transformers_loader,
+    name="dmedhi/PawanEmbd-68M",
+    model_type=["dense"],
+    languages=["eng-Latn"],
+    open_weights=True,
+    revision="32f295145802bdbd65699ad65fd27d2a5b69a909",
+    release_date="2025-12-08",
+    n_parameters=68_000_000,
+    memory_usage_mb=260,
+    embed_dim=768,
+    license="apache-2.0",
+    max_tokens=512,
+    reference="https://huggingface.co/dmedhi/PawanEmbd-68M",
+    similarity_fn_name=ScoringFunction.COSINE,
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
+    adapted_from="ibm-granite/granite-embedding-278m-multilingual",
+    superseded_by=None,
+    public_training_code=None,
+    public_training_data=None,
+    use_instructions=False,
+    training_datasets={
+        "AllNLI",
+    },
+    citation=PAWAN_EMBD_CITATION,
+)

mteb/models/model_implementations/piccolo_models.py CHANGED Viewed

@@ -6,6 +6,7 @@ from mteb.models.sentence_transformer_wrapper import sentence_transformers_loade
 piccolo_base_zh = ModelMeta(
     loader=sentence_transformers_loader,
     name="sensenova/piccolo-base-zh",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=True,
     revision="47c0a63b8f667c3482e05b2fd45577bb19252196",
@@ -17,7 +18,7 @@ piccolo_base_zh = ModelMeta(
     max_tokens=512,
     reference="https://huggingface.co/sensenova/piccolo-base-zh",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["Sentence Transformers", "PyTorch"],
+    framework=["Sentence Transformers", "PyTorch", "Transformers"],
     use_instructions=False,
     superseded_by=None,
     adapted_from=None,
@@ -29,6 +30,7 @@ piccolo_base_zh = ModelMeta(
 piccolo_large_zh_v2 = ModelMeta(
     loader=sentence_transformers_loader,
     name="sensenova/piccolo-large-zh-v2",
+    model_type=["dense"],
     languages=["zho-Hans"],
     open_weights=False,  # They "temporarily" removed it in may last year
     # "Due to certain internal company considerations"
@@ -48,4 +50,10 @@ piccolo_large_zh_v2 = ModelMeta(
     public_training_code=None,
     public_training_data=None,
     training_datasets=None,  # They don't say
+    citation="""@misc{2405.06932,
+    Author = {Junqin Huang and Zhongjie Hu and Zihao Jing and Mengya Gao and Yichao Wu},
+    Title = {Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training},
+    Year = {2024},
+    Eprint = {arXiv:2405.06932},
+}""",
 )

mteb/models/model_implementations/pixie_models.py ADDED Viewed

@@ -0,0 +1,56 @@
+from mteb.models.model_implementations.arctic_models import (
+    ARCTIC_V2_CITATION,
+    LANGUAGES_V2_0,
+    arctic_v2_training_datasets,
+)
+from mteb.models.model_meta import (
+    ModelMeta,
+    ScoringFunction,
+)
+from mteb.models.sentence_transformer_wrapper import sentence_transformers_loader
+PIXIE_RUNE_V1_CITATION = """@misc{TelePIX-PIXIE-Rune-v1.0,
+  title        = {PIXIE-Rune-v1.0},
+  author       = {TelePIX AI Research Team and Bongmin Kim},
+  year         = {2026},
+  howpublished = {Hugging Face model card},
+  url          = {https://huggingface.co/telepix/PIXIE-Rune-v1.0}
+}"""
+PIXIE_RUNE_V1_PROMPTS = {
+    "query": "query: ",
+    "document": "",
+}
+# it is further fine-tuned on TelePIX proprietary IR data (not public).
+pixie_rune_v1_training_datasets = set(arctic_v2_training_datasets) | {
+    "TelePIX-Proprietary-IR-Triplets",
+}
+pixie_rune_v1_0 = ModelMeta(
+    loader=sentence_transformers_loader,
+    loader_kwargs={
+        "model_prompts": PIXIE_RUNE_V1_PROMPTS,
+    },
+    name="telepix/PIXIE-Rune-v1.0",
+    model_type=["dense"],
+    revision="b2486496da71191626666a88f9bfec844933a134",
+    release_date="2026-01-15",
+    languages=LANGUAGES_V2_0,
+    open_weights=True,
+    framework=["Sentence Transformers", "PyTorch", "safetensors"],
+    n_parameters=567754752,
+    memory_usage_mb=2166,
+    max_tokens=6144,
+    embed_dim=1024,
+    license="apache-2.0",
+    reference="https://huggingface.co/telepix/PIXIE-Rune-v1.0",
+    similarity_fn_name=ScoringFunction.COSINE,
+    use_instructions=True,
+    adapted_from="Snowflake/snowflake-arctic-embed-l-v2.0",
+    superseded_by=None,
+    public_training_code=None,
+    public_training_data=None,
+    training_datasets=pixie_rune_v1_training_datasets,
+    citation=PIXIE_RUNE_V1_CITATION + "\n\n" + ARCTIC_V2_CITATION,
+)

mteb/models/model_implementations/promptriever_models.py CHANGED Viewed

@@ -75,12 +75,13 @@ promptriever_llama2 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama2-7b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="01c7f73d771dfac7d292323805ebc428287df4f9-30b14e3813c0fa45facfd01a594580c3fe5ecf23",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=7_000_000_000,
-    memory_usage_mb=27,
+    memory_usage_mb=26703,
     max_tokens=4096,
     embed_dim=4096,
     license="apache-2.0",
@@ -89,7 +90,7 @@ promptriever_llama2 = ModelMeta(
     ),
     reference="https://huggingface.co/samaya-ai/promptriever-llama2-7b-v1",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch", "Tevatron"],
+    framework=["PyTorch", "Tevatron", "safetensors"],
     use_instructions=True,
     citation=PROMPTRIEVER_CITATION,
     public_training_code=None,
@@ -106,6 +107,7 @@ promptriever_llama3 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama3.1-8b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="48d6d0fc4e02fb1269b36940650a1b7233035cbb-2ead22cfb1b0e0c519c371c63c2ab90ffc511b8a",  # base-peft revision
@@ -115,13 +117,13 @@ promptriever_llama3 = ModelMeta(
     },
     release_date="2024-09-15",
     n_parameters=8_000_000_000,
-    memory_usage_mb=31,
+    memory_usage_mb=30518,
     max_tokens=8192,
     embed_dim=4096,
     license="apache-2.0",
     reference="https://huggingface.co/samaya-ai/promptriever-llama3.1-8b-v1",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch", "Tevatron"],
+    framework=["PyTorch", "Tevatron", "safetensors"],
     use_instructions=True,
     citation=PROMPTRIEVER_CITATION,
     public_training_code=None,
@@ -138,12 +140,13 @@ promptriever_llama3_instruct = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-llama3.1-8b-instruct-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="5206a32e0bd3067aef1ce90f5528ade7d866253f-8b677258615625122c2eb7329292b8c402612c21",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=8_000_000_000,
-    memory_usage_mb=31,
+    memory_usage_mb=30518,
     max_tokens=8192,
     embed_dim=4096,
     training_datasets={
@@ -153,7 +156,7 @@ promptriever_llama3_instruct = ModelMeta(
     license="apache-2.0",
     reference="https://huggingface.co/samaya-ai/promptriever-llama3.1-8b-instruct-v1",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch", "Tevatron"],
+    framework=["PyTorch", "Tevatron", "safetensors"],
     use_instructions=True,
     citation=PROMPTRIEVER_CITATION,
     public_training_code=None,
@@ -170,12 +173,13 @@ promptriever_mistral_v1 = ModelMeta(
         model_prompts=model_prompts,
     ),
     name="samaya-ai/promptriever-mistral-v0.1-7b-v1",
+    model_type=["dense"],
     languages=["eng-Latn"],
     open_weights=True,
     revision="7231864981174d9bee8c7687c24c8344414eae6b-876d63e49b6115ecb6839893a56298fadee7e8f5",  # base-peft revision
     release_date="2024-09-15",
     n_parameters=7_000_000_000,
-    memory_usage_mb=27,
+    memory_usage_mb=26703,
     training_datasets={
         # "samaya-ai/msmarco-w-instructions",
         "mMARCO-NL",  # translation not trained on
@@ -185,7 +189,7 @@ promptriever_mistral_v1 = ModelMeta(
     license="apache-2.0",
     reference="https://huggingface.co/samaya-ai/promptriever-mistral-v0.1-7b-v1",
     similarity_fn_name=ScoringFunction.COSINE,
-    framework=["PyTorch", "Tevatron"],
+    framework=["PyTorch", "Tevatron", "safetensors"],
     use_instructions=True,
     citation=PROMPTRIEVER_CITATION,
     public_training_code=None,

mteb 2.1.4__py3-none-any.whl → 2.7.2__py3-none-any.whl

mteb 2.1.4py3-none-any.whl → 2.7.2py3-none-any.whl