PyPI - mteb - Versions diffs - 2.7.1__py3-none-any.whl → 2.7.3__py3-none-any.whl - Mend

mteb 2.7.1py3-none-any.whl → 2.7.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (155) hide show

mteb/__init__.py +2 -0
mteb/_create_dataloaders.py +16 -9
mteb/_evaluators/any_sts_evaluator.py +10 -5
mteb/_evaluators/clustering_evaluator.py +10 -4
mteb/_evaluators/evaluator.py +9 -4
mteb/_evaluators/image/imagetext_pairclassification_evaluator.py +6 -4
mteb/_evaluators/pair_classification_evaluator.py +10 -5
mteb/_evaluators/retrieval_evaluator.py +19 -13
mteb/_evaluators/retrieval_metrics.py +9 -3
mteb/_evaluators/sklearn_evaluator.py +14 -10
mteb/_evaluators/text/bitext_mining_evaluator.py +8 -3
mteb/_evaluators/text/summarization_evaluator.py +8 -4
mteb/_evaluators/zeroshot_classification_evaluator.py +10 -3
mteb/_helpful_enum.py +5 -1
mteb/abstasks/_data_filter/filters.py +8 -2
mteb/abstasks/_data_filter/task_pipelines.py +7 -2
mteb/abstasks/_statistics_calculation.py +6 -4
mteb/abstasks/abstask.py +17 -9
mteb/abstasks/aggregate_task_metadata.py +20 -9
mteb/abstasks/aggregated_task.py +15 -8
mteb/abstasks/classification.py +15 -6
mteb/abstasks/clustering.py +17 -8
mteb/abstasks/clustering_legacy.py +14 -6
mteb/abstasks/image/image_text_pair_classification.py +17 -7
mteb/abstasks/multilabel_classification.py +11 -5
mteb/abstasks/pair_classification.py +19 -9
mteb/abstasks/regression.py +14 -6
mteb/abstasks/retrieval.py +27 -16
mteb/abstasks/retrieval_dataset_loaders.py +11 -8
mteb/abstasks/sts.py +19 -10
mteb/abstasks/task_metadata.py +17 -8
mteb/abstasks/text/bitext_mining.py +14 -7
mteb/abstasks/text/summarization.py +17 -7
mteb/abstasks/zeroshot_classification.py +15 -7
mteb/benchmarks/_create_table.py +13 -3
mteb/benchmarks/benchmark.py +11 -1
mteb/benchmarks/benchmarks/rteb_benchmarks.py +20 -9
mteb/cache.py +20 -14
mteb/cli/_display_tasks.py +9 -3
mteb/cli/build_cli.py +5 -2
mteb/cli/generate_model_card.py +9 -2
mteb/deprecated_evaluator.py +16 -12
mteb/evaluate.py +20 -18
mteb/filter_tasks.py +12 -7
mteb/get_tasks.py +9 -4
mteb/languages/language_scripts.py +8 -3
mteb/leaderboard/app.py +7 -3
mteb/leaderboard/table.py +7 -2
mteb/load_results.py +9 -3
mteb/models/abs_encoder.py +22 -12
mteb/models/cache_wrappers/cache_backend_protocol.py +5 -3
mteb/models/cache_wrappers/cache_backends/_hash_utils.py +8 -4
mteb/models/cache_wrappers/cache_backends/faiss_cache.py +8 -3
mteb/models/cache_wrappers/cache_wrapper.py +14 -9
mteb/models/get_model_meta.py +11 -4
mteb/models/instruct_wrapper.py +13 -5
mteb/models/model_implementations/align_models.py +9 -4
mteb/models/model_implementations/bedrock_models.py +16 -6
mteb/models/model_implementations/blip2_models.py +9 -4
mteb/models/model_implementations/blip_models.py +9 -4
mteb/models/model_implementations/bm25.py +15 -10
mteb/models/model_implementations/bmretriever_models.py +6 -2
mteb/models/model_implementations/cde_models.py +9 -5
mteb/models/model_implementations/clip_models.py +9 -4
mteb/models/model_implementations/cohere_models.py +10 -4
mteb/models/model_implementations/cohere_v.py +9 -4
mteb/models/model_implementations/colpali_models.py +4 -3
mteb/models/model_implementations/colqwen_models.py +10 -31
mteb/models/model_implementations/colsmol_models.py +1 -1
mteb/models/model_implementations/conan_models.py +10 -4
mteb/models/model_implementations/dino_models.py +9 -4
mteb/models/model_implementations/e5_v.py +9 -4
mteb/models/model_implementations/eagerworks_models.py +10 -4
mteb/models/model_implementations/evaclip_models.py +9 -4
mteb/models/model_implementations/gme_v_models.py +5 -3
mteb/models/model_implementations/google_models.py +10 -4
mteb/models/model_implementations/granite_vision_embedding_models.py +6 -5
mteb/models/model_implementations/hinvec_models.py +5 -1
mteb/models/model_implementations/jasper_models.py +12 -5
mteb/models/model_implementations/jina_clip.py +9 -4
mteb/models/model_implementations/jina_models.py +10 -5
mteb/models/model_implementations/kalm_models.py +18 -12
mteb/models/model_implementations/linq_models.py +6 -1
mteb/models/model_implementations/listconranker.py +9 -4
mteb/models/model_implementations/llm2clip_models.py +9 -4
mteb/models/model_implementations/llm2vec_models.py +12 -6
mteb/models/model_implementations/mcinext_models.py +5 -2
mteb/models/model_implementations/mdbr_models.py +3 -1
mteb/models/model_implementations/{mxbai_models.py → mixedbread_ai_models.py} +91 -0
mteb/models/model_implementations/moco_models.py +9 -4
mteb/models/model_implementations/mod_models.py +1 -1
mteb/models/model_implementations/model2vec_models.py +10 -4
mteb/models/model_implementations/no_instruct_sentence_models.py +12 -5
mteb/models/model_implementations/nomic_models.py +10 -4
mteb/models/model_implementations/nomic_models_vision.py +4 -3
mteb/models/model_implementations/nvidia_llama_nemoretriever_colemb.py +7 -3
mteb/models/model_implementations/nvidia_models.py +12 -4
mteb/models/model_implementations/octen_models.py +1 -1
mteb/models/model_implementations/openai_models.py +9 -4
mteb/models/model_implementations/openclip_models.py +9 -4
mteb/models/model_implementations/opensearch_neural_sparse_models.py +10 -4
mteb/models/model_implementations/ops_moa_models.py +7 -2
mteb/models/model_implementations/pixie_models.py +56 -0
mteb/models/model_implementations/promptriever_models.py +12 -6
mteb/models/model_implementations/pylate_models.py +19 -13
mteb/models/model_implementations/qwen3_models.py +8 -1
mteb/models/model_implementations/random_baseline.py +4 -3
mteb/models/model_implementations/repllama_models.py +13 -6
mteb/models/model_implementations/rerankers_custom.py +10 -4
mteb/models/model_implementations/rerankers_monot5_based.py +10 -4
mteb/models/model_implementations/salesforce_models.py +7 -1
mteb/models/model_implementations/seed_1_6_embedding_models.py +4 -2
mteb/models/model_implementations/seed_1_6_embedding_models_1215.py +5 -2
mteb/models/model_implementations/seed_models.py +1 -1
mteb/models/model_implementations/siglip_models.py +9 -4
mteb/models/model_implementations/slm_models.py +7 -4
mteb/models/model_implementations/uae_models.py +9 -4
mteb/models/model_implementations/vdr_models.py +7 -1
mteb/models/model_implementations/vista_models.py +9 -4
mteb/models/model_implementations/vlm2vec_models.py +9 -4
mteb/models/model_implementations/voyage_models.py +10 -4
mteb/models/model_implementations/voyage_v.py +10 -6
mteb/models/model_implementations/yuan_models_en.py +1 -1
mteb/models/model_meta.py +12 -7
mteb/models/models_protocols.py +19 -18
mteb/models/search_encoder_index/search_backend_protocol.py +7 -3
mteb/models/search_encoder_index/search_indexes/faiss_search_index.py +12 -4
mteb/models/search_wrappers.py +19 -12
mteb/models/sentence_transformer_wrapper.py +4 -3
mteb/models/vllm_wrapper.py +8 -6
mteb/results/benchmark_results.py +22 -17
mteb/results/model_result.py +21 -15
mteb/results/task_result.py +41 -10
mteb/similarity_functions.py +8 -2
mteb/tasks/aggregated_tasks/eng/cqadupstack_retrieval.py +3 -3
mteb/tasks/aggregated_tasks/eng/sts17_multilingual_visual_sts_eng.py +3 -3
mteb/tasks/aggregated_tasks/eng/sts_benchmark_multilingual_visual_sts_eng.py +3 -3
mteb/tasks/aggregated_tasks/fas/cqadupstack_retrieval_fa.py +3 -3
mteb/tasks/aggregated_tasks/fas/syn_per_chatbot_conv_sa_classification.py +3 -3
mteb/tasks/aggregated_tasks/multilingual/sts17_multilingual_vision_sts.py +3 -3
mteb/tasks/aggregated_tasks/multilingual/sts_benchmark_multilingual_visual_sts.py +3 -3
mteb/tasks/aggregated_tasks/nld/cqadupstack_nl_retrieval.py +3 -3
mteb/tasks/aggregated_tasks/pol/cqadupstack_retrieval_pl.py +3 -3
mteb/tasks/clustering/nob/snl_clustering.py +7 -2
mteb/tasks/clustering/nob/vg_clustering.py +7 -2
mteb/tasks/retrieval/eng/limit_retrieval.py +6 -1
mteb/tasks/retrieval/multilingual/ru_sci_bench_retrieval.py +3 -3
mteb/types/_encoder_io.py +1 -1
mteb/types/statistics.py +9 -2
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/METADATA +1 -1
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/RECORD +155 -154
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/WHEEL +0 -0
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/entry_points.txt +0 -0
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/licenses/LICENSE +0 -0
{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/top_level.txt +0 -0

mteb/tasks/aggregated_tasks/eng/sts17_multilingual_visual_sts_eng.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts17_multilingual_visual_sts import (
     STS17MultilingualVisualSTS,
 )
-task_list_sts17: list[AbsTask] = [
+task_list_sts17 = [
     STS17MultilingualVisualSTS().filter_languages(
         languages=["eng"], hf_subsets=["en-en"]
     )

mteb/tasks/aggregated_tasks/eng/sts_benchmark_multilingual_visual_sts_eng.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts_benchmark_multilingual_visual_sts import (
     STSBenchmarkMultilingualVisualSTS,
 )
-task_list_stsb: list[AbsTask] = [
+task_list_stsb = [
     STSBenchmarkMultilingualVisualSTS().filter_languages(
         languages=["eng"], hf_subsets=["en"]
     )

mteb/tasks/aggregated_tasks/fas/cqadupstack_retrieval_fa.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval import (
     CQADupstackAndroidRetrievalFa,
     CQADupstackEnglishRetrievalFa,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval import (
     CQADupstackWordpressRetrievalFa,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidRetrievalFa(),
     CQADupstackEnglishRetrievalFa(),
     CQADupstackGamingRetrievalFa(),

mteb/tasks/aggregated_tasks/fas/syn_per_chatbot_conv_sa_classification.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.classification import (
     SynPerChatbotConvSAAnger,
     SynPerChatbotConvSAFear,
@@ -12,7 +12,7 @@ from mteb.tasks.classification import (
     SynPerChatbotConvSASurprise,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     SynPerChatbotConvSAAnger(),
     SynPerChatbotConvSASatisfaction(),
     SynPerChatbotConvSAFriendship(),

mteb/tasks/aggregated_tasks/multilingual/sts17_multilingual_vision_sts.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts17_multilingual_visual_sts import (
     STS17MultilingualVisualSTS,
 )
-task_list_sts17_multi: list[AbsTask] = [
+task_list_sts17_multi = [
     STS17MultilingualVisualSTS().filter_languages(
         languages=["ara", "eng", "spa", "kor"],
         hf_subsets=[

mteb/tasks/aggregated_tasks/multilingual/sts_benchmark_multilingual_visual_sts.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts_benchmark_multilingual_visual_sts import (
     STSBenchmarkMultilingualVisualSTS,
 )
-task_list_multi: list[AbsTask] = [
+task_list_multi = [
     STSBenchmarkMultilingualVisualSTS().filter_languages(
         languages=[
             "deu",

mteb/tasks/aggregated_tasks/nld/cqadupstack_nl_retrieval.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval import (
     CQADupstackAndroidNLRetrieval,
     CQADupstackEnglishNLRetrieval,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval import (
     CQADupstackWordpressNLRetrieval,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidNLRetrieval(),
     CQADupstackEnglishNLRetrieval(),
     CQADupstackGamingNLRetrieval(),

mteb/tasks/aggregated_tasks/pol/cqadupstack_retrieval_pl.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval.pol.cqadupstack_pl_retrieval import (
     CQADupstackAndroidRetrievalPL,
     CQADupstackEnglishRetrievalPL,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval.pol.cqadupstack_pl_retrieval import (
     CQADupstackWordpressRetrievalPL,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidRetrievalPL(),
     CQADupstackEnglishRetrievalPL(),
     CQADupstackGamingRetrievalPL(),

mteb/tasks/clustering/nob/snl_clustering.py CHANGED Viewed

@@ -1,13 +1,18 @@
+from __future__ import annotations
 import random
-from collections.abc import Iterable
 from itertools import islice
-from typing import TypeVar
+from typing import TYPE_CHECKING, TypeVar
 import datasets
 from mteb.abstasks.clustering_legacy import AbsTaskClusteringLegacy
 from mteb.abstasks.task_metadata import TaskMetadata
+if TYPE_CHECKING:
+    from collections.abc import Iterable
 T = TypeVar("T")

mteb/tasks/clustering/nob/vg_clustering.py CHANGED Viewed

@@ -1,13 +1,18 @@
+from __future__ import annotations
 import random
-from collections.abc import Iterable
 from itertools import islice
-from typing import TypeVar
+from typing import TYPE_CHECKING, TypeVar
 import datasets
 from mteb.abstasks.clustering_legacy import AbsTaskClusteringLegacy
 from mteb.abstasks.task_metadata import TaskMetadata
+if TYPE_CHECKING:
+    from collections.abc import Iterable
 T = TypeVar("T")

mteb/tasks/retrieval/eng/limit_retrieval.py CHANGED Viewed

@@ -1,8 +1,13 @@
-from collections.abc import Sequence
+from __future__ import annotations
+from typing import TYPE_CHECKING
 from mteb.abstasks.retrieval import AbsTaskRetrieval
 from mteb.abstasks.task_metadata import TaskMetadata
+if TYPE_CHECKING:
+    from collections.abc import Sequence
 _CITATION = """
 @misc{weller2025theoreticallimit,
   archiveprefix = {arXiv},

mteb/tasks/retrieval/multilingual/ru_sci_bench_retrieval.py CHANGED Viewed

@@ -30,15 +30,15 @@ def load_ruscibench_data(
     for lang in langs:
         lang_corpus = cast(
-            datasets.Dataset,
+            "datasets.Dataset",
             datasets.load_dataset(path, f"corpus-{lang}", revision=revision),
         )["corpus"]
         lang_queries = cast(
-            datasets.Dataset,
+            "datasets.Dataset",
             datasets.load_dataset(path, f"queries-{lang}", revision=revision),
         )["queries"]
         lang_qrels = cast(
-            datasets.Dataset,
+            "datasets.Dataset",
             datasets.load_dataset(path, f"{lang}", revision=revision),
         )["test"]
         corpus[lang] = {

mteb/types/_encoder_io.py CHANGED Viewed

@@ -7,10 +7,10 @@ from typing import TYPE_CHECKING, TypedDict
 import numpy as np
 import torch
 from datasets import Dataset
-from typing_extensions import NotRequired
 if TYPE_CHECKING:
     from PIL import Image
+    from typing_extensions import NotRequired
 class EncodeKwargs(TypedDict):

mteb/types/statistics.py CHANGED Viewed

@@ -1,6 +1,13 @@
-from typing_extensions import NotRequired, TypedDict
+from __future__ import annotations
-from mteb.types import HFSubset
+from typing import TYPE_CHECKING
+from typing_extensions import TypedDict
+if TYPE_CHECKING:
+    from typing_extensions import NotRequired
+    from mteb.types import HFSubset
 class SplitDescriptiveStatistics(TypedDict):

{mteb-2.7.1.dist-info → mteb-2.7.3.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: mteb
-Version: 2.7.1
+Version: 2.7.3
 Summary: Massive Text Embedding Benchmark
 Author-email: MTEB Contributors <niklas@huggingface.co>, Kenneth Enevoldsen <kenneth.enevoldsen@cas.au.dk>, Nouamane Tazi <nouamane@huggingface.co>, Nils Reimers <info@nils-reimers.de>
 Maintainer-email: Kenneth Enevoldsen <kenneth.enevoldsen@cas.au.dk>, Roman Solomatin <risolomatin@gmail.com>, Isaac Chung <chungisaac1217@gmail.com>

mteb 2.7.1__py3-none-any.whl → 2.7.3__py3-none-any.whl

mteb 2.7.1py3-none-any.whl → 2.7.3py3-none-any.whl