PyPI - mteb - Versions diffs - 2.7.2__py3-none-any.whl → 2.7.4__py3-none-any.whl - Mend

mteb 2.7.2py3-none-any.whl → 2.7.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (238) hide show

mteb/_create_dataloaders.py +16 -9
mteb/_evaluators/any_sts_evaluator.py +10 -5
mteb/_evaluators/clustering_evaluator.py +10 -4
mteb/_evaluators/evaluator.py +9 -4
mteb/_evaluators/image/imagetext_pairclassification_evaluator.py +6 -4
mteb/_evaluators/pair_classification_evaluator.py +10 -5
mteb/_evaluators/retrieval_evaluator.py +19 -13
mteb/_evaluators/retrieval_metrics.py +9 -3
mteb/_evaluators/sklearn_evaluator.py +14 -10
mteb/_evaluators/text/bitext_mining_evaluator.py +8 -3
mteb/_evaluators/text/summarization_evaluator.py +8 -4
mteb/_evaluators/zeroshot_classification_evaluator.py +10 -3
mteb/_helpful_enum.py +5 -1
mteb/abstasks/_data_filter/filters.py +8 -2
mteb/abstasks/_data_filter/task_pipelines.py +7 -2
mteb/abstasks/_statistics_calculation.py +6 -4
mteb/abstasks/abstask.py +17 -9
mteb/abstasks/aggregate_task_metadata.py +20 -9
mteb/abstasks/aggregated_task.py +15 -8
mteb/abstasks/classification.py +15 -6
mteb/abstasks/clustering.py +17 -8
mteb/abstasks/clustering_legacy.py +14 -6
mteb/abstasks/image/image_text_pair_classification.py +17 -7
mteb/abstasks/multilabel_classification.py +11 -5
mteb/abstasks/pair_classification.py +19 -9
mteb/abstasks/regression.py +14 -6
mteb/abstasks/retrieval.py +28 -17
mteb/abstasks/retrieval_dataset_loaders.py +11 -8
mteb/abstasks/sts.py +19 -10
mteb/abstasks/task_metadata.py +17 -8
mteb/abstasks/text/bitext_mining.py +14 -7
mteb/abstasks/text/summarization.py +17 -7
mteb/abstasks/zeroshot_classification.py +15 -7
mteb/benchmarks/_create_table.py +13 -3
mteb/benchmarks/benchmark.py +11 -1
mteb/benchmarks/benchmarks/__init__.py +2 -0
mteb/benchmarks/benchmarks/benchmarks.py +41 -2
mteb/benchmarks/benchmarks/rteb_benchmarks.py +20 -9
mteb/cache.py +10 -5
mteb/cli/_display_tasks.py +9 -3
mteb/cli/build_cli.py +5 -2
mteb/cli/generate_model_card.py +9 -2
mteb/deprecated_evaluator.py +16 -12
mteb/descriptive_stats/Retrieval/BrightAopsRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightBiologyLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightBiologyRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightEarthScienceLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightEarthScienceRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightEconomicsLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightEconomicsRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightLeetcodeRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightPonyLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightPonyRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightPsychologyLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightPsychologyRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightRoboticsLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightRoboticsRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightStackoverflowLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightStackoverflowRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightSustainableLivingLongRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightSustainableLivingRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightTheoremQAQuestionsRetrieval.json +35 -0
mteb/descriptive_stats/Retrieval/BrightTheoremQATheoremsRetrieval.json +35 -0
mteb/evaluate.py +20 -18
mteb/filter_tasks.py +12 -7
mteb/get_tasks.py +9 -4
mteb/languages/language_scripts.py +8 -3
mteb/leaderboard/app.py +7 -3
mteb/leaderboard/table.py +7 -2
mteb/load_results.py +9 -3
mteb/models/abs_encoder.py +22 -12
mteb/models/cache_wrappers/cache_backend_protocol.py +5 -3
mteb/models/cache_wrappers/cache_backends/_hash_utils.py +8 -4
mteb/models/cache_wrappers/cache_backends/faiss_cache.py +8 -3
mteb/models/cache_wrappers/cache_wrapper.py +14 -9
mteb/models/get_model_meta.py +11 -4
mteb/models/instruct_wrapper.py +13 -5
mteb/models/model_implementations/align_models.py +10 -4
mteb/models/model_implementations/amazon_models.py +1 -0
mteb/models/model_implementations/andersborges.py +2 -0
mteb/models/model_implementations/ara_models.py +1 -0
mteb/models/model_implementations/arctic_models.py +8 -0
mteb/models/model_implementations/b1ade_models.py +1 -0
mteb/models/model_implementations/bedrock_models.py +20 -6
mteb/models/model_implementations/bge_models.py +40 -1
mteb/models/model_implementations/bica_model.py +1 -0
mteb/models/model_implementations/blip2_models.py +11 -4
mteb/models/model_implementations/blip_models.py +17 -4
mteb/models/model_implementations/bm25.py +22 -14
mteb/models/model_implementations/bmretriever_models.py +10 -2
mteb/models/model_implementations/cadet_models.py +1 -0
mteb/models/model_implementations/cde_models.py +11 -5
mteb/models/model_implementations/clip_models.py +12 -4
mteb/models/model_implementations/clips_models.py +3 -0
mteb/models/model_implementations/codefuse_models.py +5 -0
mteb/models/model_implementations/codesage_models.py +3 -0
mteb/models/model_implementations/cohere_models.py +14 -4
mteb/models/model_implementations/cohere_v.py +14 -4
mteb/models/model_implementations/colpali_models.py +7 -3
mteb/models/model_implementations/colqwen_models.py +17 -31
mteb/models/model_implementations/colsmol_models.py +3 -1
mteb/models/model_implementations/conan_models.py +11 -4
mteb/models/model_implementations/dino_models.py +28 -4
mteb/models/model_implementations/e5_instruct.py +4 -0
mteb/models/model_implementations/e5_models.py +9 -0
mteb/models/model_implementations/e5_v.py +10 -4
mteb/models/model_implementations/eagerworks_models.py +11 -4
mteb/models/model_implementations/emillykkejensen_models.py +3 -0
mteb/models/model_implementations/en_code_retriever.py +1 -0
mteb/models/model_implementations/euler_models.py +1 -0
mteb/models/model_implementations/evaclip_models.py +13 -4
mteb/models/model_implementations/fa_models.py +9 -0
mteb/models/model_implementations/facebookai.py +2 -0
mteb/models/model_implementations/geogpt_models.py +1 -0
mteb/models/model_implementations/gme_v_models.py +7 -3
mteb/models/model_implementations/google_models.py +15 -4
mteb/models/model_implementations/granite_vision_embedding_models.py +7 -5
mteb/models/model_implementations/gritlm_models.py +2 -0
mteb/models/model_implementations/gte_models.py +9 -0
mteb/models/model_implementations/hinvec_models.py +6 -1
mteb/models/model_implementations/human.py +1 -0
mteb/models/model_implementations/ibm_granite_models.py +6 -0
mteb/models/model_implementations/inf_models.py +2 -0
mteb/models/model_implementations/jasper_models.py +14 -5
mteb/models/model_implementations/jina_clip.py +10 -4
mteb/models/model_implementations/jina_models.py +17 -5
mteb/models/model_implementations/kalm_models.py +24 -12
mteb/models/model_implementations/kblab.py +1 -0
mteb/models/model_implementations/kennethenevoldsen_models.py +2 -0
mteb/models/model_implementations/kfst.py +1 -0
mteb/models/model_implementations/kowshik24_models.py +1 -0
mteb/models/model_implementations/lens_models.py +2 -0
mteb/models/model_implementations/lgai_embedding_models.py +1 -0
mteb/models/model_implementations/linq_models.py +7 -1
mteb/models/model_implementations/listconranker.py +10 -4
mteb/models/model_implementations/llm2clip_models.py +12 -4
mteb/models/model_implementations/llm2vec_models.py +20 -6
mteb/models/model_implementations/mcinext_models.py +8 -2
mteb/models/model_implementations/mdbr_models.py +2 -0
mteb/models/model_implementations/misc_models.py +63 -0
mteb/models/model_implementations/mixedbread_ai_models.py +3 -0
mteb/models/model_implementations/mme5_models.py +2 -1
mteb/models/model_implementations/moco_models.py +11 -4
mteb/models/model_implementations/mod_models.py +2 -1
mteb/models/model_implementations/model2vec_models.py +23 -4
mteb/models/model_implementations/moka_models.py +3 -0
mteb/models/model_implementations/nbailab.py +3 -0
mteb/models/model_implementations/no_instruct_sentence_models.py +13 -5
mteb/models/model_implementations/nomic_models.py +16 -4
mteb/models/model_implementations/nomic_models_vision.py +5 -3
mteb/models/model_implementations/nvidia_llama_nemoretriever_colemb.py +9 -3
mteb/models/model_implementations/nvidia_models.py +15 -4
mteb/models/model_implementations/octen_models.py +3 -1
mteb/models/model_implementations/openai_models.py +14 -4
mteb/models/model_implementations/openclip_models.py +17 -4
mteb/models/model_implementations/opensearch_neural_sparse_models.py +15 -4
mteb/models/model_implementations/ops_moa_models.py +9 -2
mteb/models/model_implementations/ordalietech_solon_embeddings_mini_beta_1_1.py +1 -0
mteb/models/model_implementations/pawan_models.py +1 -0
mteb/models/model_implementations/piccolo_models.py +2 -0
mteb/models/model_implementations/promptriever_models.py +16 -6
mteb/models/model_implementations/pylate_models.py +22 -13
mteb/models/model_implementations/qodo_models.py +2 -0
mteb/models/model_implementations/qtack_models.py +1 -0
mteb/models/model_implementations/qwen3_models.py +11 -1
mteb/models/model_implementations/qzhou_models.py +2 -0
mteb/models/model_implementations/random_baseline.py +4 -3
mteb/models/model_implementations/rasgaard_models.py +1 -0
mteb/models/model_implementations/reasonir_model.py +65 -0
mteb/models/model_implementations/repllama_models.py +15 -6
mteb/models/model_implementations/rerankers_custom.py +13 -4
mteb/models/model_implementations/rerankers_monot5_based.py +24 -4
mteb/models/model_implementations/richinfoai_models.py +1 -0
mteb/models/model_implementations/ru_sentence_models.py +20 -0
mteb/models/model_implementations/ruri_models.py +10 -0
mteb/models/model_implementations/salesforce_models.py +10 -1
mteb/models/model_implementations/samilpwc_models.py +1 -0
mteb/models/model_implementations/sarashina_embedding_models.py +2 -0
mteb/models/model_implementations/searchmap_models.py +1 -0
mteb/models/model_implementations/seed_1_6_embedding_models.py +5 -2
mteb/models/model_implementations/seed_1_6_embedding_models_1215.py +6 -2
mteb/models/model_implementations/seed_models.py +2 -1
mteb/models/model_implementations/sentence_transformers_models.py +18 -0
mteb/models/model_implementations/shuu_model.py +1 -0
mteb/models/model_implementations/siglip_models.py +19 -4
mteb/models/model_implementations/slm_models.py +7 -4
mteb/models/model_implementations/sonar_models.py +2 -1
mteb/models/model_implementations/spartan8806_atles_champion.py +1 -0
mteb/models/model_implementations/stella_models.py +6 -0
mteb/models/model_implementations/tarka_models.py +2 -0
mteb/models/model_implementations/text2vec_models.py +3 -0
mteb/models/model_implementations/ua_sentence_models.py +1 -0
mteb/models/model_implementations/uae_models.py +10 -4
mteb/models/model_implementations/vdr_models.py +8 -1
mteb/models/model_implementations/vi_vn_models.py +6 -0
mteb/models/model_implementations/vista_models.py +11 -4
mteb/models/model_implementations/vlm2vec_models.py +11 -4
mteb/models/model_implementations/voyage_models.py +25 -4
mteb/models/model_implementations/voyage_v.py +11 -6
mteb/models/model_implementations/xyz_models.py +1 -0
mteb/models/model_implementations/youtu_models.py +1 -0
mteb/models/model_implementations/yuan_models.py +1 -0
mteb/models/model_implementations/yuan_models_en.py +2 -1
mteb/models/model_meta.py +47 -9
mteb/models/models_protocols.py +19 -18
mteb/models/search_encoder_index/search_backend_protocol.py +7 -3
mteb/models/search_encoder_index/search_indexes/faiss_search_index.py +12 -4
mteb/models/search_wrappers.py +19 -12
mteb/models/sentence_transformer_wrapper.py +4 -3
mteb/models/vllm_wrapper.py +8 -6
mteb/results/benchmark_results.py +22 -17
mteb/results/model_result.py +21 -15
mteb/results/task_result.py +15 -9
mteb/similarity_functions.py +8 -2
mteb/tasks/aggregated_tasks/eng/cqadupstack_retrieval.py +3 -3
mteb/tasks/aggregated_tasks/eng/sts17_multilingual_visual_sts_eng.py +3 -3
mteb/tasks/aggregated_tasks/eng/sts_benchmark_multilingual_visual_sts_eng.py +3 -3
mteb/tasks/aggregated_tasks/fas/cqadupstack_retrieval_fa.py +3 -3
mteb/tasks/aggregated_tasks/fas/syn_per_chatbot_conv_sa_classification.py +3 -3
mteb/tasks/aggregated_tasks/multilingual/sts17_multilingual_vision_sts.py +3 -3
mteb/tasks/aggregated_tasks/multilingual/sts_benchmark_multilingual_visual_sts.py +3 -3
mteb/tasks/aggregated_tasks/nld/cqadupstack_nl_retrieval.py +3 -3
mteb/tasks/aggregated_tasks/pol/cqadupstack_retrieval_pl.py +3 -3
mteb/tasks/clustering/nob/snl_clustering.py +7 -2
mteb/tasks/clustering/nob/vg_clustering.py +7 -2
mteb/tasks/retrieval/eng/__init__.py +42 -0
mteb/tasks/retrieval/eng/bright_retrieval.py +9 -1
mteb/tasks/retrieval/eng/bright_v1_1_retrieval.py +968 -0
mteb/tasks/retrieval/eng/limit_retrieval.py +6 -1
mteb/tasks/retrieval/multilingual/ru_sci_bench_retrieval.py +3 -3
mteb/types/_encoder_io.py +1 -1
mteb/types/statistics.py +9 -2
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/METADATA +1 -1
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/RECORD +238 -217
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/WHEEL +0 -0
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/entry_points.txt +0 -0
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/licenses/LICENSE +0 -0
{mteb-2.7.2.dist-info → mteb-2.7.4.dist-info}/top_level.txt +0 -0

mteb/models/sentence_transformer_wrapper.py CHANGED Viewed

@@ -7,19 +7,20 @@ from typing import TYPE_CHECKING, Any
 import numpy as np
 import torch
 from packaging.version import Version
-from torch.utils.data import DataLoader
-from typing_extensions import Unpack
 from mteb._log_once import LogOnce
 from mteb.models import ModelMeta
-from mteb.types import Array, BatchedInput, EncodeKwargs, PromptType
+from mteb.types import PromptType
 from .abs_encoder import AbsEncoder
 if TYPE_CHECKING:
     from sentence_transformers import CrossEncoder, SentenceTransformer
+    from torch.utils.data import DataLoader
+    from typing_extensions import Unpack
     from mteb.abstasks.task_metadata import TaskMetadata
+    from mteb.types import Array, BatchedInput, EncodeKwargs
 logger = logging.getLogger(__name__)

mteb/models/vllm_wrapper.py CHANGED Viewed

@@ -4,23 +4,25 @@ import atexit
 import gc
 import logging
 import os
-from collections.abc import Callable
 from typing import TYPE_CHECKING, Any, Literal
 import numpy as np
 import torch
-from torch.utils.data import DataLoader
 from mteb._requires_package import requires_package
-from mteb.abstasks.task_metadata import TaskMetadata
 from mteb.models import ModelMeta
 from mteb.models.abs_encoder import AbsEncoder
-from mteb.types import Array, BatchedInput, PromptType
+from mteb.types import PromptType
 if TYPE_CHECKING:
+    from collections.abc import Callable
+    from torch.utils.data import DataLoader
     from vllm.config import PoolerConfig  # type: ignore[import-not-found]
-else:
-    PoolerConfig = dict[str, Any]
+    from mteb.abstasks.task_metadata import TaskMetadata
+    from mteb.types import Array, BatchedInput
 logger = logging.getLogger(__name__)

mteb/results/benchmark_results.py CHANGED Viewed

@@ -4,34 +4,39 @@ import functools
 import json
 import logging
 import warnings
-from collections.abc import Callable, Iterable, Iterator
 from pathlib import Path
-from typing import Any, Literal, cast
+from typing import TYPE_CHECKING, Any, Literal, cast
 import pandas as pd
 from packaging.version import InvalidVersion, Version
 from pydantic import BaseModel, ConfigDict
-from typing_extensions import Self
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.task_metadata import (
-    TaskDomain,
-    TaskType,
-)
 from mteb.benchmarks.benchmark import Benchmark
 from mteb.models import ModelMeta
 from mteb.models.get_model_meta import get_model_metas
-from mteb.types import (
-    ISOLanguage,
-    ISOLanguageScript,
-    Modalities,
-    Score,
-    ScoresDict,
-    SplitName,
-)
 from .model_result import ModelResult, _aggregate_and_pivot
+if TYPE_CHECKING:
+    from collections.abc import Callable, Iterable, Iterator
+    from typing_extensions import Self
+    from mteb.abstasks.abstask import AbsTask
+    from mteb.abstasks.task_metadata import (
+        TaskDomain,
+        TaskType,
+    )
+    from mteb.types import (
+        ISOLanguage,
+        ISOLanguageScript,
+        Modalities,
+        Score,
+        ScoresDict,
+        SplitName,
+    )
 logger = logging.getLogger(__name__)
@@ -144,7 +149,7 @@ class BenchmarkResults(BaseModel):
                     raise ValueError("name in ModelMeta is None. It must be a string.")
                 name_rev[name.name] = name.revision
             else:
-                name_ = cast(str, name)
+                name_ = cast("str", name)
                 name_rev[name_] = revision
         for model_res in self.model_results:

mteb/results/model_result.py CHANGED Viewed

@@ -2,30 +2,36 @@ from __future__ import annotations
 import logging
 import warnings
-from collections.abc import Callable, Iterable
-from typing import Any, Literal, cast
+from typing import TYPE_CHECKING, Any, Literal, cast
 import numpy as np
 import pandas as pd
 from pydantic import BaseModel, ConfigDict, Field
 from typing_extensions import overload
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.task_metadata import (
-    TaskDomain,
-    TaskType,
-)
 from mteb.types import (
-    ISOLanguage,
-    ISOLanguageScript,
     Modalities,
-    Score,
-    ScoresDict,
-    SplitName,
 )
 from .task_result import TaskError, TaskResult
+if TYPE_CHECKING:
+    from collections.abc import Callable, Iterable
+    from mteb.abstasks.abstask import AbsTask
+    from mteb.abstasks.task_metadata import (
+        TaskDomain,
+        TaskType,
+    )
+    from mteb.types import (
+        ISOLanguage,
+        ISOLanguageScript,
+        Score,
+        ScoresDict,
+        SplitName,
+    )
 logger = logging.getLogger(__name__)
@@ -83,7 +89,7 @@ class ModelResult(BaseModel):
     model_revision: str | None
     task_results: list[TaskResult]
     default_modalities: list[Modalities] = Field(
-        default_factory=lambda: [cast(Modalities, "text")], alias="modalities"
+        default_factory=lambda: [cast("Modalities", "text")], alias="modalities"
     )
     model_config = (
         ConfigDict(  # to free up the name model_* which is otherwise protected
@@ -202,8 +208,8 @@ class ModelResult(BaseModel):
             aggregation = aggregation if aggregation is not None else np.mean
         else:
             use_fast = True
-        aggregation = cast(Callable[[list[Score]], Any], aggregation)
-        getter = cast(Callable[[ScoresDict], Score], getter)
+        aggregation = cast("Callable[[list[Score]], Any]", aggregation)
+        getter = cast("Callable[[ScoresDict], Score]", getter)
         if format == "wide":
             scores = {}

mteb/results/task_result.py CHANGED Viewed

@@ -4,34 +4,40 @@ import json
 import logging
 import warnings
 from collections import defaultdict
-from collections.abc import Callable, Iterable, Mapping
 from functools import cached_property
 from importlib.metadata import version
-from pathlib import Path
-from typing import Any
+from typing import TYPE_CHECKING, Any
 import numpy as np
 from huggingface_hub import EvalResult
 from packaging.version import Version
 from pydantic import BaseModel, field_validator
-from typing_extensions import Self
 from mteb import TaskMetadata
 from mteb._helpful_enum import HelpfulStrEnum
 from mteb.abstasks import AbsTaskClassification
 from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.task_metadata import TaskDomain
 from mteb.languages import LanguageScripts
 from mteb.models.model_meta import ScoringFunction
 from mteb.types import (
-    HFSubset,
-    ISOLanguage,
-    ISOLanguageScript,
-    Score,
     ScoresDict,
     SplitName,
 )
+if TYPE_CHECKING:
+    from collections.abc import Callable, Iterable, Mapping
+    from pathlib import Path
+    from typing_extensions import Self
+    from mteb.abstasks.task_metadata import TaskDomain
+    from mteb.types import (
+        HFSubset,
+        ISOLanguage,
+        ISOLanguageScript,
+        Score,
+    )
 logger = logging.getLogger(__name__)

mteb/similarity_functions.py CHANGED Viewed

@@ -1,8 +1,14 @@
+from __future__ import annotations
+from typing import TYPE_CHECKING
 import torch
-from mteb.models import EncoderProtocol
 from mteb.models.model_meta import ScoringFunction
-from mteb.types import Array
+if TYPE_CHECKING:
+    from mteb.models import EncoderProtocol
+    from mteb.types import Array
 def _use_torch_compile():

mteb/tasks/aggregated_tasks/eng/cqadupstack_retrieval.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval import (
     CQADupstackAndroidRetrieval,
     CQADupstackEnglishRetrieval,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval import (
     CQADupstackWordpressRetrieval,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidRetrieval(),
     CQADupstackEnglishRetrieval(),
     CQADupstackGamingRetrieval(),

mteb/tasks/aggregated_tasks/eng/sts17_multilingual_visual_sts_eng.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts17_multilingual_visual_sts import (
     STS17MultilingualVisualSTS,
 )
-task_list_sts17: list[AbsTask] = [
+task_list_sts17 = [
     STS17MultilingualVisualSTS().filter_languages(
         languages=["eng"], hf_subsets=["en-en"]
     )

mteb/tasks/aggregated_tasks/eng/sts_benchmark_multilingual_visual_sts_eng.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts_benchmark_multilingual_visual_sts import (
     STSBenchmarkMultilingualVisualSTS,
 )
-task_list_stsb: list[AbsTask] = [
+task_list_stsb = [
     STSBenchmarkMultilingualVisualSTS().filter_languages(
         languages=["eng"], hf_subsets=["en"]
     )

mteb/tasks/aggregated_tasks/fas/cqadupstack_retrieval_fa.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval import (
     CQADupstackAndroidRetrievalFa,
     CQADupstackEnglishRetrievalFa,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval import (
     CQADupstackWordpressRetrievalFa,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidRetrievalFa(),
     CQADupstackEnglishRetrievalFa(),
     CQADupstackGamingRetrievalFa(),

mteb/tasks/aggregated_tasks/fas/syn_per_chatbot_conv_sa_classification.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.classification import (
     SynPerChatbotConvSAAnger,
     SynPerChatbotConvSAFear,
@@ -12,7 +12,7 @@ from mteb.tasks.classification import (
     SynPerChatbotConvSASurprise,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     SynPerChatbotConvSAAnger(),
     SynPerChatbotConvSASatisfaction(),
     SynPerChatbotConvSAFriendship(),

mteb/tasks/aggregated_tasks/multilingual/sts17_multilingual_vision_sts.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts17_multilingual_visual_sts import (
     STS17MultilingualVisualSTS,
 )
-task_list_sts17_multi: list[AbsTask] = [
+task_list_sts17_multi = [
     STS17MultilingualVisualSTS().filter_languages(
         languages=["ara", "eng", "spa", "kor"],
         hf_subsets=[

mteb/tasks/aggregated_tasks/multilingual/sts_benchmark_multilingual_visual_sts.py CHANGED Viewed

@@ -1,10 +1,10 @@
-from mteb.abstasks.abstask import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.sts.multilingual.sts_benchmark_multilingual_visual_sts import (
     STSBenchmarkMultilingualVisualSTS,
 )
-task_list_multi: list[AbsTask] = [
+task_list_multi = [
     STSBenchmarkMultilingualVisualSTS().filter_languages(
         languages=[
             "deu",

mteb/tasks/aggregated_tasks/nld/cqadupstack_nl_retrieval.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval import (
     CQADupstackAndroidNLRetrieval,
     CQADupstackEnglishNLRetrieval,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval import (
     CQADupstackWordpressNLRetrieval,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidNLRetrieval(),
     CQADupstackEnglishNLRetrieval(),
     CQADupstackGamingNLRetrieval(),

mteb/tasks/aggregated_tasks/pol/cqadupstack_retrieval_pl.py CHANGED Viewed

@@ -1,5 +1,5 @@
-from mteb.abstasks import AbsTask
-from mteb.abstasks.aggregated_task import AbsTaskAggregate, AggregateTaskMetadata
+from mteb.abstasks.aggregate_task_metadata import AggregateTaskMetadata
+from mteb.abstasks.aggregated_task import AbsTaskAggregate
 from mteb.tasks.retrieval.pol.cqadupstack_pl_retrieval import (
     CQADupstackAndroidRetrievalPL,
     CQADupstackEnglishRetrievalPL,
@@ -15,7 +15,7 @@ from mteb.tasks.retrieval.pol.cqadupstack_pl_retrieval import (
     CQADupstackWordpressRetrievalPL,
 )
-task_list_cqa: list[AbsTask] = [
+task_list_cqa = [
     CQADupstackAndroidRetrievalPL(),
     CQADupstackEnglishRetrievalPL(),
     CQADupstackGamingRetrievalPL(),

mteb/tasks/clustering/nob/snl_clustering.py CHANGED Viewed

@@ -1,13 +1,18 @@
+from __future__ import annotations
 import random
-from collections.abc import Iterable
 from itertools import islice
-from typing import TypeVar
+from typing import TYPE_CHECKING, TypeVar
 import datasets
 from mteb.abstasks.clustering_legacy import AbsTaskClusteringLegacy
 from mteb.abstasks.task_metadata import TaskMetadata
+if TYPE_CHECKING:
+    from collections.abc import Iterable
 T = TypeVar("T")

mteb/tasks/clustering/nob/vg_clustering.py CHANGED Viewed

@@ -1,13 +1,18 @@
+from __future__ import annotations
 import random
-from collections.abc import Iterable
 from itertools import islice
-from typing import TypeVar
+from typing import TYPE_CHECKING, TypeVar
 import datasets
 from mteb.abstasks.clustering_legacy import AbsTaskClusteringLegacy
 from mteb.abstasks.task_metadata import TaskMetadata
+if TYPE_CHECKING:
+    from collections.abc import Iterable
 T = TypeVar("T")

mteb/tasks/retrieval/eng/__init__.py CHANGED Viewed

@@ -14,6 +14,28 @@ from .birco_whats_that_book_reranking import BIRCOWhatsThatBookReranking
 from .blink_it2i_retrieval import BLINKIT2IRetrieval
 from .blink_it2t_retrieval import BLINKIT2TRetrieval
 from .bright_retrieval import BrightLongRetrieval, BrightRetrieval
+from .bright_v1_1_retrieval import (
+    BrightAopsRetrieval,
+    BrightBiologyLongRetrieval,
+    BrightBiologyRetrieval,
+    BrightEarthScienceLongRetrieval,
+    BrightEarthScienceRetrieval,
+    BrightEconomicsLongRetrieval,
+    BrightEconomicsRetrieval,
+    BrightLeetcodeRetrieval,
+    BrightPonyLongRetrieval,
+    BrightPonyRetrieval,
+    BrightPsychologyLongRetrieval,
+    BrightPsychologyRetrieval,
+    BrightRoboticsLongRetrieval,
+    BrightRoboticsRetrieval,
+    BrightStackoverflowLongRetrieval,
+    BrightStackoverflowRetrieval,
+    BrightSustainableLivingLongRetrieval,
+    BrightSustainableLivingRetrieval,
+    BrightTheoremQAQuestionsRetrieval,
+    BrightTheoremQATheoremsRetrieval,
+)
 from .built_bench_retrieval import BuiltBenchRetrieval
 from .chat_doctor_retrieval import ChatDoctorRetrieval
 from .chem_hotpot_qa_retrieval import ChemHotpotQARetrieval
@@ -236,8 +258,28 @@ __all__ = [
     "BarExamQARetrieval",
     "BillSumCARetrieval",
     "BillSumUSRetrieval",
+    "BrightAopsRetrieval",
+    "BrightBiologyLongRetrieval",
+    "BrightBiologyRetrieval",
+    "BrightEarthScienceLongRetrieval",
+    "BrightEarthScienceRetrieval",
+    "BrightEconomicsLongRetrieval",
+    "BrightEconomicsRetrieval",
+    "BrightLeetcodeRetrieval",
     "BrightLongRetrieval",
+    "BrightPonyLongRetrieval",
+    "BrightPonyRetrieval",
+    "BrightPsychologyLongRetrieval",
+    "BrightPsychologyRetrieval",
     "BrightRetrieval",
+    "BrightRoboticsLongRetrieval",
+    "BrightRoboticsRetrieval",
+    "BrightStackoverflowLongRetrieval",
+    "BrightStackoverflowRetrieval",
+    "BrightSustainableLivingLongRetrieval",
+    "BrightSustainableLivingRetrieval",
+    "BrightTheoremQAQuestionsRetrieval",
+    "BrightTheoremQATheoremsRetrieval",
     "BuiltBenchRetrieval",
     "CIRRIT2IRetrieval",
     "CQADupstackAndroidRetrieval",

mteb/tasks/retrieval/eng/bright_retrieval.py CHANGED Viewed

@@ -1,3 +1,4 @@
+import warnings
 from collections import defaultdict
 import datasets
@@ -86,6 +87,12 @@ def load_data(self) -> None:
     if self.data_loaded:
         return
+    warnings.warn(
+        "This task contains wrong prompts in the metadata. "
+        "Please use BRIGHT(v1.1) benchmark instead.",
+        category=DeprecationWarning,
+    )
     self.corpus, self.queries, self.relevant_docs = self.load_bright_data(
         path=self.metadata.dataset["path"],
         domains=list(self.metadata.eval_langs.keys()),
@@ -104,7 +111,7 @@ class BrightRetrieval(AbsTaskRetrieval):
             "revision": "a75a0eb483f6a5233a6efc2d63d71540a4443dfb",
         },
         reference="https://huggingface.co/datasets/xlangai/BRIGHT",
-        description="Bright retrieval dataset.",
+        description="BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval",
         type="Retrieval",
         category="t2t",
         eval_splits=["standard"],
@@ -129,6 +136,7 @@ class BrightRetrieval(AbsTaskRetrieval):
   year = {2024},
 }
 """,
+        superseded_by="BrightBiologyRetrieval",
     )
     load_bright_data = load_bright_data
     load_data = load_data

mteb 2.7.2__py3-none-any.whl → 2.7.4__py3-none-any.whl

mteb 2.7.2py3-none-any.whl → 2.7.4py3-none-any.whl