PyPI - EuroEval - Versions diffs - 16.4.0__py3-none-any.whl → 16.5.0__py3-none-any.whl - Mend

EuroEval 16.4.0py3-none-any.whl → 16.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of EuroEval might be problematic. Click here for more details.

Files changed (71) hide show

euroeval/__init__.py +6 -0
euroeval/benchmark_config_factory.py +51 -46
euroeval/benchmark_modules/base.py +6 -5
euroeval/benchmark_modules/hf.py +2 -9
euroeval/benchmark_modules/litellm.py +14 -12
euroeval/benchmark_modules/vllm.py +17 -10
euroeval/benchmarker.py +61 -44
euroeval/caching_utils.py +1 -1
euroeval/cli.py +86 -8
euroeval/constants.py +3 -0
euroeval/data_loading.py +78 -30
euroeval/data_models.py +326 -326
euroeval/dataset_configs/__init__.py +10 -3
euroeval/dataset_configs/bulgarian.py +56 -0
euroeval/dataset_configs/czech.py +25 -29
euroeval/dataset_configs/danish.py +51 -88
euroeval/dataset_configs/dutch.py +48 -86
euroeval/dataset_configs/english.py +45 -76
euroeval/dataset_configs/estonian.py +36 -38
euroeval/dataset_configs/faroese.py +19 -60
euroeval/dataset_configs/finnish.py +36 -68
euroeval/dataset_configs/french.py +39 -74
euroeval/dataset_configs/german.py +45 -81
euroeval/dataset_configs/greek.py +64 -0
euroeval/dataset_configs/icelandic.py +54 -91
euroeval/dataset_configs/italian.py +42 -78
euroeval/dataset_configs/latvian.py +28 -34
euroeval/dataset_configs/lithuanian.py +22 -26
euroeval/dataset_configs/norwegian.py +72 -114
euroeval/dataset_configs/polish.py +33 -60
euroeval/dataset_configs/portuguese.py +33 -65
euroeval/dataset_configs/serbian.py +64 -0
euroeval/dataset_configs/slovak.py +19 -24
euroeval/dataset_configs/spanish.py +42 -76
euroeval/dataset_configs/swedish.py +48 -84
euroeval/dataset_configs/ukrainian.py +64 -0
euroeval/exceptions.py +1 -1
euroeval/finetuning.py +3 -2
euroeval/generation.py +5 -4
euroeval/generation_utils.py +6 -5
euroeval/languages.py +395 -323
euroeval/metrics/huggingface.py +14 -3
euroeval/metrics/llm_as_a_judge.py +1 -1
euroeval/model_cache.py +6 -5
euroeval/model_loading.py +1 -1
euroeval/prompt_templates/__init__.py +2 -0
euroeval/prompt_templates/classification.py +206 -0
euroeval/prompt_templates/linguistic_acceptability.py +82 -43
euroeval/prompt_templates/multiple_choice.py +81 -41
euroeval/prompt_templates/named_entity_recognition.py +125 -44
euroeval/prompt_templates/reading_comprehension.py +92 -43
euroeval/prompt_templates/sentiment_classification.py +91 -43
euroeval/prompt_templates/summarization.py +64 -39
euroeval/prompt_templates/token_classification.py +279 -0
euroeval/scores.py +4 -3
euroeval/speed_benchmark.py +2 -1
euroeval/task_group_utils/multiple_choice_classification.py +2 -1
euroeval/task_group_utils/question_answering.py +24 -13
euroeval/task_group_utils/sequence_classification.py +5 -4
euroeval/task_group_utils/text_to_text.py +2 -1
euroeval/task_group_utils/token_classification.py +11 -8
euroeval/tasks.py +44 -1
euroeval/tokenisation_utils.py +19 -10
euroeval/types.py +10 -9
euroeval/utils.py +6 -3
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/METADATA +194 -37
euroeval-16.5.0.dist-info/RECORD +81 -0
euroeval-16.4.0.dist-info/RECORD +0 -75
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/WHEEL +0 -0
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/entry_points.txt +0 -0
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/licenses/LICENSE +0 -0

euroeval/dataset_configs/english.py CHANGED Viewed

@@ -1,77 +1,73 @@
 """All English dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import EN
+from ..languages import ENGLISH
 from ..tasks import COMMON_SENSE, EUROPEAN_VALUES, KNOW, LA, MCRC, NER, RC, SENT, SUMM
 ### Official datasets ###
 SST5_CONFIG = DatasetConfig(
     name="sst5",
-    pretty_name="the truncated version of the English sentiment classification "
-    "dataset SST5",
-    huggingface_id="EuroEval/sst5-mini",
+    pretty_name="SST-5",
+    source="EuroEval/sst5-mini",
     task=SENT,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 SCALA_EN_CONFIG = DatasetConfig(
     name="scala-en",
-    pretty_name="the English part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-en",
+    pretty_name="ScaLA-en",
+    source="EuroEval/scala-en",
     task=LA,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 CONLL_EN_CONFIG = DatasetConfig(
     name="conll-en",
-    pretty_name="the truncated version of the English named entity recognition "
-    "dataset CoNLL 2003",
-    huggingface_id="EuroEval/conll-en-mini",
+    pretty_name="CoNLL-en",
+    source="EuroEval/conll-en-mini",
     task=NER,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 SQUAD_CONFIG = DatasetConfig(
     name="squad",
-    pretty_name="the truncated version of the English question answering dataset SQuAD",
-    huggingface_id="EuroEval/squad-mini",
+    pretty_name="SQuAD",
+    source="EuroEval/squad-mini",
     task=RC,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 CNN_DAILYMAIL_CONFIG = DatasetConfig(
     name="cnn-dailymail",
-    pretty_name="the truncated version of the English summarisation dataset "
-    "CNN-DailyMail",
-    huggingface_id="EuroEval/cnn-dailymail-mini",
+    pretty_name="CNN/DailyMail",
+    source="EuroEval/cnn-dailymail-mini",
     task=SUMM,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 LIFE_IN_THE_UK_CONFIG = DatasetConfig(
     name="life-in-the-uk",
-    pretty_name="the English knowledge dataset Life in the UK",
-    huggingface_id="EuroEval/life-in-the-uk",
+    pretty_name="Life in the UK",
+    source="EuroEval/life-in-the-uk",
     task=KNOW,
-    languages=[EN],
+    languages=[ENGLISH],
 )
 HELLASWAG_CONFIG = DatasetConfig(
     name="hellaswag",
-    pretty_name="the truncated version of the English common-sense reasoning "
-    "dataset HellaSwag",
-    huggingface_id="EuroEval/hellaswag-mini",
+    pretty_name="HellaSwag",
+    source="EuroEval/hellaswag-mini",
     task=COMMON_SENSE,
-    languages=[EN],
+    languages=[ENGLISH],
 )
-EUROPEAN_VALUES_EN_CONFIG = DatasetConfig(
-    name="european-values-en",
-    pretty_name="the English version of the European values evaluation dataset",
-    huggingface_id="EuroEval/european-values-en",
+VALEU_EN_CONFIG = DatasetConfig(
+    name="valeu-en",
+    pretty_name="VaLEU-en",
+    source="EuroEval/european-values-en",
     task=EUROPEAN_VALUES,
-    languages=[EN],
+    languages=[ENGLISH],
     splits=["test"],
     bootstrap_samples=False,
     _instruction_prompt="{text}",
@@ -82,82 +78,55 @@ EUROPEAN_VALUES_EN_CONFIG = DatasetConfig(
 XQUAD_EN_CONFIG = DatasetConfig(
     name="xquad-en",
-    pretty_name="the English version of the reading comprehension dataset XQuAD",
-    huggingface_id="EuroEval/xquad-en",
+    pretty_name="XQuAD-en",
+    source="EuroEval/xquad-en",
     task=RC,
-    languages=[EN],
+    languages=[ENGLISH],
     unofficial=True,
 )
 ARC_CONFIG = DatasetConfig(
     name="arc",
-    pretty_name="the truncated version of the English knowledge dataset ARC",
-    huggingface_id="EuroEval/arc-mini",
+    pretty_name="ARC",
+    source="EuroEval/arc-mini",
     task=KNOW,
-    languages=[EN],
+    languages=[ENGLISH],
     unofficial=True,
 )
 BELEBELE_CONFIG = DatasetConfig(
     name="belebele-en",
-    pretty_name="the English multiple choice reading comprehension dataset BeleBele",
-    huggingface_id="EuroEval/belebele-mini",
+    pretty_name="Belebele-en",
+    source="EuroEval/belebele-mini",
     task=MCRC,
-    languages=[EN],
+    languages=[ENGLISH],
     unofficial=True,
 )
 MMLU_CONFIG = DatasetConfig(
     name="mmlu",
-    pretty_name="the truncated version of the English knowledge dataset MMLU",
-    huggingface_id="EuroEval/mmlu-mini",
+    pretty_name="MMLU",
+    source="EuroEval/mmlu-mini",
     task=KNOW,
-    languages=[EN],
+    languages=[ENGLISH],
     unofficial=True,
 )
 MULTI_WIKI_QA_EN_CONFIG = DatasetConfig(
     name="multi-wiki-qa-en",
-    pretty_name="the truncated version of the English part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-en-mini",
+    pretty_name="MultiWikiQA-en",
+    source="EuroEval/multi-wiki-qa-en-mini",
     task=RC,
-    languages=[EN],
+    languages=[ENGLISH],
     unofficial=True,
 )
 WINOGRANDE_CONFIG = DatasetConfig(
     name="winogrande",
-    pretty_name="the English common-sense reasoning dataset Winogrande",
-    huggingface_id="EuroEval/winogrande-en",
+    pretty_name="Winogrande-en",
+    source="EuroEval/winogrande-en",
     task=COMMON_SENSE,
-    languages=[EN],
+    languages=[ENGLISH],
     _labels=["a", "b"],
     unofficial=True,
 )
-EUROPEAN_VALUES_SITUATIONAL_EN_CONFIG = DatasetConfig(
-    name="european-values-situational-en",
-    pretty_name="the English version of the European values evaluation dataset, where "
-    "the questions are phrased in a situational way",
-    huggingface_id="EuroEval/european-values-situational-en",
-    task=EUROPEAN_VALUES,
-    languages=[EN],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)
-EUROPEAN_VALUES_COMPLETIONS_EN_CONFIG = DatasetConfig(
-    name="european-values-completions-en",
-    pretty_name="the English version of the European values evaluation dataset, where "
-    "the questions are phrased as sentence completions",
-    huggingface_id="EuroEval/european-values-completions-en",
-    task=EUROPEAN_VALUES,
-    languages=[EN],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)

euroeval/dataset_configs/estonian.py CHANGED Viewed

@@ -1,66 +1,65 @@
 """All Estonian dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import ET
+from ..languages import ESTONIAN
 from ..tasks import COMMON_SENSE, EUROPEAN_VALUES, KNOW, LA, NER, RC, SENT, SUMM
 ### Official datasets ###
 ESTONIAN_VALENCE_CONFIG = DatasetConfig(
     name="estonian-valence",
-    pretty_name="the Estonian sentiment classification dataset Estonian Valence",
-    huggingface_id="EuroEval/estonian-valence",
+    pretty_name="Estonian Valence",
+    source="EuroEval/estonian-valence",
     task=SENT,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 GRAMMAR_ET_CONFIG = DatasetConfig(
     name="grammar-et",
-    pretty_name="the Estonian linguistic acceptability dataset Grammar-et",
-    huggingface_id="EuroEval/grammar-et",
+    pretty_name="Grammar-et",
+    source="EuroEval/grammar-et",
     task=LA,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 ESTNER_CONFIG = DatasetConfig(
     name="estner",
-    pretty_name="the Estonian named entity recognition dataset EstNER",
-    huggingface_id="EuroEval/estner-mini",
+    pretty_name="EstNER",
+    source="EuroEval/estner-mini",
     task=NER,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 MULTI_WIKI_QA_ET_CONFIG = DatasetConfig(
     name="multi-wiki-qa-et",
-    pretty_name="the truncated version of the Estonian part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-et-mini",
+    pretty_name="MultiWikiQA-et",
+    source="EuroEval/multi-wiki-qa-et-mini",
     task=RC,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 ERR_NEWS_CONFIG = DatasetConfig(
     name="err-news",
-    pretty_name="the Estonian summarisation dataset ErrNews",
-    huggingface_id="EuroEval/err-news-mini",
+    pretty_name="ERR News",
+    source="EuroEval/err-news-mini",
     task=SUMM,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 TRIVIA_ET_CONFIG = DatasetConfig(
     name="trivia-et",
-    pretty_name="the Estonian knowledge dataset Trivia-et",
-    huggingface_id="EuroEval/trivia-et",
+    pretty_name="Trivia-et",
+    source="EuroEval/trivia-et",
     task=KNOW,
-    languages=[ET],
+    languages=[ESTONIAN],
 )
 WINOGRANDE_ET_CONFIG = DatasetConfig(
     name="winogrande-et",
-    pretty_name="the Estonian common-sense reasoning dataset Winogrande-et",
-    huggingface_id="EuroEval/winogrande-et",
+    pretty_name="Winogrande-et",
+    source="EuroEval/winogrande-et",
     task=COMMON_SENSE,
-    languages=[ET],
+    languages=[ESTONIAN],
     _prompt_prefix="Sulle esitatakse lüngaga (_) tekstülesanded, "
     "igal ülesandel on kaks vastusevarianti (a ja b).",
     _prompt_template="Tekstülesanne: {text}\nVastus: {label}",
@@ -70,12 +69,12 @@ WINOGRANDE_ET_CONFIG = DatasetConfig(
     _labels=["a", "b"],
 )
-EUROPEAN_VALUES_ET_CONFIG = DatasetConfig(
-    name="european-values-et",
-    pretty_name="the Estonian version of the European values evaluation dataset",
-    huggingface_id="EuroEval/european-values-et",
+VALEU_ET_CONFIG = DatasetConfig(
+    name="valeu-et",
+    pretty_name="VaLEU-et",
+    source="EuroEval/european-values-et",
     task=EUROPEAN_VALUES,
-    languages=[ET],
+    languages=[ESTONIAN],
     splits=["test"],
     bootstrap_samples=False,
     _instruction_prompt="{text}",
@@ -85,29 +84,28 @@ EUROPEAN_VALUES_ET_CONFIG = DatasetConfig(
 SCALA_ET_CONFIG = DatasetConfig(
     name="scala-et",
-    pretty_name="the Estonian part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-et",
+    pretty_name="ScaLA-et",
+    source="EuroEval/scala-et",
     task=LA,
-    languages=[ET],
+    languages=[ESTONIAN],
     unofficial=True,
 )
 EXAM_ET_CONFIG = DatasetConfig(
     name="exam-et",
-    pretty_name="the Estonian knowledge dataset Exam-et",
-    huggingface_id="EuroEval/exam-et",
+    pretty_name="Exam-et",
+    source="EuroEval/exam-et",
     task=KNOW,
-    languages=[ET],
+    languages=[ESTONIAN],
     _labels=["a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o"],
     unofficial=True,
 )
 MMLU_ET_CONFIG = DatasetConfig(
     name="mmlu-et",
-    pretty_name="the truncated version of the Estonian knowledge dataset MMLU-et, "
-    "translated from the English MMLU dataset",
-    huggingface_id="EuroEval/mmlu-et-mini",
+    pretty_name="MMLU-et",
+    source="EuroEval/mmlu-et-mini",
     task=KNOW,
-    languages=[ET],
+    languages=[ESTONIAN],
     unofficial=True,
 )

euroeval/dataset_configs/faroese.py CHANGED Viewed

@@ -1,102 +1,61 @@
 """All Faroese dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import FO
+from ..languages import FAROESE
 from ..tasks import LA, NER, RC, SENT
 ### Official datasets ###
 FOSENT_CONFIG = DatasetConfig(
     name="fosent",
-    pretty_name="the Faroese sentiment classification dataset FoSent",
-    huggingface_id="EuroEval/fosent",
+    pretty_name="FoSent",
+    source="EuroEval/fosent",
     task=SENT,
-    languages=[FO],
+    languages=[FAROESE],
     _num_few_shot_examples=5,
 )
 SCALA_FO_CONFIG = DatasetConfig(
     name="scala-fo",
-    pretty_name="the Faroese part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-fo",
+    pretty_name="ScaLA-fo",
+    source="EuroEval/scala-fo",
     task=LA,
-    languages=[FO],
+    languages=[FAROESE],
 )
 FONE_CONFIG = DatasetConfig(
     name="fone",
-    pretty_name="the truncated version of the Faroese named entity recognition "
-    "dataset FoNE",
-    huggingface_id="EuroEval/fone-mini",
+    pretty_name="FoNE",
+    source="EuroEval/fone-mini",
     task=NER,
-    languages=[FO],
+    languages=[FAROESE],
 )
 FOQA_CONFIG = DatasetConfig(
     name="foqa",
-    pretty_name="the Faroese reading comprehension dataset FoQA",
-    huggingface_id="EuroEval/foqa",
+    pretty_name="FoQA",
+    source="EuroEval/foqa",
     task=RC,
-    languages=[FO],
+    languages=[FAROESE],
 )
-# TODO: No Faroese version of the European values dataset exists yet
-# EUROPEAN_VALUES_FO_CONFIG = DatasetConfig(
-#     name="european-values-fo",
-#     pretty_name="the Faroese version of the European values evaluation dataset",
-#     huggingface_id="EuroEval/european-values-fo",
-#     task=EUROPEAN_VALUES,
-#     languages=[FO],
-#     splits=["test"],
-#     bootstrap_samples=False,
-#     _instruction_prompt="{text}",
-# )
-#
-# EUROPEAN_VALUES_SITUATIONAL_FO_CONFIG = DatasetConfig(
-#     name="european-values-situational-fo",
-#     pretty_name="the Faroese version of the European values evaluation dataset, "
-#     "where the questions are phrased in a situational way",
-#     huggingface_id="EuroEval/european-values-situational-fo",
-#     task=EUROPEAN_VALUES,
-#     languages=[FO],
-#     splits=["test"],
-#     bootstrap_samples=False,
-#     _instruction_prompt="{text}",
-#     unofficial=True,
-# )
-#
-# EUROPEAN_VALUES_COMPLETIONS_FO_CONFIG = DatasetConfig(
-#     name="european-values-completions-fo",
-#     pretty_name="the Faroese version of the European values evaluation dataset, "
-#     "where the questions are phrased as sentence completions",
-#     huggingface_id="EuroEval/european-values-completions-fo",
-#     task=EUROPEAN_VALUES,
-#     languages=[FO],
-#     splits=["test"],
-#     bootstrap_samples=False,
-#     _instruction_prompt="{text}",
-#     unofficial=True,
-# )
 ### Unofficial datasets ###
 WIKIANN_FO_CONFIG = DatasetConfig(
     name="wikiann-fo",
-    pretty_name="the truncated version of the Faroese part of the named entity "
-    "recognition dataset WikiANN",
-    huggingface_id="EuroEval/wikiann-fo-mini",
+    pretty_name="WikiANN-fo",
+    source="EuroEval/wikiann-fo-mini",
     task=NER,
-    languages=[FO],
+    languages=[FAROESE],
     unofficial=True,
 )
 MULTI_WIKI_QA_FO_CONFIG = DatasetConfig(
     name="multi-wiki-qa-fo",
-    pretty_name="the truncated version of the Faroese part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-fo-mini",
+    pretty_name="MultiWikiQA-fo",
+    source="EuroEval/multi-wiki-qa-fo-mini",
     task=RC,
-    languages=[FO],
+    languages=[FAROESE],
     unofficial=True,
 )

euroeval/dataset_configs/finnish.py CHANGED Viewed

@@ -1,68 +1,66 @@
 """All Finnish dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import FI
+from ..languages import FINNISH
 from ..tasks import COMMON_SENSE, EUROPEAN_VALUES, LA, MCRC, NER, RC, SENT, SUMM
 ### Official datasets ###
 SCANDISENT_FI_CONFIG = DatasetConfig(
     name="scandisent-fi",
-    pretty_name="the truncated version of the Finnish part of the binary sentiment "
-    "classification dataset ScandiSent",
-    huggingface_id="EuroEval/scandisent-fi-mini",
+    pretty_name="ScandiSent-fi",
+    source="EuroEval/scandisent-fi-mini",
     task=SENT,
-    languages=[FI],
+    languages=[FINNISH],
     _labels=["negative", "positive"],
 )
 TURKU_NER_FI_CONFIG = DatasetConfig(
     name="turku-ner-fi",
-    pretty_name="the Finnish part of the named entity recognition dataset Turku NER",
-    huggingface_id="EuroEval/turku-ner-fi-mini",
+    pretty_name="Turku NER-fi",
+    source="EuroEval/turku-ner-fi-mini",
     task=NER,
-    languages=[FI],
+    languages=[FINNISH],
 )
 TYDIQA_FI_CONFIG = DatasetConfig(
     name="tydiqa-fi",
-    pretty_name="the Finnish part of the TydiQA reading comprehension dataset",
-    huggingface_id="EuroEval/tydiqa-fi-mini",
+    pretty_name="TyDiQA-fi",
+    source="EuroEval/tydiqa-fi-mini",
     task=RC,
-    languages=[FI],
+    languages=[FINNISH],
 )
 XLSUM_FI_CONFIG = DatasetConfig(
     name="xlsum-fi",
-    pretty_name="the Finnish summarisation dataset XL-Sum",
-    huggingface_id="EuroEval/xlsum-fi-mini",
+    pretty_name="XLSum-fi",
+    source="EuroEval/xlsum-fi-mini",
     task=SUMM,
-    languages=[FI],
+    languages=[FINNISH],
 )
 HELLASWAG_FI_CONFIG = DatasetConfig(
     name="hellaswag-fi",
-    pretty_name="the truncated version of the Finnish common-sense reasoning dataset "
-    "HellaSwag-fi, translated from the English HellaSwag dataset",
-    huggingface_id="EuroEval/hellaswag-fi-mini",
+    pretty_name="HellaSwag-fi",
+    source="EuroEval/hellaswag-fi-mini",
     task=COMMON_SENSE,
-    languages=[FI],
+    languages=[FINNISH],
 )
 SCALA_FI_CONFIG = DatasetConfig(
     name="scala-fi",
-    pretty_name="the Finnish part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-fi",
+    pretty_name="ScaLA-fi",
+    source="EuroEval/scala-fi",
     task=LA,
-    languages=[FI],
+    languages=[FINNISH],
 )
-EUROPEAN_VALUES_FI_CONFIG = DatasetConfig(
-    name="european-values-fi",
-    pretty_name="the Finnish version of the European values evaluation dataset",
-    huggingface_id="EuroEval/european-values-fi",
+VALEU_FI_CONFIG = DatasetConfig(
+    name="valeu-fi",
+    pretty_name="VaLEU-fi",
+    source="EuroEval/european-values-fi",
     task=EUROPEAN_VALUES,
-    languages=[FI],
+    languages=[FINNISH],
     splits=["test"],
     bootstrap_samples=False,
     _instruction_prompt="{text}",
@@ -73,67 +71,37 @@ EUROPEAN_VALUES_FI_CONFIG = DatasetConfig(
 BELEBELE_FI_CONFIG = DatasetConfig(
     name="belebele-fi",
-    pretty_name="the Finnish multiple choice reading comprehension dataset "
-    "BeleBele-fi, translated from the English BeleBele dataset",
-    huggingface_id="EuroEval/belebele-fi-mini",
+    pretty_name="Belebele-fi",
+    source="EuroEval/belebele-fi-mini",
     task=MCRC,
-    languages=[FI],
+    languages=[FINNISH],
     unofficial=True,
 )
 MULTI_WIKI_QA_FI_CONFIG = DatasetConfig(
     name="multi-wiki-qa-fi",
-    pretty_name="the truncated version of the Finnish part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-fi-mini",
+    pretty_name="MultiWikiQA-fi",
+    source="EuroEval/multi-wiki-qa-fi-mini",
     task=RC,
-    languages=[FI],
+    languages=[FINNISH],
     unofficial=True,
 )
 GOLDENSWAG_FI_CONFIG = DatasetConfig(
     name="goldenswag-fi",
-    pretty_name="the truncated version of the Finnish common-sense reasoning "
-    "dataset GoldenSwag-fi, translated from the English GoldenSwag dataset",
-    huggingface_id="EuroEval/goldenswag-fi-mini",
+    pretty_name="GoldenSwag-fi",
+    source="EuroEval/goldenswag-fi-mini",
     task=COMMON_SENSE,
-    languages=[FI],
+    languages=[FINNISH],
     unofficial=True,
 )
 WINOGRANDE_FI_CONFIG = DatasetConfig(
     name="winogrande-fi",
-    pretty_name="the Finnish common-sense reasoning dataset Winogrande-fi, translated "
-    "from the English Winogrande dataset",
-    huggingface_id="EuroEval/winogrande-fi",
+    pretty_name="Winogrande-fi",
+    source="EuroEval/winogrande-fi",
     task=COMMON_SENSE,
-    languages=[FI],
+    languages=[FINNISH],
     _labels=["a", "b"],
     unofficial=True,
 )
-EUROPEAN_VALUES_SITUATIONAL_FI_CONFIG = DatasetConfig(
-    name="european-values-situational-fi",
-    pretty_name="the Finnish version of the European values evaluation dataset, where "
-    "the questions are phrased in a situational way",
-    huggingface_id="EuroEval/european-values-situational-fi",
-    task=EUROPEAN_VALUES,
-    languages=[FI],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)
-EUROPEAN_VALUES_COMPLETIONS_FI_CONFIG = DatasetConfig(
-    name="european-values-completions-fi",
-    pretty_name="the Finnish version of the European values evaluation dataset, where "
-    "the questions are phrased as sentence completions",
-    huggingface_id="EuroEval/european-values-completions-fi",
-    task=EUROPEAN_VALUES,
-    languages=[FI],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)

EuroEval 16.4.0__py3-none-any.whl → 16.5.0__py3-none-any.whl

Potentially problematic release.

EuroEval 16.4.0py3-none-any.whl → 16.5.0py3-none-any.whl