PyPI - EuroEval - Versions diffs - 16.4.0__py3-none-any.whl → 16.5.0__py3-none-any.whl - Mend

EuroEval 16.4.0py3-none-any.whl → 16.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of EuroEval might be problematic. Click here for more details.

Files changed (71) hide show

euroeval/__init__.py +6 -0
euroeval/benchmark_config_factory.py +51 -46
euroeval/benchmark_modules/base.py +6 -5
euroeval/benchmark_modules/hf.py +2 -9
euroeval/benchmark_modules/litellm.py +14 -12
euroeval/benchmark_modules/vllm.py +17 -10
euroeval/benchmarker.py +61 -44
euroeval/caching_utils.py +1 -1
euroeval/cli.py +86 -8
euroeval/constants.py +3 -0
euroeval/data_loading.py +78 -30
euroeval/data_models.py +326 -326
euroeval/dataset_configs/__init__.py +10 -3
euroeval/dataset_configs/bulgarian.py +56 -0
euroeval/dataset_configs/czech.py +25 -29
euroeval/dataset_configs/danish.py +51 -88
euroeval/dataset_configs/dutch.py +48 -86
euroeval/dataset_configs/english.py +45 -76
euroeval/dataset_configs/estonian.py +36 -38
euroeval/dataset_configs/faroese.py +19 -60
euroeval/dataset_configs/finnish.py +36 -68
euroeval/dataset_configs/french.py +39 -74
euroeval/dataset_configs/german.py +45 -81
euroeval/dataset_configs/greek.py +64 -0
euroeval/dataset_configs/icelandic.py +54 -91
euroeval/dataset_configs/italian.py +42 -78
euroeval/dataset_configs/latvian.py +28 -34
euroeval/dataset_configs/lithuanian.py +22 -26
euroeval/dataset_configs/norwegian.py +72 -114
euroeval/dataset_configs/polish.py +33 -60
euroeval/dataset_configs/portuguese.py +33 -65
euroeval/dataset_configs/serbian.py +64 -0
euroeval/dataset_configs/slovak.py +19 -24
euroeval/dataset_configs/spanish.py +42 -76
euroeval/dataset_configs/swedish.py +48 -84
euroeval/dataset_configs/ukrainian.py +64 -0
euroeval/exceptions.py +1 -1
euroeval/finetuning.py +3 -2
euroeval/generation.py +5 -4
euroeval/generation_utils.py +6 -5
euroeval/languages.py +395 -323
euroeval/metrics/huggingface.py +14 -3
euroeval/metrics/llm_as_a_judge.py +1 -1
euroeval/model_cache.py +6 -5
euroeval/model_loading.py +1 -1
euroeval/prompt_templates/__init__.py +2 -0
euroeval/prompt_templates/classification.py +206 -0
euroeval/prompt_templates/linguistic_acceptability.py +82 -43
euroeval/prompt_templates/multiple_choice.py +81 -41
euroeval/prompt_templates/named_entity_recognition.py +125 -44
euroeval/prompt_templates/reading_comprehension.py +92 -43
euroeval/prompt_templates/sentiment_classification.py +91 -43
euroeval/prompt_templates/summarization.py +64 -39
euroeval/prompt_templates/token_classification.py +279 -0
euroeval/scores.py +4 -3
euroeval/speed_benchmark.py +2 -1
euroeval/task_group_utils/multiple_choice_classification.py +2 -1
euroeval/task_group_utils/question_answering.py +24 -13
euroeval/task_group_utils/sequence_classification.py +5 -4
euroeval/task_group_utils/text_to_text.py +2 -1
euroeval/task_group_utils/token_classification.py +11 -8
euroeval/tasks.py +44 -1
euroeval/tokenisation_utils.py +19 -10
euroeval/types.py +10 -9
euroeval/utils.py +6 -3
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/METADATA +194 -37
euroeval-16.5.0.dist-info/RECORD +81 -0
euroeval-16.4.0.dist-info/RECORD +0 -75
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/WHEEL +0 -0
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/entry_points.txt +0 -0
{euroeval-16.4.0.dist-info → euroeval-16.5.0.dist-info}/licenses/LICENSE +0 -0

euroeval/dataset_configs/icelandic.py CHANGED Viewed

@@ -1,80 +1,74 @@
 """All Icelandic dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import IS
+from ..languages import ICELANDIC
 from ..tasks import COMMON_SENSE, EUROPEAN_VALUES, KNOW, LA, MCRC, NER, RC, SENT, SUMM
 ### Official datasets ###
 HOTTER_AND_COLDER_SENTIMENT_CONFIG = DatasetConfig(
     name="hotter-and-colder-sentiment",
-    pretty_name="the sentiment classification part of the Icelandic dataset Hotter "
-    "and Colder",
-    huggingface_id="EuroEval/hotter-and-colder-sentiment",
+    pretty_name="Hotter and Colder Sentiment",
+    source="EuroEval/hotter-and-colder-sentiment",
     task=SENT,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 SCALA_IS_CONFIG = DatasetConfig(
     name="scala-is",
-    pretty_name="the Icelandic part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-is",
+    pretty_name="ScaLA-is",
+    source="EuroEval/scala-is",
     task=LA,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 MIM_GOLD_NER_CONFIG = DatasetConfig(
     name="mim-gold-ner",
-    pretty_name="the truncated version of the Icelandic named entity recognition "
-    "dataset MIM-GOLD-NER",
-    huggingface_id="EuroEval/mim-gold-ner-mini",
+    pretty_name="MIM-GOLD-NER",
+    source="EuroEval/mim-gold-ner-mini",
     task=NER,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 NQII_CONFIG = DatasetConfig(
     name="nqii",
-    pretty_name="the truncated version of the Icelandic reading comprehension dataset "
-    "Natural Questions in Icelandic",
-    huggingface_id="EuroEval/nqii-mini",
+    pretty_name="NQiI",
+    source="EuroEval/nqii-mini",
     task=RC,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 RRN_CONFIG = DatasetConfig(
     name="rrn",
-    pretty_name="the truncated version of the Icelandic summarisation dataset "
-    "RÚV Radio News",
-    huggingface_id="EuroEval/rrn-mini",
+    pretty_name="RRN",
+    source="EuroEval/rrn-mini",
     task=SUMM,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 ICELANDIC_KNOWLEDGE_CONFIG = DatasetConfig(
     name="icelandic-knowledge",
-    pretty_name="the Icelandic knowledge dataset IcelandicKnowledge, derived from the "
-    "IcelandicQA dataset",
-    huggingface_id="EuroEval/icelandic-knowledge",
+    pretty_name="Icelandic Knowledge",
+    source="EuroEval/icelandic-knowledge",
     task=KNOW,
-    languages=[IS],
+    languages=[ICELANDIC],
 )
 WINOGRANDE_IS_CONFIG = DatasetConfig(
     name="winogrande-is",
-    pretty_name="the Icelandic common-sense reasoning dataset "
-    "Winogrande-is, manually translated from the English Winogrande dataset",
-    huggingface_id="EuroEval/winogrande-is",
+    pretty_name="Winogrande-is",
+    source="EuroEval/winogrande-is",
     task=COMMON_SENSE,
-    languages=[IS],
+    languages=[ICELANDIC],
     _labels=["a", "b"],
 )
-EUROPEAN_VALUES_IS_CONFIG = DatasetConfig(
-    name="european-values-is",
-    pretty_name="the Icelandic version of the European values evaluation dataset",
-    huggingface_id="EuroEval/european-values-is",
+VALEU_IS_CONFIG = DatasetConfig(
+    name="valeu-is",
+    pretty_name="VaLEU-is",
+    source="EuroEval/european-values-is",
     task=EUROPEAN_VALUES,
-    languages=[IS],
+    languages=[ICELANDIC],
     splits=["test"],
     bootstrap_samples=False,
     _instruction_prompt="{text}",
@@ -85,112 +79,81 @@ EUROPEAN_VALUES_IS_CONFIG = DatasetConfig(
 ICE_EC_CONFIG = DatasetConfig(
     name="ice-ec",
-    pretty_name="the truncated version of the Icelandic Error Corpus",
-    huggingface_id="EuroEval/ice-ec",
+    pretty_name="ICE-EC",
+    source="EuroEval/ice-ec",
     task=LA,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 ICE_EC_FULL_CONFIG = DatasetConfig(
     name="ice-ec-full",
-    pretty_name="the Icelandic Error Corpus",
-    huggingface_id="EuroEval/ice-ec-full",
+    pretty_name="ICE-EC Full",
+    source="EuroEval/ice-ec-full",
     task=LA,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 ICE_LINGUISTIC_CONFIG = DatasetConfig(
     name="ice-linguistic",
-    pretty_name="the Icelandic linguistic acceptability dataset IceLinguistic",
-    huggingface_id="EuroEval/ice-linguistic",
+    pretty_name="IceLinguistic",
+    source="EuroEval/ice-linguistic",
     task=LA,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 ICELANDIC_QA_CONFIG = DatasetConfig(
     name="icelandic-qa",
-    pretty_name="the Icelandic reading comprehension dataset IcelandicQA",
-    huggingface_id="EuroEval/icelandic-qa",
+    pretty_name="Icelandic QA",
+    source="EuroEval/icelandic-qa",
     task=RC,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 MMLU_IS_CONFIG = DatasetConfig(
     name="mmlu-is",
-    pretty_name="the truncated version of the Icelandic knowledge dataset MMLU-is, "
-    "translated from the English MMLU dataset",
-    huggingface_id="EuroEval/mmlu-is-mini",
+    pretty_name="MMLU-is",
+    source="EuroEval/mmlu-is-mini",
     task=KNOW,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 ARC_IS_CONFIG = DatasetConfig(
     name="arc-is",
-    pretty_name="the truncated version of the Icelandic knowledge dataset ARC-is, "
-    "translated from the English ARC dataset",
-    huggingface_id="EuroEval/arc-is-mini",
+    pretty_name="ARC-is",
+    source="EuroEval/arc-is-mini",
     task=KNOW,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 HELLASWAG_IS_CONFIG = DatasetConfig(
     name="hellaswag-is",
-    pretty_name="the truncated version of the Icelandic common-sense reasoning dataset "
-    "HellaSwag-is, translated from the English HellaSwag dataset",
-    huggingface_id="EuroEval/hellaswag-is-mini",
+    pretty_name="HellaSwag-is",
+    source="EuroEval/hellaswag-is-mini",
     task=COMMON_SENSE,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 BELEBELE_IS_CONFIG = DatasetConfig(
     name="belebele-is",
-    pretty_name="the Icelandic multiple choice reading comprehension dataset "
-    "BeleBele-is, translated from the English BeleBele dataset",
-    huggingface_id="EuroEval/belebele-is-mini",
+    pretty_name="Belebele-is",
+    source="EuroEval/belebele-is-mini",
     task=MCRC,
-    languages=[IS],
+    languages=[ICELANDIC],
     unofficial=True,
 )
 MULTI_WIKI_QA_IS_CONFIG = DatasetConfig(
     name="multi-wiki-qa-is",
-    pretty_name="the truncated version of the Icelandic part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-is-mini",
+    pretty_name="MultiWikiQA-is",
+    source="EuroEval/multi-wiki-qa-is-mini",
     task=RC,
-    languages=[IS],
-    unofficial=True,
-)
-EUROPEAN_VALUES_SITUATIONAL_IS_CONFIG = DatasetConfig(
-    name="european-values-situational-is",
-    pretty_name="the Icelandic version of the European values evaluation dataset, "
-    "where the questions are phrased in a situational way",
-    huggingface_id="EuroEval/european-values-situational-is",
-    task=EUROPEAN_VALUES,
-    languages=[IS],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)
-EUROPEAN_VALUES_COMPLETIONS_IS_CONFIG = DatasetConfig(
-    name="european-values-completions-is",
-    pretty_name="the Icelandic version of the European values evaluation dataset, "
-    "where the questions are phrased as sentence completions",
-    huggingface_id="EuroEval/european-values-completions-is",
-    task=EUROPEAN_VALUES,
-    languages=[IS],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
+    languages=[ICELANDIC],
     unofficial=True,
 )

euroeval/dataset_configs/italian.py CHANGED Viewed

@@ -1,78 +1,73 @@
 """All Italian dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import IT
+from ..languages import ITALIAN
 from ..tasks import COMMON_SENSE, EUROPEAN_VALUES, KNOW, LA, MCRC, NER, RC, SENT, SUMM
 ### Official datasets ###
 SENTIPOLC_CONFIG = DatasetConfig(
     name="sentipolc16",
-    pretty_name="the truncated version of the Italian sentiment classification "
-    "dataset Sentipolc-16",
-    huggingface_id="EuroEval/sentipolc16-mini",
+    pretty_name="Sentipolc16",
+    source="EuroEval/sentipolc16-mini",
     task=SENT,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 SCALA_IT_CONFIG = DatasetConfig(
     name="scala-it",
-    pretty_name="the Italian part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-it",
+    pretty_name="ScaLA-it",
+    source="EuroEval/scala-it",
     task=LA,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 MULTINERD_IT_CONFIG = DatasetConfig(
     name="multinerd-it",
-    pretty_name="the truncated version of the Italian part of the named "
-    "entity recognition dataset MultiNERD",
-    huggingface_id="EuroEval/multinerd-mini-it",
+    pretty_name="MultiNERD-it",
+    source="EuroEval/multinerd-mini-it",
     task=NER,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 SQUAD_IT_CONFIG = DatasetConfig(
     name="squad-it",
-    pretty_name="the truncated version of the Italian reading comprehension dataset "
-    "SQuAD-it, translated from the English SQuAD dataset",
-    huggingface_id="EuroEval/squad-it-mini",
+    pretty_name="SQuAD-it",
+    source="EuroEval/squad-it-mini",
     task=RC,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 ILPOST_SUM_CONFIG = DatasetConfig(
     name="ilpost-sum",
-    pretty_name="the truncated version of the Italian summarisation dataset IlPost-Sum",
-    huggingface_id="EuroEval/ilpost-sum",
+    pretty_name="IlPost-Sum",
+    source="EuroEval/ilpost-sum",
     task=SUMM,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 MMLU_IT_CONFIG = DatasetConfig(
     name="mmlu-it",
-    pretty_name="the truncated version of the Italian knowledge dataset MMLU-it, "
-    "translated from the English MMLU dataset",
-    huggingface_id="EuroEval/mmlu-it-mini",
+    pretty_name="MMLU-it",
+    source="EuroEval/mmlu-it-mini",
     task=KNOW,
-    languages=[IT],
+    languages=[ITALIAN],
 )
 HELLASWAG_IT_CONFIG = DatasetConfig(
     name="hellaswag-it",
-    pretty_name="the truncated version of the Italian common-sense reasoning dataset "
-    "HellaSwag-it, translated from the English HellaSwag dataset",
-    huggingface_id="EuroEval/hellaswag-it-mini",
+    pretty_name="HellaSwag-it",
+    source="EuroEval/hellaswag-it-mini",
     task=COMMON_SENSE,
-    languages=[IT],
+    languages=[ITALIAN],
 )
-EUROPEAN_VALUES_IT_CONFIG = DatasetConfig(
-    name="european-values-it",
-    pretty_name="the Italian version of the European values evaluation dataset",
-    huggingface_id="EuroEval/european-values-it",
+VALEU_IT_CONFIG = DatasetConfig(
+    name="valeu-it",
+    pretty_name="VaLEU-it",
+    source="EuroEval/european-values-it",
     task=EUROPEAN_VALUES,
-    languages=[IT],
+    languages=[ITALIAN],
     splits=["test"],
     bootstrap_samples=False,
     _instruction_prompt="{text}",
@@ -83,77 +78,46 @@ EUROPEAN_VALUES_IT_CONFIG = DatasetConfig(
 WIKINEURAL_IT_CONFIG = DatasetConfig(
     name="wikineural-it",
-    pretty_name="the truncated version of the Italian named "
-    "entity recognition dataset WikiNEuRal IT",
-    huggingface_id="EuroEval/wikineural-mini-it",
+    pretty_name="WikiNeural-it",
+    source="EuroEval/wikineural-mini-it",
     task=NER,
-    languages=[IT],
+    languages=[ITALIAN],
     unofficial=True,
 )
 BELEBELE_IT_CONFIG = DatasetConfig(
     name="belebele-it",
-    pretty_name="the Italian multiple choice reading comprehension dataset "
-    "BeleBele-it, translated from the English BeleBele dataset",
-    huggingface_id="EuroEval/belebele-it-mini",
+    pretty_name="Belebele-it",
+    source="EuroEval/belebele-it-mini",
     task=MCRC,
-    languages=[IT],
+    languages=[ITALIAN],
     unofficial=True,
 )
 MULTI_WIKI_QA_IT_CONFIG = DatasetConfig(
     name="multi-wiki-qa-it",
-    pretty_name="the truncated version of the Italian part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-it-mini",
+    pretty_name="MultiWikiQA-it",
+    source="EuroEval/multi-wiki-qa-it-mini",
     task=RC,
-    languages=[IT],
+    languages=[ITALIAN],
     unofficial=True,
 )
 GOLDENSWAG_IT_CONFIG = DatasetConfig(
     name="goldenswag-it",
-    pretty_name="the truncated version of the Italian common-sense reasoning "
-    "dataset GoldenSwag-it, translated from the English GoldenSwag dataset",
-    huggingface_id="EuroEval/goldenswag-it-mini",
+    pretty_name="GoldenSwag-it",
+    source="EuroEval/goldenswag-it-mini",
     task=COMMON_SENSE,
-    languages=[IT],
+    languages=[ITALIAN],
     unofficial=True,
 )
 WINOGRANDE_IT_CONFIG = DatasetConfig(
     name="winogrande-it",
-    pretty_name="the Italian common-sense reasoning dataset Winogrande-it, translated "
-    "from the English Winogrande dataset",
-    huggingface_id="EuroEval/winogrande-it",
+    pretty_name="Winogrande-it",
+    source="EuroEval/winogrande-it",
     task=COMMON_SENSE,
-    languages=[IT],
+    languages=[ITALIAN],
     _labels=["a", "b"],
     unofficial=True,
 )
-EUROPEAN_VALUES_SITUATIONAL_IT_CONFIG = DatasetConfig(
-    name="european-values-situational-it",
-    pretty_name="the Italian version of the European values evaluation dataset, "
-    "where the questions are phrased in a situational way",
-    huggingface_id="EuroEval/european-values-situational-it",
-    task=EUROPEAN_VALUES,
-    languages=[IT],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)
-EUROPEAN_VALUES_COMPLETIONS_IT_CONFIG = DatasetConfig(
-    name="european-values-completions-it",
-    pretty_name="the Italian version of the European values evaluation dataset, where "
-    "the questions are phrased as sentence completions",
-    huggingface_id="EuroEval/european-values-completions-it",
-    task=EUROPEAN_VALUES,
-    languages=[IT],
-    splits=["test"],
-    bootstrap_samples=False,
-    _instruction_prompt="{text}",
-    unofficial=True,
-)

euroeval/dataset_configs/latvian.py CHANGED Viewed

@@ -1,70 +1,66 @@
 """All Latvian dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import LV
+from ..languages import LATVIAN
 from ..tasks import COMMON_SENSE, KNOW, LA, NER, RC, SENT, SUMM
 ### Official datasets ###
 LATVIAN_TWITTER_SENTIMENT_CONFIG = DatasetConfig(
     name="latvian-twitter-sentiment",
-    pretty_name="the truncated version of the Latvian sentiment classification dataset",
-    huggingface_id="EuroEval/latvian-twitter-sentiment-mini",
+    pretty_name="Latvian Twitter Sentiment",
+    source="EuroEval/latvian-twitter-sentiment-mini",
     task=SENT,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 SCALA_LV_CONFIG = DatasetConfig(
     name="scala-lv",
-    pretty_name="the Latvian part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-lv",
+    pretty_name="ScaLA-lv",
+    source="EuroEval/scala-lv",
     task=LA,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 FULLSTACK_NER_LV_CONFIG = DatasetConfig(
     name="fullstack-ner-lv",
-    pretty_name="the truncated version of the Latvian named entity recognition "
-    "dataset FullStack-NER-lv",
-    huggingface_id="EuroEval/fullstack-ner-lv-mini",
+    pretty_name="FullStack NER-lv",
+    source="EuroEval/fullstack-ner-lv-mini",
     task=NER,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 MULTI_WIKI_QA_LV_CONFIG = DatasetConfig(
     name="multi-wiki-qa-lv",
-    pretty_name="the truncated version of the Latvian part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-lv-mini",
+    pretty_name="MultiWikiQA-lv",
+    source="EuroEval/multi-wiki-qa-lv-mini",
     task=RC,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 LSM_CONFIG = DatasetConfig(
     name="lsm",
-    pretty_name="the truncated version of the Latvian summarisation dataset LSM",
-    huggingface_id="EuroEval/lsm-mini",
+    pretty_name="LSM",
+    source="EuroEval/lsm-mini",
     task=SUMM,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 MMLU_LV_CONFIG = DatasetConfig(
     name="mmlu-lv",
-    pretty_name="the truncated version of the Latvian knowledge dataset MMLU-lv, "
-    "translated from the English MMLU dataset",
-    huggingface_id="EuroEval/mmlu-lv-mini",
+    pretty_name="MMLU-lv",
+    source="EuroEval/mmlu-lv-mini",
     task=KNOW,
-    languages=[LV],
+    languages=[LATVIAN],
 )
 COPA_LV_CONFIG = DatasetConfig(
     name="copa-lv",
-    pretty_name="the Latvian common-sense reasoning dataset COPA-lv, translated from "
-    "the English COPA dataset",
-    huggingface_id="EuroEval/copa-lv",
+    pretty_name="COPA-lv",
+    source="EuroEval/copa-lv",
     task=COMMON_SENSE,
-    languages=[LV],
+    languages=[LATVIAN],
     _labels=["a", "b"],
 )
@@ -73,21 +69,19 @@ COPA_LV_CONFIG = DatasetConfig(
 WIKIANN_LV_CONFIG = DatasetConfig(
     name="wikiann-lv",
-    pretty_name="the truncated version of the Latvian part of the named entity "
-    "recognition dataset WikiANN",
-    huggingface_id="EuroEval/wikiann-lv-mini",
+    pretty_name="WikiANN-lv",
+    source="EuroEval/wikiann-lv-mini",
     task=NER,
-    languages=[LV],
+    languages=[LATVIAN],
     unofficial=True,
 )
 WINOGRANDE_LV_CONFIG = DatasetConfig(
     name="winogrande-lv",
-    pretty_name="the Latvian common-sense reasoning dataset Winogrande-lv, translated "
-    "from the English Winogrande dataset",
-    huggingface_id="EuroEval/winogrande-lv",
+    pretty_name="Winogrande-lv",
+    source="EuroEval/winogrande-lv",
     task=COMMON_SENSE,
-    languages=[LV],
+    languages=[LATVIAN],
     _labels=["a", "b"],
     unofficial=True,
 )

euroeval/dataset_configs/lithuanian.py CHANGED Viewed

@@ -1,68 +1,64 @@
 """All Lithuanian dataset configurations used in EuroEval."""
 from ..data_models import DatasetConfig
-from ..languages import LT
+from ..languages import LITHUANIAN
 from ..tasks import COMMON_SENSE, KNOW, LA, NER, RC, SENT, SUMM
 ### Official datasets ###
 LITHUANIAN_EMOTIONS_CONFIG = DatasetConfig(
     name="lithuanian-emotions",
-    pretty_name="the truncated version of the Lithuanian sentiment "
-    "classification dataset Lithuanian Emotions",
-    huggingface_id="EuroEval/lithuanian-emotions-mini",
+    pretty_name="Lithuanian Emotions",
+    source="EuroEval/lithuanian-emotions-mini",
     task=SENT,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 SCALA_LT_CONFIG = DatasetConfig(
     name="scala-lt",
-    pretty_name="the Lithuanian part of the linguistic acceptability dataset ScaLA",
-    huggingface_id="EuroEval/scala-lt",
+    pretty_name="ScaLA-lt",
+    source="EuroEval/scala-lt",
     task=LA,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 WIKIANN_LT_CONFIG = DatasetConfig(
     name="wikiann-lt",
-    pretty_name="the truncated version of the Lithuanian part of the named entity "
-    "recognition dataset WikiANN",
-    huggingface_id="EuroEval/wikiann-lt-mini",
+    pretty_name="WikiANN-lt",
+    source="EuroEval/wikiann-lt-mini",
     task=NER,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 MULTI_WIKI_QA_LT_CONFIG = DatasetConfig(
     name="multi-wiki-qa-lt",
-    pretty_name="the truncated version of the Lithuanian part of the reading "
-    "comprehension dataset MultiWikiQA",
-    huggingface_id="EuroEval/multi-wiki-qa-lt-mini",
+    pretty_name="MultiWikiQA-lt",
+    source="EuroEval/multi-wiki-qa-lt-mini",
     task=RC,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 LRYTAS_CONFIG = DatasetConfig(
     name="lrytas",
-    pretty_name="the truncated version of the Lithuanian summarisation dataset Lrytas",
-    huggingface_id="EuroEval/lrytas-mini",
+    pretty_name="Lrytas",
+    source="EuroEval/lrytas-mini",
     task=SUMM,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 LT_HISTORY_CONFIG = DatasetConfig(
     name="lt-history",
-    pretty_name="the Lithuanian knowledge dataset LT-History",
-    huggingface_id="EuroEval/lt-history",
+    pretty_name="LT-History",
+    source="EuroEval/lt-history",
     task=KNOW,
-    languages=[LT],
+    languages=[LITHUANIAN],
 )
 WINOGRANDE_LT_CONFIG = DatasetConfig(
     name="winogrande-lt",
-    pretty_name="the Lithuanian common-sense reasoning dataset Winogrande-lt, "
-    "translated from the English Winogrande dataset",
-    huggingface_id="EuroEval/winogrande-lt",
+    pretty_name="Winogrande-lt",
+    source="EuroEval/winogrande-lt",
     task=COMMON_SENSE,
-    languages=[LT],
+    languages=[LITHUANIAN],
     _labels=["a", "b"],
 )

EuroEval 16.4.0__py3-none-any.whl → 16.5.0__py3-none-any.whl

Potentially problematic release.

EuroEval 16.4.0py3-none-any.whl → 16.5.0py3-none-any.whl