PyPI - evalscope - Versions diffs - 0.5.4__tar.gz → 0.5.5rc1__tar.gz - Mend

evalscope 0.5.4tar.gz → 0.5.5rc1tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of evalscope might be problematic. Click here for more details.

Files changed (186) hide show

{evalscope-0.5.4 → evalscope-0.5.5rc1}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: evalscope
-Version: 0.5.4
+Version: 0.5.5rc1
 Summary: EvalScope: Lightweight LLMs Evaluation Framework
 Home-page: https://github.com/modelscope/evalscope
 Author: ModelScope team
@@ -48,7 +48,7 @@ Requires-Dist: transformers_stream_generator
 Requires-Dist: jieba
 Requires-Dist: rouge-chinese
 Provides-Extra: opencompass
-Requires-Dist: ms-opencompass>=0.1.0; extra == "opencompass"
+Requires-Dist: ms-opencompass>=0.1.1; extra == "opencompass"
 Provides-Extra: vlmeval
 Requires-Dist: ms-vlmeval>=0.0.5; extra == "vlmeval"
 Provides-Extra: inner
@@ -111,7 +111,7 @@ Requires-Dist: transformers>=4.33; extra == "all"
 Requires-Dist: transformers_stream_generator; extra == "all"
 Requires-Dist: jieba; extra == "all"
 Requires-Dist: rouge-chinese; extra == "all"
-Requires-Dist: ms-opencompass>=0.1.0; extra == "all"
+Requires-Dist: ms-opencompass>=0.1.1; extra == "all"
 Requires-Dist: ms-vlmeval>=0.0.5; extra == "all"
 English | [简体中文](README_zh.md)

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/tasks/eval_datasets.py RENAMED Viewed

@@ -7,7 +7,7 @@ with read_base():
     from opencompass.configs.datasets.agieval.agieval_gen_64afd3 import agieval_datasets
     from opencompass.configs.datasets.GaokaoBench.GaokaoBench_gen_5cfe9e import GaokaoBench_datasets
     from opencompass.configs.datasets.humaneval.humaneval_gen_8e312c import humaneval_datasets
-    from opencompass.configs.datasets.mbpp.deprecated_mbpp_gen_1e1056 import mbpp_datasets
+    from opencompass.configs.datasets.mbpp.mbpp_gen_830460 import mbpp_datasets
     from opencompass.configs.datasets.CLUE_C3.CLUE_C3_gen_8c358f import C3_datasets
     from opencompass.configs.datasets.CLUE_CMRC.CLUE_CMRC_gen_1bd3c8 import CMRC_datasets
     from opencompass.configs.datasets.CLUE_DRCD.CLUE_DRCD_gen_1bd3c8 import DRCD_datasets
@@ -45,7 +45,7 @@ with read_base():
     from opencompass.configs.datasets.piqa.piqa_gen_1194eb import piqa_datasets
     from opencompass.configs.datasets.siqa.siqa_gen_e78df3 import siqa_datasets
     from opencompass.configs.datasets.strategyqa.strategyqa_gen_1180a7 import strategyqa_datasets
-    from opencompass.configs.datasets.winogrande.deprecated_winogrande_gen_a9ede5 import winogrande_datasets
+    from opencompass.configs.datasets.winogrande.winogrande_gen_458220 import winogrande_datasets
     from opencompass.configs.datasets.obqa.obqa_gen_9069e4 import obqa_datasets
     from opencompass.configs.datasets.nq.nq_gen_c788f6 import nq_datasets
     from opencompass.configs.datasets.triviaqa.triviaqa_gen_2121ce import triviaqa_datasets

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/bundled_rouge_score/rouge_scorer.py RENAMED Viewed

@@ -31,6 +31,7 @@ In these examples settings.xml lists input files and formats.
 from __future__ import absolute_import, division, print_function
 import collections
 import re
+import os
 import nltk
 import numpy as np
@@ -38,6 +39,24 @@ import six
 from absl import logging
 from rouge_score import scoring, tokenizers
 from six.moves import map, range
+from evalscope.utils import get_logger
+logger = get_logger()
+# Deal with nltk punkt_tab.zip tokenizer file to avoid downloading issue
+try:
+    nltk_dir = os.path.join(os.path.expanduser('~'), 'nltk_data/tokenizers')
+    os.makedirs(nltk_dir, exist_ok=True)
+    punkt_path = os.path.join(nltk_dir, 'punkt_tab.zip')
+    punkt_tab_url = 'https://modelscope-open.oss-cn-hangzhou.aliyuncs.com/open_data/nltk_data/punkt_tab.zip'
+    if not os.path.exists(punkt_path):
+        os.system(f'wget -P {nltk_dir} {punkt_tab_url}')
+        os.system(f'unzip {punkt_path} -d {nltk_dir}')
+    else:
+        logger.info(f'{punkt_path} already exists, skipping download')
+except Exception as e:
+    logger.error(f'Try to download punkt_tab.zip for nltk failed: {e}')
 class RougeScorer(scoring.BaseScorer):

evalscope-0.5.5rc1/evalscope/version.py ADDED Viewed

@@ -0,0 +1,4 @@
+# Copyright (c) Alibaba, Inc. and its affiliates.
+__version__ = '0.5.5rc1'
+__release_datetime__ = '2024-09-29 08:00:00'

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: evalscope
-Version: 0.5.4
+Version: 0.5.5rc1
 Summary: EvalScope: Lightweight LLMs Evaluation Framework
 Home-page: https://github.com/modelscope/evalscope
 Author: ModelScope team
@@ -48,7 +48,7 @@ Requires-Dist: transformers_stream_generator
 Requires-Dist: jieba
 Requires-Dist: rouge-chinese
 Provides-Extra: opencompass
-Requires-Dist: ms-opencompass>=0.1.0; extra == "opencompass"
+Requires-Dist: ms-opencompass>=0.1.1; extra == "opencompass"
 Provides-Extra: vlmeval
 Requires-Dist: ms-vlmeval>=0.0.5; extra == "vlmeval"
 Provides-Extra: inner
@@ -111,7 +111,7 @@ Requires-Dist: transformers>=4.33; extra == "all"
 Requires-Dist: transformers_stream_generator; extra == "all"
 Requires-Dist: jieba; extra == "all"
 Requires-Dist: rouge-chinese; extra == "all"
-Requires-Dist: ms-opencompass>=0.1.0; extra == "all"
+Requires-Dist: ms-opencompass>=0.1.1; extra == "all"
 Requires-Dist: ms-vlmeval>=0.0.5; extra == "all"
 English | [简体中文](README_zh.md)

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/requires.txt RENAMED Viewed

@@ -64,7 +64,7 @@ transformers>=4.33
 transformers_stream_generator
 jieba
 rouge-chinese
-ms-opencompass>=0.1.0
+ms-opencompass>=0.1.1
 ms-vlmeval>=0.0.5
 [inner]
@@ -95,7 +95,7 @@ transformers<4.43,>=4.33
 transformers_stream_generator
 [opencompass]
-ms-opencompass>=0.1.0
+ms-opencompass>=0.1.1
 [vlmeval]
 ms-vlmeval>=0.0.5

evalscope-0.5.4/evalscope/version.py DELETED Viewed

@@ -1,4 +0,0 @@
-# Copyright (c) Alibaba, Inc. and its affiliates.
-__version__ = '0.5.4'
-__release_datetime__ = '2024-09-19 08:00:00'

{evalscope-0.5.4 → evalscope-0.5.5rc1}/README.md RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/base.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/api_meta_template.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/backend_manager.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/tasks/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/opencompass/tasks/eval_api.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/vlm_eval_kit/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/vlm_eval_kit/backend_manager.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/backend/vlm_eval_kit/custom_dataset.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/arc/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/arc/ai2_arc.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/arc/arc_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/bbh_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/boolean_expressions.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/causal_judgement.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/date_understanding.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/disambiguation_qa.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/dyck_languages.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/formal_fallacies.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/geometric_shapes.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/hyperbaton.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/logical_deduction_five_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/logical_deduction_seven_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/logical_deduction_three_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/movie_recommendation.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/multistep_arithmetic_two.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/navigate.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/object_counting.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/penguins_in_a_table.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/reasoning_about_colored_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/ruin_names.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/salient_translation_error_detection.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/snarks.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/sports_understanding.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/temporal_sequences.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/tracking_shuffled_objects_five_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/tracking_shuffled_objects_seven_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/tracking_shuffled_objects_three_objects.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/web_of_lies.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/bbh/cot_prompts/word_sorting.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/benchmark.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/ceval/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/ceval/ceval_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/ceval/ceval_exam.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/cmmlu/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/cmmlu/cmmlu.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/cmmlu/cmmlu_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/competition_math/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/competition_math/competition_math.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/competition_math/competition_math_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/data_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/general_qa/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/general_qa/general_qa_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/gsm8k/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/gsm8k/gsm8k.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/gsm8k/gsm8k_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/hellaswag/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/hellaswag/hellaswag.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/hellaswag/hellaswag_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/humaneval/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/humaneval/humaneval.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/humaneval/humaneval_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/mmlu/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/mmlu/mmlu.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/mmlu/mmlu_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/race/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/race/race.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/race/race_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/trivia_qa/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/trivia_qa/trivia_qa.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/trivia_qa/trivia_qa_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/truthful_qa/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/truthful_qa/truthful_qa.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/benchmarks/truthful_qa/truthful_qa_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cache.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cli/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cli/base.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cli/cli.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cli/start_perf.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/cli/start_server.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/config.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/constants.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/evaluator/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/evaluator/evaluator.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/evaluator/rating_eval.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/evaluator/reviewer/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/evaluator/reviewer/auto_reviewer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/bundled_rouge_score/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/code_metric.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/math_accuracy.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/metrics.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/metrics/rouge_metric.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/api/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/api/openai_api.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/custom/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/custom/custom_model.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/dummy_chat_model.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/model.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/model_adapter.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/openai_model.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/models/template.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/_logging.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/api_plugin_base.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/custom_api.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/dashscope_api.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/dataset_plugin_base.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/datasets/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/datasets/line_by_line.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/datasets/longalpaca_12k.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/datasets/openqa.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/how_to_analysis_result.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/http_client.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/openai_api.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/plugin_registry.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/query_parameters.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/perf/server_sent_event.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/preprocess/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/preprocess/tokenizers/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/preprocess/tokenizers/gpt2_tokenizer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/arc.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/bbh.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/bbh_mini.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/ceval.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/ceval_mini.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/cmmlu.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/eval_qwen-7b-chat_v100.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/general_qa.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/gsm8k.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/mmlu.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/registry/tasks/mmlu_mini.yaml RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/run.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/run_arena.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/run_ms.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/summarizer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/eval.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/infer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/longbench_write.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/resources/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/resources/judge.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/resources/longbench_write.jsonl RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/resources/longbench_write_en.jsonl RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/resources/longwrite_ruler.jsonl RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/tools/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/tools/data_etl.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/longbench_write/utils.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/eval.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/infer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/llm/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/llm/swift_infer.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/third_party/toolbench_static/toolbench_static.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/tools/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/tools/combine_reports.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/tools/gen_mmlu_subject_mapping.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/tools/rewrite_eval_results.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/__init__.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/arena_utils.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/completion_parsers.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/logger.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/task_cfg_parser.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/task_utils.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope/utils/utils.py RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/SOURCES.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/dependency_links.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/entry_points.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/not-zip-safe RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/evalscope.egg-info/top_level.txt RENAMED Viewed

File without changes

{evalscope-0.5.4 → evalscope-0.5.5rc1}/setup.cfg RENAMED Viewed

File without changes

evalscope 0.5.4__tar.gz → 0.5.5rc1__tar.gz

Potentially problematic release.

evalscope 0.5.4tar.gz → 0.5.5rc1tar.gz