PyPI - azure-ai-evaluation - Versions diffs - 1.12.0__py3-none-any.whl → 1.13.0__py3-none-any.whl - Mend

azure-ai-evaluation 1.12.0py3-none-any.whl → 1.13.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (99) hide show

azure/ai/evaluation/__init__.py +2 -0
azure/ai/evaluation/_aoai/aoai_grader.py +6 -9
azure/ai/evaluation/_aoai/label_grader.py +6 -10
azure/ai/evaluation/_aoai/python_grader.py +7 -10
azure/ai/evaluation/_aoai/score_model_grader.py +5 -7
azure/ai/evaluation/_aoai/string_check_grader.py +4 -9
azure/ai/evaluation/_aoai/text_similarity_grader.py +7 -21
azure/ai/evaluation/_common/__init__.py +2 -1
azure/ai/evaluation/_common/constants.py +109 -0
azure/ai/evaluation/_common/evaluation_onedp_client.py +5 -5
azure/ai/evaluation/_common/onedp/__init__.py +2 -2
azure/ai/evaluation/_common/onedp/_client.py +44 -14
azure/ai/evaluation/_common/onedp/_configuration.py +9 -7
azure/ai/evaluation/_common/onedp/_utils/model_base.py +1 -1
azure/ai/evaluation/_common/onedp/_validation.py +18 -2
azure/ai/evaluation/_common/onedp/aio/__init__.py +2 -2
azure/ai/evaluation/_common/onedp/aio/_client.py +44 -14
azure/ai/evaluation/_common/onedp/aio/_configuration.py +9 -7
azure/ai/evaluation/_common/onedp/aio/operations/__init__.py +12 -0
azure/ai/evaluation/_common/onedp/aio/operations/_operations.py +3942 -1631
azure/ai/evaluation/_common/onedp/models/__init__.py +196 -6
azure/ai/evaluation/_common/onedp/models/_enums.py +217 -0
azure/ai/evaluation/_common/onedp/models/_models.py +3876 -603
azure/ai/evaluation/_common/onedp/operations/__init__.py +12 -0
azure/ai/evaluation/_common/onedp/operations/_operations.py +5422 -2577
azure/ai/evaluation/_common/rai_service.py +299 -2
azure/ai/evaluation/_common/utils.py +241 -39
azure/ai/evaluation/_constants.py +100 -0
azure/ai/evaluation/_eval_mapping.py +10 -2
azure/ai/evaluation/_evaluate/_batch_run/_run_submitter_client.py +10 -0
azure/ai/evaluation/_evaluate/_evaluate.py +1019 -5
azure/ai/evaluation/_evaluate/_evaluate_aoai.py +86 -11
azure/ai/evaluation/_evaluate/_utils.py +10 -3
azure/ai/evaluation/_evaluator_definition.py +76 -0
azure/ai/evaluation/_evaluators/_bleu/_bleu.py +1 -0
azure/ai/evaluation/_evaluators/_code_vulnerability/_code_vulnerability.py +0 -17
azure/ai/evaluation/_evaluators/_common/_base_eval.py +16 -4
azure/ai/evaluation/_evaluators/_common/_base_prompty_eval.py +181 -3
azure/ai/evaluation/_evaluators/_groundedness/_groundedness.py +107 -45
azure/ai/evaluation/_evaluators/_groundedness/groundedness_with_query.prompty +30 -29
azure/ai/evaluation/_evaluators/_groundedness/groundedness_without_query.prompty +19 -14
azure/ai/evaluation/_evaluators/_intent_resolution/_intent_resolution.py +23 -4
azure/ai/evaluation/_evaluators/_relevance/_relevance.py +14 -6
azure/ai/evaluation/_evaluators/_relevance/relevance.prompty +36 -19
azure/ai/evaluation/_evaluators/_response_completeness/_response_completeness.py +43 -20
azure/ai/evaluation/_evaluators/_task_adherence/_task_adherence.py +32 -6
azure/ai/evaluation/_evaluators/{_path_efficiency → _task_completion}/__init__.py +2 -2
azure/ai/evaluation/_evaluators/{_task_success/_task_success.py → _task_completion/_task_completion.py} +39 -30
azure/ai/evaluation/_evaluators/{_task_success/task_success.prompty → _task_completion/task_completion.prompty} +2 -2
azure/ai/evaluation/_evaluators/_task_navigation_efficiency/__init__.py +7 -0
azure/ai/evaluation/_evaluators/{_path_efficiency/_path_efficiency.py → _task_navigation_efficiency/_task_navigation_efficiency.py} +115 -73
azure/ai/evaluation/_evaluators/_tool_call_accuracy/_tool_call_accuracy.py +23 -127
azure/ai/evaluation/_evaluators/_tool_input_accuracy/__init__.py +9 -0
azure/ai/evaluation/_evaluators/_tool_input_accuracy/_tool_input_accuracy.py +263 -0
azure/ai/evaluation/_evaluators/_tool_input_accuracy/tool_input_accuracy.prompty +76 -0
azure/ai/evaluation/_evaluators/_tool_output_utilization/__init__.py +7 -0
azure/ai/evaluation/_evaluators/_tool_output_utilization/_tool_output_utilization.py +225 -0
azure/ai/evaluation/_evaluators/_tool_output_utilization/tool_output_utilization.prompty +221 -0
azure/ai/evaluation/_evaluators/_tool_selection/__init__.py +9 -0
azure/ai/evaluation/_evaluators/_tool_selection/_tool_selection.py +266 -0
azure/ai/evaluation/_evaluators/_tool_selection/tool_selection.prompty +104 -0
azure/ai/evaluation/_evaluators/{_task_success → _tool_success}/__init__.py +2 -2
azure/ai/evaluation/_evaluators/_tool_success/_tool_success.py +301 -0
azure/ai/evaluation/_evaluators/_tool_success/tool_success.prompty +321 -0
azure/ai/evaluation/_evaluators/_ungrounded_attributes/_ungrounded_attributes.py +0 -19
azure/ai/evaluation/_exceptions.py +6 -1
azure/ai/evaluation/_legacy/_batch_engine/_run_submitter.py +14 -1
azure/ai/evaluation/_legacy/prompty/_prompty.py +2 -1
azure/ai/evaluation/_legacy/prompty/_utils.py +54 -6
azure/ai/evaluation/_model_configurations.py +26 -0
azure/ai/evaluation/_version.py +1 -1
azure/ai/evaluation/red_team/_attack_objective_generator.py +3 -1
azure/ai/evaluation/red_team/_attack_strategy.py +1 -0
azure/ai/evaluation/red_team/_callback_chat_target.py +45 -14
azure/ai/evaluation/red_team/_evaluation_processor.py +129 -12
azure/ai/evaluation/red_team/_mlflow_integration.py +41 -352
azure/ai/evaluation/red_team/_orchestrator_manager.py +309 -51
azure/ai/evaluation/red_team/_red_team.py +494 -37
azure/ai/evaluation/red_team/_red_team_result.py +48 -28
azure/ai/evaluation/red_team/_result_processor.py +558 -29
azure/ai/evaluation/red_team/_utils/constants.py +1 -0
azure/ai/evaluation/red_team/_utils/formatting_utils.py +125 -24
azure/ai/evaluation/red_team/_utils/metric_mapping.py +10 -7
azure/ai/evaluation/red_team/_utils/strategy_utils.py +3 -25
azure/ai/evaluation/simulator/_adversarial_simulator.py +1 -1
azure/ai/evaluation/simulator/_conversation/__init__.py +1 -1
azure/ai/evaluation/simulator/_conversation/_conversation.py +1 -1
azure/ai/evaluation/simulator/_direct_attack_simulator.py +1 -1
azure/ai/evaluation/simulator/_indirect_attack_simulator.py +1 -1
azure/ai/evaluation/simulator/_model_tools/_generated_rai_client.py +25 -2
azure/ai/evaluation/simulator/_model_tools/_identity_manager.py +1 -0
azure/ai/evaluation/simulator/_model_tools/_proxy_completion_model.py +1 -1
azure/ai/evaluation/simulator/_model_tools/_template_handler.py +1 -1
azure/ai/evaluation/simulator/_model_tools/models.py +1 -1
{azure_ai_evaluation-1.12.0.dist-info → azure_ai_evaluation-1.13.0.dist-info}/METADATA +38 -8
{azure_ai_evaluation-1.12.0.dist-info → azure_ai_evaluation-1.13.0.dist-info}/RECORD +99 -86
{azure_ai_evaluation-1.12.0.dist-info → azure_ai_evaluation-1.13.0.dist-info}/WHEEL +0 -0
{azure_ai_evaluation-1.12.0.dist-info → azure_ai_evaluation-1.13.0.dist-info}/licenses/NOTICE.txt +0 -0
{azure_ai_evaluation-1.12.0.dist-info → azure_ai_evaluation-1.13.0.dist-info}/top_level.txt +0 -0

There are too many changes on this page to be displayed.

The amount of changes on this page would crash your brower.

You can still verify the content by downloading the package file manually.

« First
‹ Prev
1
2
3
4
5
6
7
...
Next ›
Last »

azure-ai-evaluation 1.12.0__py3-none-any.whl → 1.13.0__py3-none-any.whl

There are too many changes on this page to be displayed.

azure-ai-evaluation 1.12.0py3-none-any.whl → 1.13.0py3-none-any.whl