PyPI - rasa-pro - Versions diffs - 3.11.4__py3-none-any.whl → 3.12.0__py3-none-any.whl - Mend

rasa-pro 3.11.4py3-none-any.whl → 3.12.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of rasa-pro might be problematic. Click here for more details.

Files changed (580) hide show

README.md +10 -13
rasa/__main__.py +7 -7
rasa/anonymization/anonymisation_rule_yaml_reader.py +1 -1
rasa/anonymization/anonymization_pipeline.py +3 -3
rasa/anonymization/anonymization_rule_executor.py +17 -11
rasa/anonymization/anonymization_rule_orchestrator.py +2 -3
rasa/cli/arguments/data.py +2 -2
rasa/cli/arguments/default_arguments.py +1 -1
rasa/cli/arguments/evaluate.py +2 -1
rasa/cli/arguments/interactive.py +1 -1
rasa/cli/arguments/run.py +1 -1
rasa/cli/arguments/test.py +7 -5
rasa/cli/arguments/train.py +3 -3
rasa/cli/arguments/visualize.py +2 -2
rasa/cli/arguments/x.py +1 -0
rasa/cli/data.py +20 -3
rasa/cli/dialogue_understanding_test.py +386 -0
rasa/cli/evaluate.py +1 -1
rasa/cli/export.py +6 -6
rasa/cli/inspect.py +20 -1
rasa/cli/interactive.py +4 -5
rasa/cli/llm_fine_tuning.py +51 -16
rasa/cli/markers.py +1 -2
rasa/cli/project_templates/calm/actions/add_contact.py +1 -1
rasa/cli/project_templates/calm/config.yml +2 -2
rasa/cli/project_templates/calm/domain/list_contacts.yml +1 -2
rasa/cli/project_templates/calm/domain/remove_contact.yml +1 -2
rasa/cli/project_templates/calm/domain/shared.yml +1 -4
rasa/cli/project_templates/calm/endpoints.yml +2 -2
rasa/cli/project_templates/tutorial/actions/actions.py +3 -2
rasa/cli/shell.py +5 -6
rasa/cli/studio/download.py +1 -2
rasa/cli/studio/studio.py +2 -3
rasa/cli/studio/train.py +0 -1
rasa/cli/telemetry.py +2 -2
rasa/cli/test.py +11 -11
rasa/cli/train.py +3 -0
rasa/cli/utils.py +25 -5
rasa/constants.py +0 -1
rasa/core/__init__.py +0 -1
rasa/core/actions/action.py +137 -208
rasa/core/actions/action_handle_digressions.py +164 -0
rasa/core/actions/action_hangup.py +1 -1
rasa/core/actions/action_repeat_bot_messages.py +2 -2
rasa/core/actions/action_run_slot_rejections.py +18 -6
rasa/core/actions/action_trigger_chitchat.py +1 -1
rasa/core/actions/action_trigger_flow.py +5 -5
rasa/core/actions/action_trigger_search.py +1 -1
rasa/core/actions/custom_action_executor.py +1 -1
rasa/core/actions/direct_custom_actions_executor.py +1 -0
rasa/core/actions/forms.py +22 -15
rasa/core/actions/http_custom_action_executor.py +8 -1
rasa/core/actions/loops.py +3 -3
rasa/core/actions/two_stage_fallback.py +13 -13
rasa/core/auth_retry_tracker_store.py +1 -2
rasa/core/brokers/broker.py +2 -1
rasa/core/brokers/file.py +1 -1
rasa/core/brokers/kafka.py +8 -8
rasa/core/brokers/pika.py +8 -9
rasa/core/brokers/sql.py +4 -3
rasa/core/channels/__init__.py +7 -0
rasa/core/channels/botframework.py +2 -2
rasa/core/channels/callback.py +4 -4
rasa/core/channels/channel.py +11 -11
rasa/core/channels/console.py +0 -1
rasa/core/channels/development_inspector.py +80 -24
rasa/core/channels/facebook.py +5 -5
rasa/core/channels/hangouts.py +7 -8
rasa/core/channels/inspector/dist/assets/Tableau10-1b767f5e.js +1 -0
rasa/core/channels/inspector/dist/assets/arc-9f1365dc.js +1 -0
rasa/core/channels/inspector/dist/assets/blockDiagram-38ab4fdb-e0f81b12.js +118 -0
rasa/core/channels/inspector/dist/assets/c4Diagram-3d4e48cf-9deaee1c.js +10 -0
rasa/core/channels/inspector/dist/assets/channel-44956714.js +1 -0
rasa/core/channels/inspector/dist/assets/classDiagram-70f12bd4-20450a96.js +2 -0
rasa/core/channels/inspector/dist/assets/classDiagram-v2-f2320105-749d2abf.js +2 -0
rasa/core/channels/inspector/dist/assets/clone-a9475142.js +1 -0
rasa/core/channels/inspector/dist/assets/{createText-62fc7601-89c73b31.js → createText-2e5e7dd3-bef0b38c.js} +1 -1
rasa/core/channels/inspector/dist/assets/edges-e0da2a9e-943801a7.js +4 -0
rasa/core/channels/inspector/dist/assets/{erDiagram-9d236eb7-907e0440.js → erDiagram-9861fffd-d523a948.js} +4 -4
rasa/core/channels/inspector/dist/assets/flowDb-956e92f1-54e4cf19.js +10 -0
rasa/core/channels/inspector/dist/assets/flowDiagram-66a62f08-48bfbbe8.js +4 -0
rasa/core/channels/inspector/dist/assets/flowDiagram-v2-96b9c2cf-43fa749a.js +1 -0
rasa/core/channels/inspector/dist/assets/flowchart-elk-definition-4a651766-17c30827.js +139 -0
rasa/core/channels/inspector/dist/assets/ganttDiagram-c361ad54-43086f2d.js +257 -0
rasa/core/channels/inspector/dist/assets/gitGraphDiagram-72cf32ee-5c8b693e.js +70 -0
rasa/core/channels/inspector/dist/assets/graph-41a90d26.js +1 -0
rasa/core/channels/inspector/dist/assets/index-3862675e-b43eeae9.js +1 -0
rasa/core/channels/inspector/dist/assets/{index-e793d777.js → index-e8affe45.js} +201 -196
rasa/core/channels/inspector/dist/assets/{infoDiagram-736b4530-8ceba4db.js → infoDiagram-f8f76790-0b20676b.js} +1 -1
rasa/core/channels/inspector/dist/assets/{journeyDiagram-df861f2b-960d3809.js → journeyDiagram-49397b02-39bce7b5.js} +4 -4
rasa/core/channels/inspector/dist/assets/katex-498eb57e.js +261 -0
rasa/core/channels/inspector/dist/assets/layout-dc8eeea4.js +1 -0
rasa/core/channels/inspector/dist/assets/{line-eeccc4e2.js → line-c4d2e756.js} +1 -1
rasa/core/channels/inspector/dist/assets/linear-86f6f2d9.js +1 -0
rasa/core/channels/inspector/dist/assets/mindmap-definition-fc14e90a-4216f771.js +312 -0
rasa/core/channels/inspector/dist/assets/{pieDiagram-dbbf0591-dc9b5e1b.js → pieDiagram-8a3498a8-1a0cfa96.js} +7 -7
rasa/core/channels/inspector/dist/assets/{quadrantDiagram-4d7f4fd6-a08cba6d.js → quadrantDiagram-120e2f19-f91e67cf.js} +1 -1
rasa/core/channels/inspector/dist/assets/{requirementDiagram-6fc4c22a-87242b9e.js → requirementDiagram-deff3bca-d4046bed.js} +2 -2
rasa/core/channels/inspector/dist/assets/sankeyDiagram-04a897e0-2cf6d1d7.js +8 -0
rasa/core/channels/inspector/dist/assets/sequenceDiagram-704730f1-751ac4f5.js +122 -0
rasa/core/channels/inspector/dist/assets/stateDiagram-587899a1-f734f4d4.js +1 -0
rasa/core/channels/inspector/dist/assets/stateDiagram-v2-d93cdb3a-91c65710.js +1 -0
rasa/core/channels/inspector/dist/assets/{styles-9c745c82-cef936a6.js → styles-6aaf32cf-e0cff7be.js} +1 -1
rasa/core/channels/inspector/dist/assets/styles-9a916d00-c8029e5d.js +160 -0
rasa/core/channels/inspector/dist/assets/styles-c10674c1-114f312a.js +116 -0
rasa/core/channels/inspector/dist/assets/svgDrawCommon-08f97a94-b7b9dc00.js +1 -0
rasa/core/channels/inspector/dist/assets/{timeline-definition-5b62e21b-0d39bdb2.js → timeline-definition-85554ec2-9536d189.js} +3 -3
rasa/core/channels/inspector/dist/assets/{xychartDiagram-2b33534f-a03fa445.js → xychartDiagram-e933f94c-bf3b0f36.js} +3 -3
rasa/core/channels/inspector/dist/index.html +1 -1
rasa/core/channels/inspector/package.json +11 -3
rasa/core/channels/inspector/src/App.tsx +15 -2
rasa/core/channels/inspector/src/components/RasaLogo.tsx +31 -0
rasa/core/channels/inspector/src/components/RecruitmentPanel.tsx +68 -0
rasa/core/channels/inspector/src/components/Welcome.tsx +19 -13
rasa/core/channels/inspector/yarn.lock +94 -99
rasa/core/channels/mattermost.py +4 -4
rasa/core/channels/rasa_chat.py +4 -4
rasa/core/channels/rest.py +11 -12
rasa/core/channels/rocketchat.py +4 -3
rasa/core/channels/slack.py +6 -5
rasa/core/channels/socketio.py +8 -28
rasa/core/channels/studio_chat.py +212 -0
rasa/core/channels/telegram.py +105 -55
rasa/core/channels/twilio.py +3 -3
rasa/core/channels/vier_cvg.py +2 -2
rasa/core/channels/voice_ready/audiocodes.py +51 -32
rasa/core/channels/voice_ready/jambonz.py +5 -5
rasa/core/channels/voice_ready/jambonz_protocol.py +3 -4
rasa/core/channels/voice_ready/twilio_voice.py +9 -8
rasa/core/channels/voice_ready/utils.py +2 -2
rasa/core/channels/voice_stream/asr/asr_engine.py +12 -6
rasa/core/channels/voice_stream/asr/asr_event.py +5 -0
rasa/core/channels/voice_stream/asr/azure.py +16 -3
rasa/core/channels/voice_stream/asr/deepgram.py +76 -19
rasa/core/channels/voice_stream/audiocodes.py +292 -0
rasa/core/channels/voice_stream/browser_audio.py +14 -7
rasa/core/channels/voice_stream/call_state.py +6 -2
rasa/core/channels/voice_stream/genesys.py +320 -0
rasa/core/channels/voice_stream/tts/azure.py +13 -5
rasa/core/channels/voice_stream/tts/cartesia.py +34 -14
rasa/core/channels/voice_stream/tts/tts_cache.py +3 -2
rasa/core/channels/voice_stream/tts/tts_engine.py +1 -1
rasa/core/channels/voice_stream/twilio_media_streams.py +12 -8
rasa/core/channels/voice_stream/util.py +1 -1
rasa/core/channels/voice_stream/voice_channel.py +100 -56
rasa/core/channels/webexteams.py +3 -4
rasa/core/constants.py +2 -0
rasa/core/evaluation/marker.py +7 -6
rasa/core/evaluation/marker_base.py +15 -16
rasa/core/evaluation/marker_stats.py +3 -4
rasa/core/evaluation/marker_tracker_loader.py +5 -4
rasa/core/exporter.py +4 -4
rasa/core/featurizers/precomputation.py +8 -8
rasa/core/featurizers/single_state_featurizer.py +7 -7
rasa/core/featurizers/tracker_featurizers.py +13 -13
rasa/core/http_interpreter.py +3 -4
rasa/core/information_retrieval/__init__.py +1 -1
rasa/core/information_retrieval/faiss.py +4 -4
rasa/core/information_retrieval/information_retrieval.py +2 -2
rasa/core/information_retrieval/milvus.py +3 -3
rasa/core/information_retrieval/qdrant.py +3 -3
rasa/core/jobs.py +1 -0
rasa/core/lock.py +2 -3
rasa/core/lock_store.py +3 -3
rasa/core/migrate.py +12 -9
rasa/core/nlg/__init__.py +1 -1
rasa/core/nlg/callback.py +2 -3
rasa/core/nlg/contextual_response_rephraser.py +82 -14
rasa/core/nlg/generator.py +85 -17
rasa/core/nlg/interpolator.py +4 -3
rasa/core/nlg/response.py +9 -7
rasa/core/nlg/summarize.py +1 -0
rasa/core/nlg/translate.py +55 -0
rasa/core/persistor.py +3 -3
rasa/core/policies/ensemble.py +10 -9
rasa/core/policies/enterprise_search_policy.py +87 -21
rasa/core/policies/enterprise_search_prompt_with_citation_template.jinja2 +1 -1
rasa/core/policies/flow_policy.py +13 -14
rasa/core/policies/flows/flow_executor.py +85 -55
rasa/core/policies/intentless_policy.py +6 -7
rasa/core/policies/memoization.py +22 -20
rasa/core/policies/policy.py +24 -22
rasa/core/policies/rule_policy.py +37 -36
rasa/core/policies/ted_policy.py +87 -85
rasa/core/policies/unexpected_intent_policy.py +77 -75
rasa/core/processor.py +167 -74
rasa/core/run.py +5 -4
rasa/core/secrets_manager/endpoints.py +2 -3
rasa/core/secrets_manager/factory.py +2 -3
rasa/core/secrets_manager/secret_manager.py +2 -3
rasa/core/secrets_manager/vault.py +2 -2
rasa/core/test.py +30 -30
rasa/core/tracker_store.py +138 -49
rasa/core/train.py +1 -1
rasa/core/training/__init__.py +2 -2
rasa/core/training/converters/responses_prefix_converter.py +1 -2
rasa/core/training/interactive.py +13 -13
rasa/core/training/story_conflict.py +4 -5
rasa/core/training/training.py +3 -5
rasa/core/utils.py +5 -5
rasa/core/visualize.py +1 -1
rasa/dialogue_understanding/coexistence/intent_based_router.py +2 -2
rasa/dialogue_understanding/coexistence/llm_based_router.py +5 -5
rasa/dialogue_understanding/commands/__init__.py +22 -22
rasa/dialogue_understanding/commands/can_not_handle_command.py +38 -1
rasa/dialogue_understanding/commands/cancel_flow_command.py +96 -9
rasa/dialogue_understanding/commands/change_flow_command.py +36 -2
rasa/dialogue_understanding/commands/chit_chat_answer_command.py +36 -4
rasa/dialogue_understanding/commands/clarify_command.py +46 -4
rasa/dialogue_understanding/commands/command.py +3 -2
rasa/dialogue_understanding/commands/command_syntax_manager.py +55 -0
rasa/dialogue_understanding/commands/correct_slots_command.py +14 -5
rasa/dialogue_understanding/commands/error_command.py +1 -1
rasa/dialogue_understanding/commands/free_form_answer_command.py +2 -1
rasa/dialogue_understanding/commands/handle_code_change_command.py +2 -2
rasa/dialogue_understanding/commands/handle_digressions_command.py +144 -0
rasa/dialogue_understanding/commands/human_handoff_command.py +34 -4
rasa/dialogue_understanding/commands/knowledge_answer_command.py +36 -4
rasa/dialogue_understanding/commands/noop_command.py +2 -1
rasa/dialogue_understanding/commands/prompt_command.py +94 -0
rasa/dialogue_understanding/commands/repeat_bot_messages_command.py +34 -4
rasa/dialogue_understanding/commands/restart_command.py +2 -5
rasa/dialogue_understanding/commands/session_end_command.py +3 -5
rasa/dialogue_understanding/commands/session_start_command.py +3 -5
rasa/dialogue_understanding/commands/set_slot_command.py +55 -16
rasa/dialogue_understanding/commands/skip_question_command.py +34 -4
rasa/dialogue_understanding/commands/start_flow_command.py +78 -2
rasa/dialogue_understanding/commands/user_silence_command.py +3 -5
rasa/dialogue_understanding/commands/utils.py +126 -43
rasa/dialogue_understanding/constants.py +2 -0
rasa/dialogue_understanding/generator/__init__.py +2 -0
rasa/dialogue_understanding/generator/command_generator.py +120 -79
rasa/dialogue_understanding/generator/command_parser.py +245 -0
rasa/dialogue_understanding/generator/constants.py +12 -4
rasa/dialogue_understanding/generator/flow_retrieval.py +7 -7
rasa/dialogue_understanding/generator/llm_based_command_generator.py +187 -59
rasa/dialogue_understanding/generator/llm_command_generator.py +6 -3
rasa/dialogue_understanding/generator/multi_step/multi_step_llm_command_generator.py +106 -110
rasa/dialogue_understanding/generator/nlu_command_adapter.py +53 -11
rasa/dialogue_understanding/generator/prompt_templates/__init__.py +0 -0
rasa/dialogue_understanding/generator/prompt_templates/command_prompt_v2_claude_3_5_sonnet_20240620_template.jinja2 +58 -0
rasa/dialogue_understanding/generator/prompt_templates/command_prompt_v2_gpt_4o_2024_11_20_template.jinja2 +57 -0
rasa/dialogue_understanding/generator/single_step/compact_llm_command_generator.py +574 -0
rasa/dialogue_understanding/generator/single_step/single_step_llm_command_generator.py +41 -386
rasa/dialogue_understanding/generator/utils.py +76 -0
rasa/dialogue_understanding/patterns/cancel.py +2 -1
rasa/dialogue_understanding/patterns/cannot_handle.py +1 -0
rasa/dialogue_understanding/patterns/chitchat.py +1 -1
rasa/dialogue_understanding/patterns/clarify.py +2 -1
rasa/dialogue_understanding/patterns/code_change.py +2 -0
rasa/dialogue_understanding/patterns/collect_information.py +7 -4
rasa/dialogue_understanding/patterns/completed.py +1 -1
rasa/dialogue_understanding/patterns/continue_interrupted.py +1 -1
rasa/dialogue_understanding/patterns/correction.py +17 -3
rasa/dialogue_understanding/patterns/default_flows_for_patterns.yml +78 -2
rasa/dialogue_understanding/patterns/handle_digressions.py +81 -0
rasa/dialogue_understanding/patterns/human_handoff.py +1 -1
rasa/dialogue_understanding/patterns/internal_error.py +1 -0
rasa/dialogue_understanding/patterns/search.py +1 -1
rasa/dialogue_understanding/patterns/session_start.py +1 -1
rasa/dialogue_understanding/patterns/skip_question.py +1 -0
rasa/dialogue_understanding/patterns/user_silence.py +1 -1
rasa/dialogue_understanding/patterns/validate_slot.py +65 -0
rasa/dialogue_understanding/processor/command_processor.py +193 -43
rasa/dialogue_understanding/processor/command_processor_component.py +1 -1
rasa/dialogue_understanding/stack/dialogue_stack.py +4 -3
rasa/dialogue_understanding/stack/frames/__init__.py +2 -2
rasa/dialogue_understanding/stack/frames/chit_chat_frame.py +4 -1
rasa/dialogue_understanding/stack/frames/dialogue_stack_frame.py +2 -3
rasa/dialogue_understanding/stack/frames/flow_stack_frame.py +5 -2
rasa/dialogue_understanding/stack/frames/search_frame.py +4 -1
rasa/dialogue_understanding/stack/utils.py +56 -10
rasa/dialogue_understanding/utils.py +164 -0
rasa/dialogue_understanding_test/README.md +429 -0
rasa/dialogue_understanding_test/__init__.py +0 -0
rasa/dialogue_understanding_test/command_comparison.py +60 -0
rasa/dialogue_understanding_test/command_metric_calculation.py +122 -0
rasa/dialogue_understanding_test/constants.py +22 -0
rasa/dialogue_understanding_test/du_test_case.py +448 -0
rasa/dialogue_understanding_test/du_test_result.py +390 -0
rasa/dialogue_understanding_test/du_test_runner.py +322 -0
rasa/dialogue_understanding_test/du_test_schema.yml +161 -0
rasa/dialogue_understanding_test/io.py +443 -0
rasa/dialogue_understanding_test/test_case_simulation/__init__.py +0 -0
rasa/dialogue_understanding_test/test_case_simulation/exception.py +28 -0
rasa/dialogue_understanding_test/test_case_simulation/test_case_tracker_simulator.py +336 -0
rasa/dialogue_understanding_test/utils.py +70 -0
rasa/dialogue_understanding_test/validation.py +77 -0
rasa/e2e_test/aggregate_test_stats_calculator.py +1 -1
rasa/e2e_test/assertions.py +202 -175
rasa/e2e_test/assertions_schema.yml +6 -0
rasa/e2e_test/constants.py +16 -1
rasa/e2e_test/e2e_config.py +102 -41
rasa/e2e_test/e2e_config_schema.yml +28 -10
rasa/e2e_test/e2e_test_case.py +5 -5
rasa/e2e_test/e2e_test_converter.py +2 -3
rasa/e2e_test/e2e_test_coverage_report.py +6 -6
rasa/e2e_test/e2e_test_result.py +1 -1
rasa/e2e_test/e2e_test_runner.py +143 -38
rasa/e2e_test/llm_judge_prompts/answer_relevance_prompt_template.jinja2 +93 -0
rasa/e2e_test/llm_judge_prompts/groundedness_prompt_template.jinja2 +169 -0
rasa/e2e_test/stub_custom_action.py +1 -1
rasa/e2e_test/utils/generative_assertions.py +243 -0
rasa/e2e_test/utils/io.py +123 -93
rasa/e2e_test/utils/validation.py +101 -3
rasa/engine/caching.py +5 -7
rasa/engine/constants.py +1 -1
rasa/engine/graph.py +3 -2
rasa/engine/language.py +182 -0
rasa/engine/recipes/config_files/default_config.yml +4 -0
rasa/engine/recipes/default_components.py +13 -15
rasa/engine/recipes/default_recipe.py +65 -49
rasa/engine/recipes/graph_recipe.py +10 -7
rasa/engine/recipes/recipe.py +2 -2
rasa/engine/runner/dask.py +2 -2
rasa/engine/runner/interface.py +1 -0
rasa/engine/storage/local_model_storage.py +6 -4
rasa/engine/storage/resource.py +2 -1
rasa/engine/storage/storage.py +8 -3
rasa/engine/training/components.py +2 -1
rasa/engine/training/fingerprinting.py +4 -2
rasa/engine/training/graph_trainer.py +4 -4
rasa/engine/training/hooks.py +2 -2
rasa/engine/validation.py +36 -33
rasa/exceptions.py +3 -2
rasa/graph_components/converters/nlu_message_converter.py +3 -3
rasa/graph_components/providers/domain_for_core_training_provider.py +3 -3
rasa/graph_components/providers/domain_provider.py +3 -2
rasa/graph_components/providers/flows_provider.py +2 -3
rasa/graph_components/providers/forms_provider.py +4 -4
rasa/graph_components/providers/nlu_training_data_provider.py +5 -3
rasa/graph_components/providers/responses_provider.py +4 -4
rasa/graph_components/providers/rule_only_provider.py +3 -2
rasa/graph_components/providers/story_graph_provider.py +8 -8
rasa/graph_components/providers/training_tracker_provider.py +3 -2
rasa/graph_components/validators/default_recipe_validator.py +16 -16
rasa/graph_components/validators/finetuning_validator.py +10 -8
rasa/hooks.py +19 -14
rasa/jupyter.py +2 -2
rasa/llm_fine_tuning/annotation_module.py +4 -4
rasa/llm_fine_tuning/conversations.py +5 -33
rasa/llm_fine_tuning/llm_data_preparation_module.py +6 -4
rasa/llm_fine_tuning/paraphrasing/conversation_rephraser.py +4 -4
rasa/llm_fine_tuning/paraphrasing/rephrase_validator.py +18 -13
rasa/llm_fine_tuning/paraphrasing_module.py +6 -2
rasa/llm_fine_tuning/storage.py +3 -3
rasa/llm_fine_tuning/train_test_split_module.py +27 -27
rasa/llm_fine_tuning/utils.py +7 -0
rasa/markers/marker.py +2 -3
rasa/markers/marker_base.py +1 -2
rasa/markers/upload.py +2 -2
rasa/markers/validate.py +2 -3
rasa/model.py +3 -5
rasa/model_manager/config.py +1 -1
rasa/model_manager/model_api.py +5 -4
rasa/model_manager/runner_service.py +13 -10
rasa/model_manager/socket_bridge.py +15 -9
rasa/model_manager/studio_jwt_auth.py +1 -0
rasa/model_manager/trainer_service.py +9 -7
rasa/model_manager/utils.py +1 -1
rasa/model_manager/warm_rasa_process.py +14 -9
rasa/model_service.py +5 -6
rasa/model_testing.py +13 -15
rasa/model_training.py +29 -29
rasa/nlu/classifiers/diet_classifier.py +72 -73
rasa/nlu/classifiers/fallback_classifier.py +9 -8
rasa/nlu/classifiers/keyword_intent_classifier.py +7 -6
rasa/nlu/classifiers/logistic_regression_classifier.py +3 -3
rasa/nlu/classifiers/mitie_intent_classifier.py +5 -4
rasa/nlu/classifiers/regex_message_handler.py +3 -2
rasa/nlu/classifiers/sklearn_intent_classifier.py +2 -2
rasa/nlu/convert.py +2 -2
rasa/nlu/emulators/dialogflow.py +3 -3
rasa/nlu/emulators/luis.py +5 -5
rasa/nlu/emulators/no_emulator.py +1 -0
rasa/nlu/emulators/wit.py +4 -4
rasa/nlu/extractors/crf_entity_extractor.py +11 -11
rasa/nlu/extractors/duckling_entity_extractor.py +7 -6
rasa/nlu/extractors/entity_synonyms.py +10 -9
rasa/nlu/extractors/extractor.py +16 -16
rasa/nlu/extractors/mitie_entity_extractor.py +10 -9
rasa/nlu/extractors/regex_entity_extractor.py +11 -10
rasa/nlu/extractors/spacy_entity_extractor.py +2 -2
rasa/nlu/featurizers/dense_featurizer/convert_featurizer.py +15 -14
rasa/nlu/featurizers/dense_featurizer/dense_featurizer.py +2 -1
rasa/nlu/featurizers/dense_featurizer/lm_featurizer.py +10 -9
rasa/nlu/featurizers/dense_featurizer/mitie_featurizer.py +9 -7
rasa/nlu/featurizers/dense_featurizer/spacy_featurizer.py +13 -12
rasa/nlu/featurizers/featurizer.py +5 -4
rasa/nlu/featurizers/sparse_featurizer/count_vectors_featurizer.py +6 -6
rasa/nlu/featurizers/sparse_featurizer/lexical_syntactic_featurizer.py +4 -4
rasa/nlu/featurizers/sparse_featurizer/regex_featurizer.py +4 -4
rasa/nlu/featurizers/sparse_featurizer/sparse_featurizer.py +2 -0
rasa/nlu/model.py +0 -1
rasa/nlu/selectors/response_selector.py +67 -68
rasa/nlu/test.py +38 -38
rasa/nlu/tokenizers/jieba_tokenizer.py +1 -2
rasa/nlu/tokenizers/mitie_tokenizer.py +2 -2
rasa/nlu/tokenizers/spacy_tokenizer.py +3 -3
rasa/nlu/tokenizers/tokenizer.py +6 -7
rasa/nlu/tokenizers/whitespace_tokenizer.py +1 -1
rasa/nlu/utils/bilou_utils.py +7 -7
rasa/nlu/utils/hugging_face/registry.py +22 -22
rasa/nlu/utils/hugging_face/transformers_pre_post_processors.py +2 -1
rasa/nlu/utils/mitie_utils.py +2 -1
rasa/nlu/utils/pattern_utils.py +1 -1
rasa/nlu/utils/spacy_utils.py +3 -3
rasa/plugin.py +12 -1
rasa/server.py +6 -3
rasa/shared/constants.py +45 -18
rasa/shared/core/command_payload_reader.py +15 -7
rasa/shared/core/constants.py +34 -4
rasa/shared/core/conversation.py +1 -2
rasa/shared/core/domain.py +19 -20
rasa/shared/core/events.py +60 -39
rasa/shared/core/flows/__init__.py +0 -1
rasa/shared/core/flows/constants.py +11 -0
rasa/shared/core/flows/flow.py +107 -26
rasa/shared/core/flows/flow_step.py +4 -3
rasa/shared/core/flows/flow_step_links.py +1 -2
rasa/shared/core/flows/flow_step_sequence.py +1 -1
rasa/shared/core/flows/flows_list.py +3 -3
rasa/shared/core/flows/flows_yaml_schema.json +69 -3
rasa/shared/core/flows/nlu_trigger.py +1 -1
rasa/shared/core/flows/steps/__init__.py +2 -2
rasa/shared/core/flows/steps/action.py +1 -1
rasa/shared/core/flows/steps/call.py +1 -1
rasa/shared/core/flows/steps/collect.py +22 -40
rasa/shared/core/flows/steps/internal.py +1 -1
rasa/shared/core/flows/steps/link.py +1 -1
rasa/shared/core/flows/steps/no_operation.py +2 -2
rasa/shared/core/flows/steps/set_slots.py +1 -1
rasa/shared/core/flows/utils.py +44 -4
rasa/shared/core/flows/validation.py +4 -6
rasa/shared/core/generator.py +20 -21
rasa/shared/core/slot_mappings.py +360 -121
rasa/shared/core/slots.py +163 -6
rasa/shared/core/trackers.py +108 -33
rasa/shared/core/training_data/loading.py +1 -1
rasa/shared/core/training_data/story_reader/story_reader.py +3 -3
rasa/shared/core/training_data/story_reader/story_step_builder.py +4 -4
rasa/shared/core/training_data/story_reader/yaml_story_reader.py +29 -31
rasa/shared/core/training_data/story_writer/yaml_story_writer.py +22 -24
rasa/shared/core/training_data/structures.py +11 -12
rasa/shared/core/training_data/visualization.py +10 -10
rasa/shared/data.py +6 -6
rasa/shared/engine/caching.py +0 -1
rasa/shared/exceptions.py +2 -2
rasa/shared/importers/importer.py +58 -2
rasa/shared/importers/rasa.py +5 -6
rasa/shared/importers/utils.py +1 -1
rasa/shared/nlu/constants.py +9 -0
rasa/shared/nlu/training_data/entities_parser.py +6 -6
rasa/shared/nlu/training_data/features.py +3 -3
rasa/shared/nlu/training_data/formats/__init__.py +1 -1
rasa/shared/nlu/training_data/formats/dialogflow.py +4 -5
rasa/shared/nlu/training_data/formats/luis.py +7 -8
rasa/shared/nlu/training_data/formats/rasa.py +4 -5
rasa/shared/nlu/training_data/formats/rasa_yaml.py +17 -16
rasa/shared/nlu/training_data/formats/readerwriter.py +8 -11
rasa/shared/nlu/training_data/formats/wit.py +3 -4
rasa/shared/nlu/training_data/loading.py +4 -4
rasa/shared/nlu/training_data/lookup_tables_parser.py +1 -1
rasa/shared/nlu/training_data/message.py +13 -14
rasa/shared/nlu/training_data/schemas/data_schema.py +1 -1
rasa/shared/nlu/training_data/schemas/responses.yml +19 -11
rasa/shared/nlu/training_data/synonyms_parser.py +3 -3
rasa/shared/nlu/training_data/training_data.py +12 -13
rasa/shared/nlu/training_data/util.py +11 -10
rasa/shared/providers/_configs/azure_entra_id_config.py +541 -0
rasa/shared/providers/_configs/azure_openai_client_config.py +150 -15
rasa/shared/providers/_configs/client_config.py +3 -1
rasa/shared/providers/_configs/default_litellm_client_config.py +9 -7
rasa/shared/providers/_configs/huggingface_local_embedding_client_config.py +13 -11
rasa/shared/providers/_configs/litellm_router_client_config.py +12 -10
rasa/shared/providers/_configs/model_group_config.py +8 -5
rasa/shared/providers/_configs/oauth_config.py +33 -0
rasa/shared/providers/_configs/openai_client_config.py +14 -12
rasa/shared/providers/_configs/rasa_llm_client_config.py +5 -3
rasa/shared/providers/_configs/self_hosted_llm_client_config.py +12 -11
rasa/shared/providers/_configs/utils.py +1 -0
rasa/shared/providers/_ssl_verification_utils.py +5 -6
rasa/shared/providers/_utils.py +5 -5
rasa/shared/providers/constants.py +6 -0
rasa/shared/providers/embedding/_base_litellm_embedding_client.py +1 -1
rasa/shared/providers/embedding/azure_openai_embedding_client.py +32 -7
rasa/shared/providers/embedding/embedding_client.py +1 -1
rasa/shared/providers/embedding/litellm_router_embedding_client.py +5 -2
rasa/shared/providers/llm/_base_litellm_client.py +43 -18
rasa/shared/providers/llm/azure_openai_llm_client.py +90 -34
rasa/shared/providers/llm/default_litellm_llm_client.py +4 -2
rasa/shared/providers/llm/litellm_router_llm_client.py +32 -9
rasa/shared/providers/llm/llm_client.py +24 -8
rasa/shared/providers/llm/llm_response.py +61 -2
rasa/shared/providers/llm/openai_llm_client.py +11 -5
rasa/shared/providers/llm/rasa_llm_client.py +17 -14
rasa/shared/providers/llm/self_hosted_llm_client.py +35 -15
rasa/shared/providers/mappings.py +18 -19
rasa/shared/providers/router/_base_litellm_router_client.py +48 -15
rasa/shared/providers/router/router_client.py +3 -1
rasa/shared/utils/cli.py +1 -1
rasa/shared/utils/common.py +15 -1
rasa/shared/utils/constants.py +3 -0
rasa/shared/utils/health_check/embeddings_health_check_mixin.py +1 -1
rasa/shared/utils/health_check/health_check.py +3 -3
rasa/shared/utils/health_check/llm_health_check_mixin.py +1 -1
rasa/shared/utils/io.py +1 -1
rasa/shared/utils/llm.py +100 -18
rasa/shared/utils/pykwalify_extensions.py +25 -1
rasa/shared/utils/schemas/domain.yml +26 -1
rasa/shared/utils/schemas/events.py +1 -1
rasa/shared/utils/yaml.py +24 -20
rasa/studio/auth.py +3 -3
rasa/studio/config.py +1 -2
rasa/studio/data_handler.py +3 -3
rasa/studio/download.py +1 -1
rasa/studio/results_logger.py +3 -3
rasa/studio/upload.py +21 -5
rasa/telemetry.py +127 -48
rasa/tracing/config.py +5 -3
rasa/tracing/constants.py +12 -0
rasa/tracing/instrumentation/attribute_extractors.py +92 -14
rasa/tracing/instrumentation/instrumentation.py +61 -5
rasa/tracing/instrumentation/intentless_policy_instrumentation.py +1 -1
rasa/tracing/instrumentation/metrics.py +52 -11
rasa/tracing/metric_instrument_provider.py +54 -14
rasa/utils/common.py +12 -24
rasa/utils/endpoints.py +1 -1
rasa/utils/io.py +7 -7
rasa/utils/licensing.py +3 -4
rasa/utils/log_utils.py +7 -6
rasa/utils/ml_utils.py +1 -0
rasa/utils/plotting.py +3 -3
rasa/utils/sanic_error_handler.py +1 -1
rasa/utils/tensorflow/callback.py +2 -2
rasa/utils/tensorflow/crf.py +2 -2
rasa/utils/tensorflow/data_generator.py +5 -5
rasa/utils/tensorflow/environment.py +3 -3
rasa/utils/tensorflow/feature_array.py +2 -3
rasa/utils/tensorflow/layers.py +18 -12
rasa/utils/tensorflow/layers_utils.py +2 -1
rasa/utils/tensorflow/metrics.py +2 -2
rasa/utils/tensorflow/model_data.py +7 -7
rasa/utils/tensorflow/model_data_utils.py +10 -9
rasa/utils/tensorflow/models.py +31 -32
rasa/utils/tensorflow/rasa_layers.py +20 -19
rasa/utils/tensorflow/types.py +2 -1
rasa/utils/train_utils.py +23 -21
rasa/utils/url_tools.py +1 -1
rasa/validator.py +594 -115
rasa/version.py +1 -1
{rasa_pro-3.11.4.dist-info → rasa_pro-3.12.0.dist-info}/METADATA +23 -26
rasa_pro-3.12.0.dist-info/RECORD +829 -0
rasa/core/channels/inspector/dist/assets/arc-632a63ec.js +0 -1
rasa/core/channels/inspector/dist/assets/c4Diagram-d0fbc5ce-081e0df4.js +0 -10
rasa/core/channels/inspector/dist/assets/classDiagram-936ed81e-3df0afc2.js +0 -2
rasa/core/channels/inspector/dist/assets/classDiagram-v2-c3cb15f1-8c5ed31e.js +0 -2
rasa/core/channels/inspector/dist/assets/edges-f2ad444c-4fc48c3e.js +0 -4
rasa/core/channels/inspector/dist/assets/flowDb-1972c806-9ec53a3c.js +0 -6
rasa/core/channels/inspector/dist/assets/flowDiagram-7ea5b25a-41da787a.js +0 -4
rasa/core/channels/inspector/dist/assets/flowDiagram-v2-855bc5b3-8bea338b.js +0 -1
rasa/core/channels/inspector/dist/assets/flowchart-elk-definition-abe16c3d-ce370633.js +0 -139
rasa/core/channels/inspector/dist/assets/ganttDiagram-9b5ea136-90a36523.js +0 -266
rasa/core/channels/inspector/dist/assets/gitGraphDiagram-99d0ae7c-41e1aa3f.js +0 -70
rasa/core/channels/inspector/dist/assets/index-2c4b9a3b-e6f2af62.js +0 -1
rasa/core/channels/inspector/dist/assets/layout-498807d8.js +0 -1
rasa/core/channels/inspector/dist/assets/linear-8a078617.js +0 -1
rasa/core/channels/inspector/dist/assets/mindmap-definition-beec6740-396d17dd.js +0 -109
rasa/core/channels/inspector/dist/assets/sankeyDiagram-8f13d901-53f6f391.js +0 -8
rasa/core/channels/inspector/dist/assets/sequenceDiagram-b655622a-715c9c20.js +0 -122
rasa/core/channels/inspector/dist/assets/stateDiagram-59f0c015-2e8fb31f.js +0 -1
rasa/core/channels/inspector/dist/assets/stateDiagram-v2-2b26beab-7e2d2aa0.js +0 -1
rasa/core/channels/inspector/dist/assets/styles-080da4f6-4420cea6.js +0 -110
rasa/core/channels/inspector/dist/assets/styles-3dcbcfbf-28676cf4.js +0 -159
rasa/core/channels/inspector/dist/assets/svgDrawCommon-4835440b-151251e9.js +0 -1
rasa_pro-3.11.4.dist-info/RECORD +0 -779
/rasa/dialogue_understanding/generator/{single_step → prompt_templates}/command_prompt_template.jinja2 +0 -0
{rasa_pro-3.11.4.dist-info → rasa_pro-3.12.0.dist-info}/NOTICE +0 -0
{rasa_pro-3.11.4.dist-info → rasa_pro-3.12.0.dist-info}/WHEEL +0 -0
{rasa_pro-3.11.4.dist-info → rasa_pro-3.12.0.dist-info}/entry_points.txt +0 -0

rasa/e2e_test/assertions.py CHANGED Viewed

@@ -3,35 +3,46 @@ from __future__ import annotations
 import dataclasses
 import json
 import re
+import sys
 from dataclasses import dataclass
 from enum import Enum
 from functools import lru_cache
 from typing import (
+    TYPE_CHECKING,
     Any,
-    Callable,
     Dict,
     List,
     Optional,
     Set,
-    TYPE_CHECKING,
     Text,
     Tuple,
     Type,
 )
-import pandas as pd
 import structlog
+from jinja2 import Template
 import rasa.shared.utils.common
-from rasa.core.constants import (
-    DOMAIN_GROUND_TRUTH_METADATA_KEY,
-    UTTER_SOURCE_METADATA_KEY,
+from rasa.core.constants import DOMAIN_GROUND_TRUTH_METADATA_KEY
+from rasa.core.policies.enterprise_search_policy import SEARCH_RESULTS_METADATA_KEY
+from rasa.dialogue_understanding.patterns.clarify import FLOW_PATTERN_CLARIFICATION
+from rasa.e2e_test.constants import (
+    DEFAULT_ANSWER_RELEVANCE_PROMPT_TEMPLATE_FILE_NAME,
+    DEFAULT_GROUNDEDNESS_PROMPT_TEMPLATE_FILE_NAME,
+    KEY_GROUND_TRUTH,
+    KEY_THRESHOLD,
+    KEY_UTTER_NAME,
+    KEY_UTTER_SOURCE,
+    LLM_JUDGE_PROMPTS_MODULE,
 )
-from rasa.core.policies.enterprise_search_policy import (
-    SEARCH_QUERY_METADATA_KEY,
-    SEARCH_RESULTS_METADATA_KEY,
+from rasa.e2e_test.utils.generative_assertions import (
+    ScoreInputs,
+    _find_matching_generative_events,
+    _parse_llm_output,
+    _validate_parsed_llm_output,
+    calculate_groundedness_score,
+    calculate_relevance_score,
 )
-from rasa.dialogue_understanding.patterns.clarify import FLOW_PATTERN_CLARIFICATION
 from rasa.shared.core.constants import DEFAULT_SLOT_NAMES
 from rasa.shared.core.events import (
     ActionExecuted,
@@ -44,8 +55,10 @@ from rasa.shared.core.events import (
     FlowStarted,
     SlotSet,
 )
-from rasa.shared.exceptions import RasaException
-from rasa.utils.common import update_mlflow_log_level
+from rasa.shared.exceptions import ProviderClientAPIException, RasaException
+from rasa.shared.utils.llm import (
+    llm_factory,
+)
 from rasa.utils.json_utils import SetEncoder
 if TYPE_CHECKING:
@@ -55,11 +68,6 @@ if TYPE_CHECKING:
 structlogger = structlog.get_logger()
 DEFAULT_THRESHOLD = 0.5
-ELIGIBLE_UTTER_SOURCE_METADATA = [
-    "EnterpriseSearchPolicy",
-    "ContextualResponseRephraser",
-    "IntentlessPolicy",
-]
 class AssertionType(Enum):
@@ -949,28 +957,37 @@ class BotDidNotUtterAssertion(Assertion):
 class GenerativeResponseMixin(Assertion):
     """Mixin class for storing generative response assertions."""
+    metric_adjective: str
     threshold: float = DEFAULT_THRESHOLD
     utter_name: Optional[str] = None
+    utter_source: Optional[str] = None
     line: Optional[int] = None
-    metric_adjective: Optional[str] = None
-    metric_name: Optional[str] = None
-    mlflow_metric: Callable = print
     @classmethod
     def type(cls) -> str:
         return ""
-    def _get_ground_truth(self, matching_event: BotUttered) -> str:
-        raise NotImplementedError
     def as_dict(self) -> Dict[str, Any]:
         data = super().as_dict()
-        data.pop("metric_name")
         data.pop("metric_adjective")
-        data.pop("mlflow_metric")
         return data
+    def _render_prompt(self, matching_event: BotUttered) -> str:
+        raise NotImplementedError
+    def _get_processed_output(self, parsed_llm_output: Dict[str, Any]) -> List[Any]:
+        raise NotImplementedError
+    def _process_response(
+        self, llm_response: str, bot_message: str
+    ) -> List[Dict[str, Any]]:
+        """Process the LLM response."""
+        parsed_llm_output = _parse_llm_output(llm_response, bot_message)
+        _validate_parsed_llm_output(parsed_llm_output, bot_message)
+        processed_output = self._get_processed_output(parsed_llm_output)
+        return processed_output
     def _run_llm_evaluation(
         self,
         matching_event: BotUttered,
@@ -981,72 +998,40 @@ class GenerativeResponseMixin(Assertion):
         turn_events: List[Event],
     ) -> Tuple[Optional[AssertionFailure], Optional[Event]]:
         """Run the LLM evaluation on the given event."""
-        import mlflow
+        bot_message = matching_event.text
+        prompt = self._render_prompt(matching_event)
+        llm_response = self._invoke_llm(llm_judge_config, prompt)
-        # we need to configure the log level for mlflow
-        # after a local import to avoid unnecessary logs
-        update_mlflow_log_level()
-        # extract user question from event if available
-        user_question_from_event = matching_event.metadata.get(
-            SEARCH_QUERY_METADATA_KEY
-        )
-        user_question = (
-            user_question_from_event if user_question_from_event else step_text
-        )
-        ground_truth = self._get_ground_truth(matching_event)
-        eval_data = pd.DataFrame(
-            {
-                "inputs": [user_question],
-                "ground_truth": [ground_truth],
-                "predictions": [matching_event.text],
-            }
-        )
-        model_uri = llm_judge_config.get_model_uri()
-        structlogger.debug(
-            f"generative_response_is_{self.metric_adjective}_assertion.run_llm_evaluation",
-            model_uri=model_uri,
-        )
-        with mlflow.start_run():
-            results = mlflow.evaluate(
-                data=eval_data,
-                targets="ground_truth",
-                predictions="predictions",
-                model_type="question-answering",
-                evaluators="default",
-                extra_metrics=[
-                    self.mlflow_metric(model_uri),
-                ],
+        try:
+            processed_output = self._process_response(llm_response, bot_message)
+        except RasaException as exc:
+            structlogger.error(
+                "e2e_test.generative_response_evaluation.error", error=exc
+            )
+            return self._generate_assertion_failure(
+                str(exc), prior_events, turn_events, self.line
             )
-        # Evaluation result for each data record is available in `results.tables`.
-        eval_table = results.tables["eval_results_table"]
-        score = eval_table.iloc[0][f"{self.metric_name}/v1/score"]
-        justification = eval_table.iloc[0][f"{self.metric_name}/v1/justification"]
-        # convert 1-5 score to 0-1 float
-        score = score * 20 / 100 if score is not None else 0
-        structlogger.debug(
-            f"generative_response_is_{self.metric_adjective}_assertion.run_results",
-            matching_event=repr(matching_event),
-            score=score,
-            justification=justification,
+        score_inputs = ScoreInputs(
+            threshold=self.threshold,
+            matching_event=matching_event,
+            user_question=step_text,
+            llm_judge_config=llm_judge_config,
+        )
+        score, error_justification = calculate_score(
+            assertion_type=self.type(),
+            processed_output=processed_output,
+            score_inputs=score_inputs,
         )
         if score < self.threshold:
             error_message = (
                 f"Generative response '{matching_event.text}' "
-                f"given to the user input '{user_question}' "
+                f"given to the user input '{step_text}' "
                 f"was not {self.metric_adjective}. "
                 f"Expected score to be above '{self.threshold}' threshold, "
-                f"but was '{score}'. The explanation for this score is: "
-                f"{justification}."
+                f"but was '{round(score,2)}'. The LLM Judge model has justified its "
+                f"score like so: {error_justification}."
             )
             error_message += assertion_order_error_message
@@ -1056,6 +1041,28 @@ class GenerativeResponseMixin(Assertion):
         return None, matching_event
+    def _invoke_llm(self, llm_judge_config: LLMJudgeConfig, prompt: str) -> str:
+        """Invoke the LLM to evaluate the generative response."""
+        structlogger.debug(
+            f"generative_response_is_{self.metric_adjective}_assertion.run_llm_evaluation",
+        )
+        llm = llm_factory(
+            llm_judge_config.llm_config_as_dict,
+            llm_judge_config.get_default_llm_config(),
+        )
+        try:
+            llm_response = llm.completion(prompt)
+            return llm_response.choices[0]
+        except Exception as exc:
+            structlogger.error(
+                "e2e_test.generative_response_evaluation.llm.error", error=exc
+            )
+            raise ProviderClientAPIException(
+                message="LLM call exception", original_exception=exc
+            )
     def _run_assertion_with_utter_name(
         self,
         matching_events: List[BotUttered],
@@ -1089,49 +1096,6 @@ class GenerativeResponseMixin(Assertion):
             turn_events,
         )
-    def _run_assertion_for_multiple_generative_responses(
-        self,
-        matching_events: List[BotUttered],
-        step_text: str,
-        llm_judge_config: "LLMJudgeConfig",
-        assertion_order_error_message: str,
-        prior_events: List[Event],
-        turn_events: List[Event],
-    ) -> Tuple[Optional[AssertionFailure], Optional[Event]]:
-        """Run LLM evaluation for multiple bot utterances."""
-        structlogger.debug(
-            f"generative_response_is_{self.metric_adjective}_assertion.run",
-            event_info="Multiple generative responses found, "
-            "we will evaluate each of the responses.",
-        )
-        passing_events = set()
-        for event in matching_events:
-            failure, event_result = self._run_llm_evaluation(
-                event,
-                step_text,
-                llm_judge_config,
-                assertion_order_error_message,
-                prior_events,
-                turn_events,
-            )
-            if event_result is not None:
-                passing_events.add(event_result)
-        else:
-            if not passing_events:
-                error_message = (
-                    f"None of the generative responses issued by either the "
-                    f"Enterprise Search Policy, IntentlessPolicy or the "
-                    f"Contextual Response Rephraser were {self.metric_adjective}."
-                )
-                error_message += assertion_order_error_message
-                return self._generate_assertion_failure(
-                    error_message, prior_events, turn_events, self.line
-                )
-        return None, list(passing_events)[-1]
     def run(
         self,
         turn_events: List[Event],
@@ -1143,7 +1107,7 @@ class GenerativeResponseMixin(Assertion):
     ) -> Tuple[Optional[AssertionFailure], Optional[Event]]:
         """Run the LLM evaluation on the given events for that user turn."""
         matching_events: List[BotUttered] = _find_matching_generative_events(
-            turn_events
+            turn_events, self.utter_source
         )
         if not matching_events:
@@ -1169,13 +1133,11 @@ class GenerativeResponseMixin(Assertion):
             )
         if len(matching_events) > 1:
-            return self._run_assertion_for_multiple_generative_responses(
-                matching_events,
-                step_text,
-                llm_judge_config,
-                assertion_order_error_message,
-                prior_events,
-                turn_events,
+            structlogger.debug(
+                f"generative_response_is_{self.metric_adjective}_assertion.run",
+                event_info=f"Multiple generative responses found, "
+                f"we will evaluate the first of the responses "
+                f"'{matching_events[0].text}'.",
             )
         matching_event = matching_events[0]
@@ -1194,34 +1156,45 @@ class GenerativeResponseMixin(Assertion):
 class GenerativeResponseIsRelevantAssertion(GenerativeResponseMixin):
     """Class for storing the generative response is relevant assertion."""
-    def _get_ground_truth(self, matching_event: BotUttered) -> str:
-        return ""
     @classmethod
     def type(cls) -> str:
         return AssertionType.GENERATIVE_RESPONSE_IS_RELEVANT.value
+    def _render_prompt(self, matching_event: BotUttered) -> str:
+        """Render the prompt."""
+        inputs = _get_prompt_inputs(self.type(), matching_event)
+        prompt_template = _get_default_prompt_template(
+            DEFAULT_ANSWER_RELEVANCE_PROMPT_TEMPLATE_FILE_NAME
+        )
+        return Template(prompt_template).render(**inputs)
     @staticmethod
     def from_dict(
         assertion_dict: Dict[Text, Any],
     ) -> GenerativeResponseIsRelevantAssertion:
-        import mlflow
         assertion_dict = assertion_dict.get(
             AssertionType.GENERATIVE_RESPONSE_IS_RELEVANT.value, {}
         )
         return GenerativeResponseIsRelevantAssertion(
-            threshold=assertion_dict.get("threshold", DEFAULT_THRESHOLD),
-            utter_name=assertion_dict.get("utter_name"),
+            threshold=assertion_dict.get(KEY_THRESHOLD, DEFAULT_THRESHOLD),
+            utter_name=assertion_dict.get(KEY_UTTER_NAME),
             line=assertion_dict.lc.line + 1 if hasattr(assertion_dict, "lc") else None,
-            metric_name="answer_relevance",
             metric_adjective="relevant",
-            mlflow_metric=mlflow.metrics.genai.answer_relevance,
+            utter_source=assertion_dict.get(KEY_UTTER_SOURCE),
         )
     def __hash__(self) -> int:
         return hash(json.dumps(self.as_dict()))
+    def _get_processed_output(self, parsed_llm_output: Dict[str, Any]) -> List[Any]:
+        questions = parsed_llm_output.get("question_variations", [])
+        if not questions:
+            raise RasaException(
+                "No question variations were extracted by the LLM Judge."
+            )
+        return questions
 @dataclass
 class GenerativeResponseIsGroundedAssertion(GenerativeResponseMixin):
@@ -1233,44 +1206,48 @@ class GenerativeResponseIsGroundedAssertion(GenerativeResponseMixin):
     def type(cls) -> str:
         return AssertionType.GENERATIVE_RESPONSE_IS_GROUNDED.value
+    def _render_prompt(self, matching_event: BotUttered) -> str:
+        """Render the prompt."""
+        inputs = _get_prompt_inputs(
+            assertion_type=self.type(),
+            matching_event=matching_event,
+            ground_truth=self.ground_truth,
+        )
+        prompt_template = _get_default_prompt_template(
+            DEFAULT_GROUNDEDNESS_PROMPT_TEMPLATE_FILE_NAME
+        )
+        return Template(prompt_template).render(**inputs)
     @staticmethod
     def from_dict(
         assertion_dict: Dict[Text, Any],
     ) -> GenerativeResponseIsGroundedAssertion:
-        import mlflow
         assertion_dict = assertion_dict.get(
             AssertionType.GENERATIVE_RESPONSE_IS_GROUNDED.value, {}
         )
         return GenerativeResponseIsGroundedAssertion(
-            threshold=assertion_dict.get("threshold", DEFAULT_THRESHOLD),
-            utter_name=assertion_dict.get("utter_name"),
-            ground_truth=assertion_dict.get("ground_truth"),
+            threshold=assertion_dict.get(KEY_THRESHOLD, DEFAULT_THRESHOLD),
+            utter_name=assertion_dict.get(KEY_UTTER_NAME),
+            ground_truth=assertion_dict.get(KEY_GROUND_TRUTH),
             line=assertion_dict.lc.line + 1 if hasattr(assertion_dict, "lc") else None,
-            metric_name="answer_correctness",
             metric_adjective="grounded",
-            mlflow_metric=mlflow.metrics.genai.answer_correctness,
+            utter_source=assertion_dict.get(KEY_UTTER_SOURCE),
         )
     def __hash__(self) -> int:
         return hash(json.dumps(self.as_dict()))
-    def _get_ground_truth(self, matching_event: BotUttered) -> str:
-        # extract ground truth from event if available or use the provided ground truth
-        ground_truth_event_metadata = matching_event.metadata.get(
-            SEARCH_RESULTS_METADATA_KEY, ""
-        ) or matching_event.metadata.get(DOMAIN_GROUND_TRUTH_METADATA_KEY, "")
-        if isinstance(ground_truth_event_metadata, list):
-            ground_truth_event_metadata = "\n".join(ground_truth_event_metadata)
-        ground_truth = (
-            self.ground_truth
-            if self.ground_truth is not None
-            else ground_truth_event_metadata
-        )
+    def _get_processed_output(self, parsed_llm_output: Dict[str, Any]) -> List[Any]:
+        """Process the LLM response."""
+        statements = parsed_llm_output.get("statements", [])
+        if not statements:
+            raise RasaException(
+                "No statements were extracted and scored by the LLM Judge. "
+                "Please check the LLM Judge configuration"
+            )
-        return ground_truth
+        return statements
 @dataclass
@@ -1312,17 +1289,6 @@ def create_actual_events_transcript(
     return event_transcript
-def _find_matching_generative_events(turn_events: List[Event]) -> List[BotUttered]:
-    """Find the matching events for the generative response assertions."""
-    return [
-        event
-        for event in turn_events
-        if isinstance(event, BotUttered)
-        and event.metadata.get(UTTER_SOURCE_METADATA_KEY)
-        in ELIGIBLE_UTTER_SOURCE_METADATA
-    ]
 def _get_turn_events_based_on_step_index(
     step_index: int, turn_events: List[Event], prior_events: List[Event]
 ) -> Tuple[List[Event], List[Event]]:
@@ -1343,3 +1309,64 @@ def _get_turn_events_based_on_step_index(
         return original_turn_events, prior_events + turn_events
     return original_turn_events, turn_events
+def _get_default_prompt_template(default_prompt_template_file_name: str) -> str:
+    # We cannot use importlib.resources with Python 3.9 because of an unfixed bug:
+    # https://bugs.python.org/issue44137
+    if sys.version_info < (3, 10):
+        from importlib_resources import files
+        default_prompt_template = (
+            files(LLM_JUDGE_PROMPTS_MODULE)
+            .joinpath(default_prompt_template_file_name)
+            .read_text()
+        )
+    else:
+        import importlib.resources
+        default_prompt_template = importlib.resources.read_text(
+            LLM_JUDGE_PROMPTS_MODULE,
+            default_prompt_template_file_name,
+        )
+    return default_prompt_template
+def _get_prompt_inputs(
+    assertion_type: str,
+    matching_event: BotUttered,
+    ground_truth: Optional[str] = None,
+) -> Dict[str, Any]:
+    if assertion_type == AssertionType.GENERATIVE_RESPONSE_IS_RELEVANT.value:
+        return {"num_variations": "3", "bot_message": matching_event.text}
+    elif assertion_type == AssertionType.GENERATIVE_RESPONSE_IS_GROUNDED.value:
+        ground_truth_event_metadata = matching_event.metadata.get(
+            SEARCH_RESULTS_METADATA_KEY, ""
+        ) or matching_event.metadata.get(DOMAIN_GROUND_TRUTH_METADATA_KEY, "")
+        if isinstance(ground_truth_event_metadata, list):
+            ground_truth_event_metadata = "\n".join(ground_truth_event_metadata)
+        ground_truth = (
+            ground_truth if ground_truth is not None else ground_truth_event_metadata
+        )
+        return {
+            "bot_message": matching_event.text,
+            "ground_truth": ground_truth,
+        }
+    else:
+        raise ValueError(f"Invalid assertion type '{assertion_type}'")
+def calculate_score(
+    assertion_type: str, processed_output: List[Any], score_inputs: ScoreInputs
+) -> Tuple[float, str]:
+    """Calculate and return the score and justification."""
+    if assertion_type == AssertionType.GENERATIVE_RESPONSE_IS_RELEVANT.value:
+        return calculate_relevance_score(processed_output, score_inputs)
+    elif assertion_type == AssertionType.GENERATIVE_RESPONSE_IS_GROUNDED.value:
+        return calculate_groundedness_score(processed_output, score_inputs)
+    else:
+        raise ValueError(f"Invalid assertion type '{assertion_type}'")

rasa/e2e_test/assertions_schema.yml CHANGED Viewed

@@ -115,6 +115,9 @@ schema;assertions:
            utter_name:
              type: str
              nullable: false
+           utter_source:
+             type: str
+             nullable: false
        generative_response_is_grounded:
          type: map
          mapping:
@@ -127,3 +130,6 @@ schema;assertions:
            ground_truth:
              type: str
              nullable: false
+           utter_source:
+             type: str
+             nullable: false

rasa/e2e_test/constants.py CHANGED Viewed

@@ -17,9 +17,13 @@ KEY_METADATA = "metadata"
 KEY_ASSERTIONS = "assertions"
 KEY_ASSERTION_ORDER_ENABLED = "assertion_order_enabled"
 KEY_STUB_CUSTOM_ACTIONS = "stub_custom_actions"
+KEY_THRESHOLD = "threshold"
+KEY_UTTER_NAME = "utter_name"
+KEY_GROUND_TRUTH = "ground_truth"
+KEY_UTTER_SOURCE = "utter_source"
 KEY_MODEL = "model"
-KEY_LLM_AS_JUDGE = "llm_as_judge"
+KEY_LLM_JUDGE = "llm_judge"
 KEY_LLM_E2E_TEST_CONVERSION = "llm_e2e_test_conversion"
 DEFAULT_E2E_INPUT_TESTS_PATH = "tests/e2e_test_cases.yml"
@@ -29,3 +33,14 @@ DEFAULT_COVERAGE_OUTPUT_PATH = "e2e_coverage_results"
 # Test status
 STATUS_PASSED = "passed"
 STATUS_FAILED = "failed"
+# LLM Judge
+LLM_JUDGE_PROMPTS_MODULE = "rasa.e2e_test.llm_judge_prompts"
+DEFAULT_GROUNDEDNESS_PROMPT_TEMPLATE_FILE_NAME = "groundedness_prompt_template.jinja2"
+DEFAULT_ANSWER_RELEVANCE_PROMPT_TEMPLATE_FILE_NAME = (
+    "answer_relevance_prompt_template.jinja2"
+)
+DEFAULT_E2E_TESTING_MODEL = "gpt-4o-mini"
+KEY_SCORE = "score"
+KEY_JUSTIFICATION = "justification"
+KEY_EXTRA_PARAMETERS = "extra_parameters"

rasa-pro 3.11.4__py3-none-any.whl → 3.12.0__py3-none-any.whl

Potentially problematic release.

rasa-pro 3.11.4py3-none-any.whl → 3.12.0py3-none-any.whl