PyPI - rasa-pro - Versions diffs - 3.8.16__py3-none-any.whl - Mend

rasa-pro 3.8.16__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of rasa-pro might be problematic. Click here for more details.

Files changed (644) hide show

README.md +380 -0
rasa/__init__.py +10 -0
rasa/__main__.py +151 -0
rasa/anonymization/__init__.py +2 -0
rasa/anonymization/anonymisation_rule_yaml_reader.py +91 -0
rasa/anonymization/anonymization_pipeline.py +287 -0
rasa/anonymization/anonymization_rule_executor.py +260 -0
rasa/anonymization/anonymization_rule_orchestrator.py +120 -0
rasa/anonymization/schemas/config.yml +47 -0
rasa/anonymization/utils.py +117 -0
rasa/api.py +146 -0
rasa/cli/__init__.py +5 -0
rasa/cli/arguments/__init__.py +0 -0
rasa/cli/arguments/data.py +81 -0
rasa/cli/arguments/default_arguments.py +165 -0
rasa/cli/arguments/evaluate.py +65 -0
rasa/cli/arguments/export.py +51 -0
rasa/cli/arguments/interactive.py +74 -0
rasa/cli/arguments/run.py +204 -0
rasa/cli/arguments/shell.py +13 -0
rasa/cli/arguments/test.py +211 -0
rasa/cli/arguments/train.py +263 -0
rasa/cli/arguments/visualize.py +34 -0
rasa/cli/arguments/x.py +30 -0
rasa/cli/data.py +292 -0
rasa/cli/e2e_test.py +566 -0
rasa/cli/evaluate.py +222 -0
rasa/cli/export.py +251 -0
rasa/cli/inspect.py +63 -0
rasa/cli/interactive.py +164 -0
rasa/cli/license.py +65 -0
rasa/cli/markers.py +78 -0
rasa/cli/project_templates/__init__.py +0 -0
rasa/cli/project_templates/calm/actions/__init__.py +0 -0
rasa/cli/project_templates/calm/actions/action_template.py +27 -0
rasa/cli/project_templates/calm/actions/add_contact.py +30 -0
rasa/cli/project_templates/calm/actions/db.py +57 -0
rasa/cli/project_templates/calm/actions/list_contacts.py +22 -0
rasa/cli/project_templates/calm/actions/remove_contact.py +35 -0
rasa/cli/project_templates/calm/config.yml +12 -0
rasa/cli/project_templates/calm/credentials.yml +33 -0
rasa/cli/project_templates/calm/data/flows/add_contact.yml +31 -0
rasa/cli/project_templates/calm/data/flows/list_contacts.yml +14 -0
rasa/cli/project_templates/calm/data/flows/remove_contact.yml +29 -0
rasa/cli/project_templates/calm/db/contacts.json +10 -0
rasa/cli/project_templates/calm/domain/add_contact.yml +33 -0
rasa/cli/project_templates/calm/domain/list_contacts.yml +14 -0
rasa/cli/project_templates/calm/domain/remove_contact.yml +31 -0
rasa/cli/project_templates/calm/domain/shared.yml +5 -0
rasa/cli/project_templates/calm/e2e_tests/cancelations/user_cancels_during_a_correction.yml +16 -0
rasa/cli/project_templates/calm/e2e_tests/cancelations/user_changes_mind_on_a_whim.yml +7 -0
rasa/cli/project_templates/calm/e2e_tests/corrections/user_corrects_contact_handle.yml +20 -0
rasa/cli/project_templates/calm/e2e_tests/corrections/user_corrects_contact_name.yml +19 -0
rasa/cli/project_templates/calm/e2e_tests/happy_paths/user_adds_contact_to_their_list.yml +15 -0
rasa/cli/project_templates/calm/e2e_tests/happy_paths/user_lists_contacts.yml +5 -0
rasa/cli/project_templates/calm/e2e_tests/happy_paths/user_removes_contact.yml +11 -0
rasa/cli/project_templates/calm/e2e_tests/happy_paths/user_removes_contact_from_list.yml +12 -0
rasa/cli/project_templates/calm/endpoints.yml +45 -0
rasa/cli/project_templates/default/actions/__init__.py +0 -0
rasa/cli/project_templates/default/actions/actions.py +27 -0
rasa/cli/project_templates/default/config.yml +44 -0
rasa/cli/project_templates/default/credentials.yml +33 -0
rasa/cli/project_templates/default/data/nlu.yml +91 -0
rasa/cli/project_templates/default/data/rules.yml +13 -0
rasa/cli/project_templates/default/data/stories.yml +30 -0
rasa/cli/project_templates/default/domain.yml +34 -0
rasa/cli/project_templates/default/endpoints.yml +42 -0
rasa/cli/project_templates/default/tests/test_stories.yml +91 -0
rasa/cli/project_templates/tutorial/actions.py +22 -0
rasa/cli/project_templates/tutorial/config.yml +11 -0
rasa/cli/project_templates/tutorial/credentials.yml +33 -0
rasa/cli/project_templates/tutorial/data/flows.yml +8 -0
rasa/cli/project_templates/tutorial/domain.yml +17 -0
rasa/cli/project_templates/tutorial/endpoints.yml +45 -0
rasa/cli/run.py +136 -0
rasa/cli/scaffold.py +268 -0
rasa/cli/shell.py +141 -0
rasa/cli/studio/__init__.py +0 -0
rasa/cli/studio/download.py +51 -0
rasa/cli/studio/studio.py +110 -0
rasa/cli/studio/train.py +59 -0
rasa/cli/studio/upload.py +85 -0
rasa/cli/telemetry.py +90 -0
rasa/cli/test.py +280 -0
rasa/cli/train.py +260 -0
rasa/cli/utils.py +453 -0
rasa/cli/visualize.py +40 -0
rasa/cli/x.py +205 -0
rasa/constants.py +37 -0
rasa/core/__init__.py +17 -0
rasa/core/actions/__init__.py +0 -0
rasa/core/actions/action.py +1450 -0
rasa/core/actions/action_clean_stack.py +59 -0
rasa/core/actions/action_run_slot_rejections.py +207 -0
rasa/core/actions/action_trigger_chitchat.py +31 -0
rasa/core/actions/action_trigger_flow.py +109 -0
rasa/core/actions/action_trigger_search.py +31 -0
rasa/core/actions/constants.py +2 -0
rasa/core/actions/forms.py +737 -0
rasa/core/actions/loops.py +111 -0
rasa/core/actions/two_stage_fallback.py +186 -0
rasa/core/agent.py +557 -0
rasa/core/auth_retry_tracker_store.py +122 -0
rasa/core/brokers/__init__.py +0 -0
rasa/core/brokers/broker.py +126 -0
rasa/core/brokers/file.py +58 -0
rasa/core/brokers/kafka.py +322 -0
rasa/core/brokers/pika.py +387 -0
rasa/core/brokers/sql.py +86 -0
rasa/core/channels/__init__.py +55 -0
rasa/core/channels/audiocodes.py +463 -0
rasa/core/channels/botframework.py +339 -0
rasa/core/channels/callback.py +85 -0
rasa/core/channels/channel.py +419 -0
rasa/core/channels/console.py +243 -0
rasa/core/channels/development_inspector.py +93 -0
rasa/core/channels/facebook.py +422 -0
rasa/core/channels/hangouts.py +335 -0
rasa/core/channels/inspector/.eslintrc.cjs +25 -0
rasa/core/channels/inspector/.gitignore +23 -0
rasa/core/channels/inspector/README.md +54 -0
rasa/core/channels/inspector/assets/favicon.ico +0 -0
rasa/core/channels/inspector/assets/rasa-chat.js +2 -0
rasa/core/channels/inspector/custom.d.ts +3 -0
rasa/core/channels/inspector/dist/assets/arc-5623b6dc.js +1 -0
rasa/core/channels/inspector/dist/assets/array-9f3ba611.js +1 -0
rasa/core/channels/inspector/dist/assets/c4Diagram-d0fbc5ce-685c106a.js +10 -0
rasa/core/channels/inspector/dist/assets/classDiagram-936ed81e-8cbed007.js +2 -0
rasa/core/channels/inspector/dist/assets/classDiagram-v2-c3cb15f1-5889cf12.js +2 -0
rasa/core/channels/inspector/dist/assets/createText-62fc7601-24c249d7.js +7 -0
rasa/core/channels/inspector/dist/assets/edges-f2ad444c-7dd06a75.js +4 -0
rasa/core/channels/inspector/dist/assets/erDiagram-9d236eb7-62c1e54c.js +51 -0
rasa/core/channels/inspector/dist/assets/flowDb-1972c806-ce49b86f.js +6 -0
rasa/core/channels/inspector/dist/assets/flowDiagram-7ea5b25a-4067e48f.js +4 -0
rasa/core/channels/inspector/dist/assets/flowDiagram-v2-855bc5b3-85583a23.js +1 -0
rasa/core/channels/inspector/dist/assets/flowchart-elk-definition-abe16c3d-59fe4051.js +139 -0
rasa/core/channels/inspector/dist/assets/ganttDiagram-9b5ea136-47e3a43b.js +266 -0
rasa/core/channels/inspector/dist/assets/gitGraphDiagram-99d0ae7c-5a2ac0d9.js +70 -0
rasa/core/channels/inspector/dist/assets/ibm-plex-mono-v4-latin-regular-128cfa44.ttf +0 -0
rasa/core/channels/inspector/dist/assets/ibm-plex-mono-v4-latin-regular-21dbcb97.woff +0 -0
rasa/core/channels/inspector/dist/assets/ibm-plex-mono-v4-latin-regular-222b5e26.svg +329 -0
rasa/core/channels/inspector/dist/assets/ibm-plex-mono-v4-latin-regular-9ad89b2a.woff2 +0 -0
rasa/core/channels/inspector/dist/assets/index-268a75c0.js +1040 -0
rasa/core/channels/inspector/dist/assets/index-2c4b9a3b-dfb8efc4.js +1 -0
rasa/core/channels/inspector/dist/assets/index-3ee28881.css +1 -0
rasa/core/channels/inspector/dist/assets/infoDiagram-736b4530-b0c470f2.js +7 -0
rasa/core/channels/inspector/dist/assets/init-77b53fdd.js +1 -0
rasa/core/channels/inspector/dist/assets/journeyDiagram-df861f2b-2edb829a.js +139 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-700-60c05ee4.woff +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-700-8335d9b8.svg +438 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-700-9cc39c75.ttf +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-700-ead13ccf.woff2 +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-regular-16705655.woff2 +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-regular-5aeb07f9.woff +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-regular-9c459044.ttf +0 -0
rasa/core/channels/inspector/dist/assets/lato-v14-latin-regular-9e2898a4.svg +435 -0
rasa/core/channels/inspector/dist/assets/layout-b6873d69.js +1 -0
rasa/core/channels/inspector/dist/assets/line-1efc5781.js +1 -0
rasa/core/channels/inspector/dist/assets/linear-661e9b94.js +1 -0
rasa/core/channels/inspector/dist/assets/mindmap-definition-beec6740-2d2e727f.js +109 -0
rasa/core/channels/inspector/dist/assets/ordinal-ba9b4969.js +1 -0
rasa/core/channels/inspector/dist/assets/path-53f90ab3.js +1 -0
rasa/core/channels/inspector/dist/assets/pieDiagram-dbbf0591-9d3ea93d.js +35 -0
rasa/core/channels/inspector/dist/assets/quadrantDiagram-4d7f4fd6-06a178a2.js +7 -0
rasa/core/channels/inspector/dist/assets/requirementDiagram-6fc4c22a-0bfedffc.js +52 -0
rasa/core/channels/inspector/dist/assets/sankeyDiagram-8f13d901-d76d0a04.js +8 -0
rasa/core/channels/inspector/dist/assets/sequenceDiagram-b655622a-37bb4341.js +122 -0
rasa/core/channels/inspector/dist/assets/stateDiagram-59f0c015-f52f7f57.js +1 -0
rasa/core/channels/inspector/dist/assets/stateDiagram-v2-2b26beab-4a986a20.js +1 -0
rasa/core/channels/inspector/dist/assets/styles-080da4f6-7dd9ae12.js +110 -0
rasa/core/channels/inspector/dist/assets/styles-3dcbcfbf-46e1ca14.js +159 -0
rasa/core/channels/inspector/dist/assets/styles-9c745c82-4a97439a.js +207 -0
rasa/core/channels/inspector/dist/assets/svgDrawCommon-4835440b-823917a3.js +1 -0
rasa/core/channels/inspector/dist/assets/timeline-definition-5b62e21b-9ea72896.js +61 -0
rasa/core/channels/inspector/dist/assets/xychartDiagram-2b33534f-b631a8b6.js +7 -0
rasa/core/channels/inspector/dist/index.html +39 -0
rasa/core/channels/inspector/index.html +37 -0
rasa/core/channels/inspector/jest.config.ts +13 -0
rasa/core/channels/inspector/package.json +48 -0
rasa/core/channels/inspector/setupTests.ts +2 -0
rasa/core/channels/inspector/src/App.tsx +170 -0
rasa/core/channels/inspector/src/components/DiagramFlow.tsx +97 -0
rasa/core/channels/inspector/src/components/DialogueInformation.tsx +187 -0
rasa/core/channels/inspector/src/components/DialogueStack.tsx +151 -0
rasa/core/channels/inspector/src/components/ExpandIcon.tsx +16 -0
rasa/core/channels/inspector/src/components/FullscreenButton.tsx +45 -0
rasa/core/channels/inspector/src/components/LoadingSpinner.tsx +19 -0
rasa/core/channels/inspector/src/components/NoActiveFlow.tsx +21 -0
rasa/core/channels/inspector/src/components/RasaLogo.tsx +32 -0
rasa/core/channels/inspector/src/components/SaraDiagrams.tsx +39 -0
rasa/core/channels/inspector/src/components/Slots.tsx +91 -0
rasa/core/channels/inspector/src/components/Welcome.tsx +54 -0
rasa/core/channels/inspector/src/helpers/formatters.test.ts +385 -0
rasa/core/channels/inspector/src/helpers/formatters.ts +239 -0
rasa/core/channels/inspector/src/helpers/utils.ts +42 -0
rasa/core/channels/inspector/src/main.tsx +13 -0
rasa/core/channels/inspector/src/theme/Button/Button.ts +29 -0
rasa/core/channels/inspector/src/theme/Heading/Heading.ts +31 -0
rasa/core/channels/inspector/src/theme/Input/Input.ts +27 -0
rasa/core/channels/inspector/src/theme/Link/Link.ts +10 -0
rasa/core/channels/inspector/src/theme/Modal/Modal.ts +47 -0
rasa/core/channels/inspector/src/theme/Table/Table.tsx +38 -0
rasa/core/channels/inspector/src/theme/Tooltip/Tooltip.ts +12 -0
rasa/core/channels/inspector/src/theme/base/breakpoints.ts +8 -0
rasa/core/channels/inspector/src/theme/base/colors.ts +88 -0
rasa/core/channels/inspector/src/theme/base/fonts/fontFaces.css +29 -0
rasa/core/channels/inspector/src/theme/base/fonts/ibm-plex-mono-v4-latin/ibm-plex-mono-v4-latin-regular.eot +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/ibm-plex-mono-v4-latin/ibm-plex-mono-v4-latin-regular.svg +329 -0
rasa/core/channels/inspector/src/theme/base/fonts/ibm-plex-mono-v4-latin/ibm-plex-mono-v4-latin-regular.ttf +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/ibm-plex-mono-v4-latin/ibm-plex-mono-v4-latin-regular.woff +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/ibm-plex-mono-v4-latin/ibm-plex-mono-v4-latin-regular.woff2 +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-700.eot +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-700.svg +438 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-700.ttf +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-700.woff +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-700.woff2 +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-regular.eot +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-regular.svg +435 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-regular.ttf +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-regular.woff +0 -0
rasa/core/channels/inspector/src/theme/base/fonts/lato-v14-latin/lato-v14-latin-regular.woff2 +0 -0
rasa/core/channels/inspector/src/theme/base/radii.ts +9 -0
rasa/core/channels/inspector/src/theme/base/shadows.ts +7 -0
rasa/core/channels/inspector/src/theme/base/sizes.ts +7 -0
rasa/core/channels/inspector/src/theme/base/space.ts +15 -0
rasa/core/channels/inspector/src/theme/base/styles.ts +13 -0
rasa/core/channels/inspector/src/theme/base/typography.ts +24 -0
rasa/core/channels/inspector/src/theme/base/zIndices.ts +19 -0
rasa/core/channels/inspector/src/theme/index.ts +101 -0
rasa/core/channels/inspector/src/types.ts +64 -0
rasa/core/channels/inspector/src/vite-env.d.ts +1 -0
rasa/core/channels/inspector/tests/__mocks__/fileMock.ts +1 -0
rasa/core/channels/inspector/tests/__mocks__/matchMedia.ts +16 -0
rasa/core/channels/inspector/tests/__mocks__/styleMock.ts +1 -0
rasa/core/channels/inspector/tests/renderWithProviders.tsx +14 -0
rasa/core/channels/inspector/tsconfig.json +26 -0
rasa/core/channels/inspector/tsconfig.node.json +10 -0
rasa/core/channels/inspector/vite.config.ts +8 -0
rasa/core/channels/inspector/yarn.lock +6156 -0
rasa/core/channels/mattermost.py +229 -0
rasa/core/channels/rasa_chat.py +126 -0
rasa/core/channels/rest.py +210 -0
rasa/core/channels/rocketchat.py +175 -0
rasa/core/channels/slack.py +620 -0
rasa/core/channels/socketio.py +274 -0
rasa/core/channels/telegram.py +298 -0
rasa/core/channels/twilio.py +169 -0
rasa/core/channels/twilio_voice.py +367 -0
rasa/core/channels/vier_cvg.py +374 -0
rasa/core/channels/webexteams.py +135 -0
rasa/core/concurrent_lock_store.py +210 -0
rasa/core/constants.py +107 -0
rasa/core/evaluation/__init__.py +0 -0
rasa/core/evaluation/marker.py +267 -0
rasa/core/evaluation/marker_base.py +925 -0
rasa/core/evaluation/marker_stats.py +294 -0
rasa/core/evaluation/marker_tracker_loader.py +103 -0
rasa/core/exceptions.py +29 -0
rasa/core/exporter.py +284 -0
rasa/core/featurizers/__init__.py +0 -0
rasa/core/featurizers/precomputation.py +410 -0
rasa/core/featurizers/single_state_featurizer.py +402 -0
rasa/core/featurizers/tracker_featurizers.py +1172 -0
rasa/core/http_interpreter.py +89 -0
rasa/core/information_retrieval/__init__.py +0 -0
rasa/core/information_retrieval/faiss.py +116 -0
rasa/core/information_retrieval/information_retrieval.py +72 -0
rasa/core/information_retrieval/milvus.py +59 -0
rasa/core/information_retrieval/qdrant.py +102 -0
rasa/core/jobs.py +63 -0
rasa/core/lock.py +139 -0
rasa/core/lock_store.py +344 -0
rasa/core/migrate.py +404 -0
rasa/core/nlg/__init__.py +3 -0
rasa/core/nlg/callback.py +147 -0
rasa/core/nlg/contextual_response_rephraser.py +270 -0
rasa/core/nlg/generator.py +230 -0
rasa/core/nlg/interpolator.py +143 -0
rasa/core/nlg/response.py +155 -0
rasa/core/nlg/summarize.py +69 -0
rasa/core/policies/__init__.py +0 -0
rasa/core/policies/ensemble.py +329 -0
rasa/core/policies/enterprise_search_policy.py +717 -0
rasa/core/policies/enterprise_search_prompt_template.jinja2 +62 -0
rasa/core/policies/flow_policy.py +205 -0
rasa/core/policies/flows/__init__.py +0 -0
rasa/core/policies/flows/flow_exceptions.py +44 -0
rasa/core/policies/flows/flow_executor.py +582 -0
rasa/core/policies/flows/flow_step_result.py +43 -0
rasa/core/policies/intentless_policy.py +924 -0
rasa/core/policies/intentless_prompt_template.jinja2 +22 -0
rasa/core/policies/memoization.py +538 -0
rasa/core/policies/policy.py +716 -0
rasa/core/policies/rule_policy.py +1276 -0
rasa/core/policies/ted_policy.py +2146 -0
rasa/core/policies/unexpected_intent_policy.py +1015 -0
rasa/core/processor.py +1331 -0
rasa/core/run.py +315 -0
rasa/core/secrets_manager/__init__.py +0 -0
rasa/core/secrets_manager/constants.py +32 -0
rasa/core/secrets_manager/endpoints.py +391 -0
rasa/core/secrets_manager/factory.py +233 -0
rasa/core/secrets_manager/secret_manager.py +262 -0
rasa/core/secrets_manager/vault.py +576 -0
rasa/core/test.py +1337 -0
rasa/core/tracker_store.py +1664 -0
rasa/core/train.py +107 -0
rasa/core/training/__init__.py +89 -0
rasa/core/training/converters/__init__.py +0 -0
rasa/core/training/converters/responses_prefix_converter.py +119 -0
rasa/core/training/interactive.py +1742 -0
rasa/core/training/story_conflict.py +381 -0
rasa/core/training/training.py +93 -0
rasa/core/utils.py +344 -0
rasa/core/visualize.py +70 -0
rasa/dialogue_understanding/__init__.py +0 -0
rasa/dialogue_understanding/coexistence/__init__.py +0 -0
rasa/dialogue_understanding/coexistence/constants.py +4 -0
rasa/dialogue_understanding/coexistence/intent_based_router.py +189 -0
rasa/dialogue_understanding/coexistence/llm_based_router.py +261 -0
rasa/dialogue_understanding/coexistence/router_template.jinja2 +12 -0
rasa/dialogue_understanding/commands/__init__.py +45 -0
rasa/dialogue_understanding/commands/can_not_handle_command.py +61 -0
rasa/dialogue_understanding/commands/cancel_flow_command.py +116 -0
rasa/dialogue_understanding/commands/chit_chat_answer_command.py +48 -0
rasa/dialogue_understanding/commands/clarify_command.py +77 -0
rasa/dialogue_understanding/commands/command.py +85 -0
rasa/dialogue_understanding/commands/correct_slots_command.py +288 -0
rasa/dialogue_understanding/commands/error_command.py +67 -0
rasa/dialogue_understanding/commands/free_form_answer_command.py +9 -0
rasa/dialogue_understanding/commands/handle_code_change_command.py +64 -0
rasa/dialogue_understanding/commands/human_handoff_command.py +57 -0
rasa/dialogue_understanding/commands/knowledge_answer_command.py +48 -0
rasa/dialogue_understanding/commands/noop_command.py +45 -0
rasa/dialogue_understanding/commands/set_slot_command.py +125 -0
rasa/dialogue_understanding/commands/skip_question_command.py +66 -0
rasa/dialogue_understanding/commands/start_flow_command.py +98 -0
rasa/dialogue_understanding/generator/__init__.py +6 -0
rasa/dialogue_understanding/generator/command_generator.py +257 -0
rasa/dialogue_understanding/generator/command_prompt_template.jinja2 +57 -0
rasa/dialogue_understanding/generator/flow_document_template.jinja2 +4 -0
rasa/dialogue_understanding/generator/flow_retrieval.py +410 -0
rasa/dialogue_understanding/generator/llm_command_generator.py +637 -0
rasa/dialogue_understanding/generator/nlu_command_adapter.py +157 -0
rasa/dialogue_understanding/patterns/__init__.py +0 -0
rasa/dialogue_understanding/patterns/cancel.py +111 -0
rasa/dialogue_understanding/patterns/cannot_handle.py +43 -0
rasa/dialogue_understanding/patterns/chitchat.py +37 -0
rasa/dialogue_understanding/patterns/clarify.py +97 -0
rasa/dialogue_understanding/patterns/code_change.py +41 -0
rasa/dialogue_understanding/patterns/collect_information.py +90 -0
rasa/dialogue_understanding/patterns/completed.py +40 -0
rasa/dialogue_understanding/patterns/continue_interrupted.py +42 -0
rasa/dialogue_understanding/patterns/correction.py +278 -0
rasa/dialogue_understanding/patterns/default_flows_for_patterns.yml +243 -0
rasa/dialogue_understanding/patterns/human_handoff.py +37 -0
rasa/dialogue_understanding/patterns/internal_error.py +47 -0
rasa/dialogue_understanding/patterns/search.py +37 -0
rasa/dialogue_understanding/patterns/skip_question.py +38 -0
rasa/dialogue_understanding/processor/__init__.py +0 -0
rasa/dialogue_understanding/processor/command_processor.py +578 -0
rasa/dialogue_understanding/processor/command_processor_component.py +39 -0
rasa/dialogue_understanding/stack/__init__.py +0 -0
rasa/dialogue_understanding/stack/dialogue_stack.py +178 -0
rasa/dialogue_understanding/stack/frames/__init__.py +19 -0
rasa/dialogue_understanding/stack/frames/chit_chat_frame.py +27 -0
rasa/dialogue_understanding/stack/frames/dialogue_stack_frame.py +137 -0
rasa/dialogue_understanding/stack/frames/flow_stack_frame.py +157 -0
rasa/dialogue_understanding/stack/frames/pattern_frame.py +10 -0
rasa/dialogue_understanding/stack/frames/search_frame.py +27 -0
rasa/dialogue_understanding/stack/utils.py +211 -0
rasa/e2e_test/__init__.py +0 -0
rasa/e2e_test/constants.py +10 -0
rasa/e2e_test/e2e_test_case.py +322 -0
rasa/e2e_test/e2e_test_result.py +34 -0
rasa/e2e_test/e2e_test_runner.py +659 -0
rasa/e2e_test/e2e_test_schema.yml +67 -0
rasa/engine/__init__.py +0 -0
rasa/engine/caching.py +464 -0
rasa/engine/constants.py +17 -0
rasa/engine/exceptions.py +14 -0
rasa/engine/graph.py +625 -0
rasa/engine/loader.py +36 -0
rasa/engine/recipes/__init__.py +0 -0
rasa/engine/recipes/config_files/default_config.yml +44 -0
rasa/engine/recipes/default_components.py +99 -0
rasa/engine/recipes/default_recipe.py +1252 -0
rasa/engine/recipes/graph_recipe.py +79 -0
rasa/engine/recipes/recipe.py +93 -0
rasa/engine/runner/__init__.py +0 -0
rasa/engine/runner/dask.py +256 -0
rasa/engine/runner/interface.py +49 -0
rasa/engine/storage/__init__.py +0 -0
rasa/engine/storage/local_model_storage.py +248 -0
rasa/engine/storage/resource.py +110 -0
rasa/engine/storage/storage.py +203 -0
rasa/engine/training/__init__.py +0 -0
rasa/engine/training/components.py +176 -0
rasa/engine/training/fingerprinting.py +64 -0
rasa/engine/training/graph_trainer.py +256 -0
rasa/engine/training/hooks.py +164 -0
rasa/engine/validation.py +839 -0
rasa/env.py +5 -0
rasa/exceptions.py +69 -0
rasa/graph_components/__init__.py +0 -0
rasa/graph_components/converters/__init__.py +0 -0
rasa/graph_components/converters/nlu_message_converter.py +48 -0
rasa/graph_components/providers/__init__.py +0 -0
rasa/graph_components/providers/domain_for_core_training_provider.py +87 -0
rasa/graph_components/providers/domain_provider.py +71 -0
rasa/graph_components/providers/flows_provider.py +74 -0
rasa/graph_components/providers/forms_provider.py +44 -0
rasa/graph_components/providers/nlu_training_data_provider.py +56 -0
rasa/graph_components/providers/responses_provider.py +44 -0
rasa/graph_components/providers/rule_only_provider.py +49 -0
rasa/graph_components/providers/story_graph_provider.py +43 -0
rasa/graph_components/providers/training_tracker_provider.py +55 -0
rasa/graph_components/validators/__init__.py +0 -0
rasa/graph_components/validators/default_recipe_validator.py +552 -0
rasa/graph_components/validators/finetuning_validator.py +302 -0
rasa/hooks.py +113 -0
rasa/jupyter.py +63 -0
rasa/keys +1 -0
rasa/markers/__init__.py +0 -0
rasa/markers/marker.py +269 -0
rasa/markers/marker_base.py +828 -0
rasa/markers/upload.py +74 -0
rasa/markers/validate.py +21 -0
rasa/model.py +118 -0
rasa/model_testing.py +457 -0
rasa/model_training.py +535 -0
rasa/nlu/__init__.py +7 -0
rasa/nlu/classifiers/__init__.py +3 -0
rasa/nlu/classifiers/classifier.py +5 -0
rasa/nlu/classifiers/diet_classifier.py +1874 -0
rasa/nlu/classifiers/fallback_classifier.py +192 -0
rasa/nlu/classifiers/keyword_intent_classifier.py +188 -0
rasa/nlu/classifiers/llm_intent_classifier.py +519 -0
rasa/nlu/classifiers/logistic_regression_classifier.py +240 -0
rasa/nlu/classifiers/mitie_intent_classifier.py +156 -0
rasa/nlu/classifiers/regex_message_handler.py +56 -0
rasa/nlu/classifiers/sklearn_intent_classifier.py +309 -0
rasa/nlu/constants.py +77 -0
rasa/nlu/convert.py +40 -0
rasa/nlu/emulators/__init__.py +0 -0
rasa/nlu/emulators/dialogflow.py +55 -0
rasa/nlu/emulators/emulator.py +49 -0
rasa/nlu/emulators/luis.py +86 -0
rasa/nlu/emulators/no_emulator.py +10 -0
rasa/nlu/emulators/wit.py +56 -0
rasa/nlu/extractors/__init__.py +0 -0
rasa/nlu/extractors/crf_entity_extractor.py +672 -0
rasa/nlu/extractors/duckling_entity_extractor.py +206 -0
rasa/nlu/extractors/entity_synonyms.py +178 -0
rasa/nlu/extractors/extractor.py +470 -0
rasa/nlu/extractors/mitie_entity_extractor.py +293 -0
rasa/nlu/extractors/regex_entity_extractor.py +220 -0
rasa/nlu/extractors/spacy_entity_extractor.py +95 -0
rasa/nlu/featurizers/__init__.py +0 -0
rasa/nlu/featurizers/dense_featurizer/__init__.py +0 -0
rasa/nlu/featurizers/dense_featurizer/convert_featurizer.py +449 -0
rasa/nlu/featurizers/dense_featurizer/dense_featurizer.py +57 -0
rasa/nlu/featurizers/dense_featurizer/lm_featurizer.py +772 -0
rasa/nlu/featurizers/dense_featurizer/mitie_featurizer.py +170 -0
rasa/nlu/featurizers/dense_featurizer/spacy_featurizer.py +132 -0
rasa/nlu/featurizers/featurizer.py +89 -0
rasa/nlu/featurizers/sparse_featurizer/__init__.py +0 -0
rasa/nlu/featurizers/sparse_featurizer/count_vectors_featurizer.py +840 -0
rasa/nlu/featurizers/sparse_featurizer/lexical_syntactic_featurizer.py +539 -0
rasa/nlu/featurizers/sparse_featurizer/regex_featurizer.py +269 -0
rasa/nlu/featurizers/sparse_featurizer/sparse_featurizer.py +9 -0
rasa/nlu/model.py +24 -0
rasa/nlu/persistor.py +240 -0
rasa/nlu/run.py +27 -0
rasa/nlu/selectors/__init__.py +0 -0
rasa/nlu/selectors/response_selector.py +990 -0
rasa/nlu/test.py +1943 -0
rasa/nlu/tokenizers/__init__.py +0 -0
rasa/nlu/tokenizers/jieba_tokenizer.py +148 -0
rasa/nlu/tokenizers/mitie_tokenizer.py +75 -0
rasa/nlu/tokenizers/spacy_tokenizer.py +72 -0
rasa/nlu/tokenizers/tokenizer.py +239 -0
rasa/nlu/tokenizers/whitespace_tokenizer.py +106 -0
rasa/nlu/utils/__init__.py +35 -0
rasa/nlu/utils/bilou_utils.py +462 -0
rasa/nlu/utils/hugging_face/__init__.py +0 -0
rasa/nlu/utils/hugging_face/registry.py +108 -0
rasa/nlu/utils/hugging_face/transformers_pre_post_processors.py +311 -0
rasa/nlu/utils/mitie_utils.py +113 -0
rasa/nlu/utils/pattern_utils.py +168 -0
rasa/nlu/utils/spacy_utils.py +312 -0
rasa/plugin.py +90 -0
rasa/server.py +1536 -0
rasa/shared/__init__.py +0 -0
rasa/shared/constants.py +181 -0
rasa/shared/core/__init__.py +0 -0
rasa/shared/core/constants.py +168 -0
rasa/shared/core/conversation.py +46 -0
rasa/shared/core/domain.py +2106 -0
rasa/shared/core/events.py +2507 -0
rasa/shared/core/flows/__init__.py +7 -0
rasa/shared/core/flows/flow.py +353 -0
rasa/shared/core/flows/flow_step.py +146 -0
rasa/shared/core/flows/flow_step_links.py +319 -0
rasa/shared/core/flows/flow_step_sequence.py +70 -0
rasa/shared/core/flows/flows_list.py +211 -0
rasa/shared/core/flows/flows_yaml_schema.json +217 -0
rasa/shared/core/flows/nlu_trigger.py +117 -0
rasa/shared/core/flows/steps/__init__.py +24 -0
rasa/shared/core/flows/steps/action.py +51 -0
rasa/shared/core/flows/steps/call.py +64 -0
rasa/shared/core/flows/steps/collect.py +112 -0
rasa/shared/core/flows/steps/constants.py +5 -0
rasa/shared/core/flows/steps/continuation.py +36 -0
rasa/shared/core/flows/steps/end.py +22 -0
rasa/shared/core/flows/steps/internal.py +44 -0
rasa/shared/core/flows/steps/link.py +51 -0
rasa/shared/core/flows/steps/no_operation.py +48 -0
rasa/shared/core/flows/steps/set_slots.py +50 -0
rasa/shared/core/flows/steps/start.py +30 -0
rasa/shared/core/flows/validation.py +527 -0
rasa/shared/core/flows/yaml_flows_io.py +278 -0
rasa/shared/core/generator.py +907 -0
rasa/shared/core/slot_mappings.py +235 -0
rasa/shared/core/slots.py +647 -0
rasa/shared/core/trackers.py +1159 -0
rasa/shared/core/training_data/__init__.py +0 -0
rasa/shared/core/training_data/loading.py +90 -0
rasa/shared/core/training_data/story_reader/__init__.py +0 -0
rasa/shared/core/training_data/story_reader/story_reader.py +129 -0
rasa/shared/core/training_data/story_reader/story_step_builder.py +168 -0
rasa/shared/core/training_data/story_reader/yaml_story_reader.py +888 -0
rasa/shared/core/training_data/story_writer/__init__.py +0 -0
rasa/shared/core/training_data/story_writer/story_writer.py +76 -0
rasa/shared/core/training_data/story_writer/yaml_story_writer.py +442 -0
rasa/shared/core/training_data/structures.py +838 -0
rasa/shared/core/training_data/visualization.html +146 -0
rasa/shared/core/training_data/visualization.py +603 -0
rasa/shared/data.py +192 -0
rasa/shared/engine/__init__.py +0 -0
rasa/shared/engine/caching.py +26 -0
rasa/shared/exceptions.py +129 -0
rasa/shared/importers/__init__.py +0 -0
rasa/shared/importers/importer.py +705 -0
rasa/shared/importers/multi_project.py +203 -0
rasa/shared/importers/rasa.py +100 -0
rasa/shared/importers/utils.py +34 -0
rasa/shared/nlu/__init__.py +0 -0
rasa/shared/nlu/constants.py +45 -0
rasa/shared/nlu/interpreter.py +10 -0
rasa/shared/nlu/training_data/__init__.py +0 -0
rasa/shared/nlu/training_data/entities_parser.py +209 -0
rasa/shared/nlu/training_data/features.py +374 -0
rasa/shared/nlu/training_data/formats/__init__.py +10 -0
rasa/shared/nlu/training_data/formats/dialogflow.py +162 -0
rasa/shared/nlu/training_data/formats/luis.py +87 -0
rasa/shared/nlu/training_data/formats/rasa.py +135 -0
rasa/shared/nlu/training_data/formats/rasa_yaml.py +605 -0
rasa/shared/nlu/training_data/formats/readerwriter.py +245 -0
rasa/shared/nlu/training_data/formats/wit.py +52 -0
rasa/shared/nlu/training_data/loading.py +137 -0
rasa/shared/nlu/training_data/lookup_tables_parser.py +30 -0
rasa/shared/nlu/training_data/message.py +477 -0
rasa/shared/nlu/training_data/schemas/__init__.py +0 -0
rasa/shared/nlu/training_data/schemas/data_schema.py +85 -0
rasa/shared/nlu/training_data/schemas/nlu.yml +53 -0
rasa/shared/nlu/training_data/schemas/responses.yml +70 -0
rasa/shared/nlu/training_data/synonyms_parser.py +42 -0
rasa/shared/nlu/training_data/training_data.py +732 -0
rasa/shared/nlu/training_data/util.py +223 -0
rasa/shared/providers/__init__.py +0 -0
rasa/shared/providers/openai/__init__.py +0 -0
rasa/shared/providers/openai/clients.py +43 -0
rasa/shared/providers/openai/session_handler.py +110 -0
rasa/shared/utils/__init__.py +0 -0
rasa/shared/utils/cli.py +72 -0
rasa/shared/utils/common.py +308 -0
rasa/shared/utils/constants.py +1 -0
rasa/shared/utils/io.py +403 -0
rasa/shared/utils/llm.py +405 -0
rasa/shared/utils/pykwalify_extensions.py +26 -0
rasa/shared/utils/schemas/__init__.py +0 -0
rasa/shared/utils/schemas/config.yml +2 -0
rasa/shared/utils/schemas/domain.yml +142 -0
rasa/shared/utils/schemas/events.py +212 -0
rasa/shared/utils/schemas/model_config.yml +46 -0
rasa/shared/utils/schemas/stories.yml +173 -0
rasa/shared/utils/yaml.py +777 -0
rasa/studio/__init__.py +0 -0
rasa/studio/auth.py +252 -0
rasa/studio/config.py +127 -0
rasa/studio/constants.py +16 -0
rasa/studio/data_handler.py +352 -0
rasa/studio/download.py +350 -0
rasa/studio/train.py +136 -0
rasa/studio/upload.py +408 -0
rasa/telemetry.py +1583 -0
rasa/tracing/__init__.py +0 -0
rasa/tracing/config.py +338 -0
rasa/tracing/constants.py +38 -0
rasa/tracing/instrumentation/__init__.py +0 -0
rasa/tracing/instrumentation/attribute_extractors.py +663 -0
rasa/tracing/instrumentation/instrumentation.py +939 -0
rasa/tracing/instrumentation/intentless_policy_instrumentation.py +142 -0
rasa/tracing/instrumentation/metrics.py +206 -0
rasa/tracing/metric_instrument_provider.py +125 -0
rasa/utils/__init__.py +0 -0
rasa/utils/beta.py +83 -0
rasa/utils/cli.py +27 -0
rasa/utils/common.py +635 -0
rasa/utils/converter.py +53 -0
rasa/utils/endpoints.py +303 -0
rasa/utils/io.py +326 -0
rasa/utils/licensing.py +319 -0
rasa/utils/log_utils.py +174 -0
rasa/utils/mapper.py +210 -0
rasa/utils/ml_utils.py +145 -0
rasa/utils/plotting.py +362 -0
rasa/utils/singleton.py +23 -0
rasa/utils/tensorflow/__init__.py +0 -0
rasa/utils/tensorflow/callback.py +112 -0
rasa/utils/tensorflow/constants.py +116 -0
rasa/utils/tensorflow/crf.py +492 -0
rasa/utils/tensorflow/data_generator.py +440 -0
rasa/utils/tensorflow/environment.py +161 -0
rasa/utils/tensorflow/exceptions.py +5 -0
rasa/utils/tensorflow/layers.py +1565 -0
rasa/utils/tensorflow/layers_utils.py +113 -0
rasa/utils/tensorflow/metrics.py +281 -0
rasa/utils/tensorflow/model_data.py +991 -0
rasa/utils/tensorflow/model_data_utils.py +500 -0
rasa/utils/tensorflow/models.py +936 -0
rasa/utils/tensorflow/rasa_layers.py +1094 -0
rasa/utils/tensorflow/transformer.py +640 -0
rasa/utils/tensorflow/types.py +6 -0
rasa/utils/train_utils.py +572 -0
rasa/utils/yaml.py +54 -0
rasa/validator.py +1035 -0
rasa/version.py +3 -0
rasa_pro-3.8.16.dist-info/METADATA +528 -0
rasa_pro-3.8.16.dist-info/NOTICE +5 -0
rasa_pro-3.8.16.dist-info/RECORD +644 -0
rasa_pro-3.8.16.dist-info/WHEEL +4 -0
rasa_pro-3.8.16.dist-info/entry_points.txt +3 -0

rasa/core/test.py ADDED Viewed

@@ -0,0 +1,1337 @@
+import logging
+import os
+from pathlib import Path
+import tempfile
+import warnings as pywarnings
+from collections import defaultdict, namedtuple
+from typing import Any, Dict, List, Optional, Text, Tuple, TYPE_CHECKING, cast
+from rasa import telemetry
+from rasa.core.constants import (
+    CONFUSION_MATRIX_STORIES_FILE,
+    REPORT_STORIES_FILE,
+    FAILED_STORIES_FILE,
+    SUCCESSFUL_STORIES_FILE,
+    STORIES_WITH_WARNINGS_FILE,
+)
+from rasa.core.channels import UserMessage
+from rasa.core.policies.policy import PolicyPrediction
+from rasa.nlu.test import EntityEvaluationResult, evaluate_entities
+from rasa.nlu.tokenizers.tokenizer import Token
+from rasa.shared.constants import ROUTE_TO_CALM_SLOT
+from rasa.shared.core.constants import (
+    POLICIES_THAT_EXTRACT_ENTITIES,
+    ACTION_UNLIKELY_INTENT_NAME,
+)
+from rasa.shared.exceptions import RasaException
+import rasa.shared.utils.io
+from rasa.shared.core.training_data.story_writer.yaml_story_writer import (
+    YAMLStoryWriter,
+)
+from rasa.shared.core.training_data.structures import StoryStep
+from rasa.shared.core.domain import Domain
+from rasa.nlu.constants import (
+    RESPONSE_SELECTOR_DEFAULT_INTENT,
+    RESPONSE_SELECTOR_RETRIEVAL_INTENTS,
+    TOKENS_NAMES,
+    RESPONSE_SELECTOR_PROPERTY_NAME,
+)
+from rasa.shared.nlu.constants import (
+    INTENT,
+    ENTITIES,
+    ENTITY_ATTRIBUTE_VALUE,
+    ENTITY_ATTRIBUTE_START,
+    ENTITY_ATTRIBUTE_END,
+    EXTRACTOR,
+    ENTITY_ATTRIBUTE_TYPE,
+    INTENT_RESPONSE_KEY,
+    INTENT_NAME_KEY,
+    RESPONSE,
+    RESPONSE_SELECTOR,
+    FULL_RETRIEVAL_INTENT_NAME_KEY,
+    TEXT,
+    ENTITY_ATTRIBUTE_TEXT,
+)
+from rasa.constants import RESULTS_FILE, PERCENTAGE_KEY
+from rasa.shared.core.events import ActionExecuted, EntitiesAdded, UserUttered, SlotSet
+from rasa.shared.core.trackers import DialogueStateTracker
+from rasa.shared.nlu.training_data.formats.readerwriter import TrainingDataWriter
+from rasa.shared.importers.importer import TrainingDataImporter
+from rasa.shared.utils.io import DEFAULT_ENCODING
+from rasa.utils.tensorflow.constants import QUERY_INTENT_KEY, SEVERITY_KEY
+from rasa.exceptions import ActionLimitReached
+from rasa.core.actions.action import ActionRetrieveResponse
+if TYPE_CHECKING:
+    from rasa.core.agent import Agent
+    from rasa.core.processor import MessageProcessor
+    from rasa.shared.core.generator import TrainingDataGenerator
+    from rasa.shared.core.events import Event, EntityPrediction
+logger = logging.getLogger(__name__)
+StoryEvaluation = namedtuple(
+    "StoryEvaluation",
+    [
+        "evaluation_store",
+        "failed_stories",
+        "successful_stories",
+        "stories_with_warnings",
+        "action_list",
+        "in_training_data_fraction",
+    ],
+)
+PredictionList = List[Optional[Text]]
+class WrongPredictionException(RasaException, ValueError):
+    """Raised if a wrong prediction is encountered."""
+class WarningPredictedAction(ActionExecuted):
+    """The model predicted the correct action with warning."""
+    type_name = "warning_predicted"
+    def __init__(
+        self,
+        action_name_prediction: Text,
+        action_name: Optional[Text] = None,
+        policy: Optional[Text] = None,
+        confidence: Optional[float] = None,
+        timestamp: Optional[float] = None,
+        metadata: Optional[Dict] = None,
+    ):
+        """Creates event `action_unlikely_intent` predicted as warning.
+        See the docstring of the parent class for more information.
+        """
+        self.action_name_prediction = action_name_prediction
+        super().__init__(action_name, policy, confidence, timestamp, metadata)
+    def inline_comment(self, **kwargs: Any) -> Text:
+        """A comment attached to this event. Used during dumping."""
+        return f"predicted: {self.action_name_prediction}"
+class WronglyPredictedAction(ActionExecuted):
+    """The model predicted the wrong action.
+    Mostly used to mark wrong predictions and be able to
+    dump them as stories.
+    """
+    type_name = "wrong_action"
+    def __init__(
+        self,
+        action_name_target: Text,
+        action_text_target: Text,
+        action_name_prediction: Text,
+        policy: Optional[Text] = None,
+        confidence: Optional[float] = None,
+        timestamp: Optional[float] = None,
+        metadata: Optional[Dict] = None,
+        predicted_action_unlikely_intent: bool = False,
+    ) -> None:
+        """Creates event for a successful event execution.
+        See the docstring of the parent class `ActionExecuted` for more information.
+        """
+        self.action_name_prediction = action_name_prediction
+        self.predicted_action_unlikely_intent = predicted_action_unlikely_intent
+        super().__init__(
+            action_name_target,
+            policy,
+            confidence,
+            timestamp,
+            metadata,
+            action_text=action_text_target,
+        )
+    def inline_comment(self, **kwargs: Any) -> Text:
+        """A comment attached to this event. Used during dumping."""
+        comment = f"predicted: {self.action_name_prediction}"
+        if self.predicted_action_unlikely_intent:
+            return f"{comment} after {ACTION_UNLIKELY_INTENT_NAME}"
+        return comment
+    def as_story_string(self) -> Text:
+        """Returns the story equivalent representation."""
+        return f"{self.action_name}   <!-- {self.inline_comment()} -->"
+    def __repr__(self) -> Text:
+        """Returns event as string for debugging."""
+        return (
+            f"WronglyPredictedAction(action_target: {self.action_name}, "
+            f"action_prediction: {self.action_name_prediction}, "
+            f"policy: {self.policy}, confidence: {self.confidence}, "
+            f"metadata: {self.metadata})"
+        )
+class EvaluationStore:
+    """Class storing action, intent and entity predictions and targets."""
+    def __init__(
+        self,
+        action_predictions: Optional[PredictionList] = None,
+        action_targets: Optional[PredictionList] = None,
+        intent_predictions: Optional[PredictionList] = None,
+        intent_targets: Optional[PredictionList] = None,
+        entity_predictions: Optional[List["EntityPrediction"]] = None,
+        entity_targets: Optional[List["EntityPrediction"]] = None,
+    ) -> None:
+        """Initialize store attributes."""
+        self.action_predictions = action_predictions or []
+        self.action_targets = action_targets or []
+        self.intent_predictions = intent_predictions or []
+        self.intent_targets = intent_targets or []
+        self.entity_predictions: List["EntityPrediction"] = entity_predictions or []
+        self.entity_targets: List["EntityPrediction"] = entity_targets or []
+    def add_to_store(
+        self,
+        action_predictions: Optional[PredictionList] = None,
+        action_targets: Optional[PredictionList] = None,
+        intent_predictions: Optional[PredictionList] = None,
+        intent_targets: Optional[PredictionList] = None,
+        entity_predictions: Optional[List["EntityPrediction"]] = None,
+        entity_targets: Optional[List["EntityPrediction"]] = None,
+    ) -> None:
+        """Add items or lists of items to the store."""
+        self.action_predictions.extend(action_predictions or [])
+        self.action_targets.extend(action_targets or [])
+        self.intent_targets.extend(intent_targets or [])
+        self.intent_predictions.extend(intent_predictions or [])
+        self.entity_predictions.extend(entity_predictions or [])
+        self.entity_targets.extend(entity_targets or [])
+    def merge_store(self, other: "EvaluationStore") -> None:
+        """Add the contents of other to self."""
+        self.add_to_store(
+            action_predictions=other.action_predictions,
+            action_targets=other.action_targets,
+            intent_predictions=other.intent_predictions,
+            intent_targets=other.intent_targets,
+            entity_predictions=other.entity_predictions,
+            entity_targets=other.entity_targets,
+        )
+    def _check_entity_prediction_target_mismatch(self) -> bool:
+        """Checks that same entities were expected and actually extracted.
+        Possible duplicates or differences in order should not matter.
+        """
+        deduplicated_targets = set(
+            tuple(entity.items()) for entity in self.entity_targets
+        )
+        deduplicated_predictions = set(
+            tuple(entity.items()) for entity in self.entity_predictions
+        )
+        return deduplicated_targets != deduplicated_predictions
+    def check_prediction_target_mismatch(self) -> bool:
+        """Checks if intent, entity or action predictions don't match expected ones."""
+        return (
+            self.intent_predictions != self.intent_targets
+            or self._check_entity_prediction_target_mismatch()
+            or self.action_predictions != self.action_targets
+        )
+    @staticmethod
+    def _compare_entities(
+        entity_predictions: List["EntityPrediction"],
+        entity_targets: List["EntityPrediction"],
+        i_pred: int,
+        i_target: int,
+    ) -> int:
+        """Picks the fist entity from the current predicted and target entities.
+        If the predicted entity comes first it returns -1,
+        while it returns 1 if the target entity comes first.
+        If target and predicted are aligned it returns 0.
+        """
+        pred = None
+        target = None
+        if i_pred < len(entity_predictions):
+            pred = entity_predictions[i_pred]
+        if i_target < len(entity_targets):
+            target = entity_targets[i_target]
+        if target and pred:
+            # Check which entity has the lower "start" value
+            if pred.get(ENTITY_ATTRIBUTE_START) < target.get(ENTITY_ATTRIBUTE_START):
+                return -1
+            elif target.get(ENTITY_ATTRIBUTE_START) < pred.get(ENTITY_ATTRIBUTE_START):
+                return 1
+            else:
+                # Since both have the same "start" values,
+                # check which one has the lower "end" value
+                if pred.get(ENTITY_ATTRIBUTE_END) < target.get(ENTITY_ATTRIBUTE_END):
+                    return -1
+                elif target.get(ENTITY_ATTRIBUTE_END) < pred.get(ENTITY_ATTRIBUTE_END):
+                    return 1
+                else:
+                    # The entities have the same "start" and "end" values
+                    return 0
+        return 1 if target else -1
+    @staticmethod
+    def _generate_entity_training_data(entity: Dict[Text, Any]) -> Text:
+        return TrainingDataWriter.generate_entity(entity.get("text"), entity)
+    def serialise(self) -> Tuple[PredictionList, PredictionList]:
+        """Turn targets and predictions to lists of equal size for sklearn."""
+        texts = sorted(
+            set(
+                [str(e.get("text", "")) for e in self.entity_targets]
+                + [str(e.get("text", "")) for e in self.entity_predictions]
+            )
+        )
+        aligned_entity_targets: List[Optional[Text]] = []
+        aligned_entity_predictions: List[Optional[Text]] = []
+        for text in texts:
+            # sort the entities of this sentence to compare them directly
+            entity_targets = sorted(
+                filter(
+                    lambda x: x.get(ENTITY_ATTRIBUTE_TEXT) == text, self.entity_targets
+                ),
+                key=lambda x: x[ENTITY_ATTRIBUTE_START],  # type: ignore[literal-required] # noqa: E501
+            )
+            entity_predictions = sorted(
+                filter(
+                    lambda x: x.get(ENTITY_ATTRIBUTE_TEXT) == text,
+                    self.entity_predictions,
+                ),
+                key=lambda x: x[ENTITY_ATTRIBUTE_START],  # type: ignore[literal-required] # noqa: E501
+            )
+            i_pred, i_target = 0, 0
+            while i_pred < len(entity_predictions) or i_target < len(entity_targets):
+                cmp = self._compare_entities(
+                    entity_predictions, entity_targets, i_pred, i_target
+                )
+                if cmp == -1:  # predicted comes first
+                    aligned_entity_predictions.append(
+                        self._generate_entity_training_data(entity_predictions[i_pred])
+                    )
+                    aligned_entity_targets.append("None")
+                    i_pred += 1
+                elif cmp == 1:  # target entity comes first
+                    aligned_entity_targets.append(
+                        self._generate_entity_training_data(entity_targets[i_target])
+                    )
+                    aligned_entity_predictions.append("None")
+                    i_target += 1
+                else:  # target and predicted entity are aligned
+                    aligned_entity_predictions.append(
+                        self._generate_entity_training_data(entity_predictions[i_pred])
+                    )
+                    aligned_entity_targets.append(
+                        self._generate_entity_training_data(entity_targets[i_target])
+                    )
+                    i_pred += 1
+                    i_target += 1
+        targets = self.action_targets + self.intent_targets + aligned_entity_targets
+        predictions = (
+            self.action_predictions
+            + self.intent_predictions
+            + aligned_entity_predictions
+        )
+        return targets, predictions
+class EndToEndUserUtterance(UserUttered):
+    """End-to-end user utterance.
+    Mostly used to print the full end-to-end user message in the
+    `failed_test_stories.yml` output file.
+    """
+    def as_story_string(self, e2e: bool = True) -> Text:
+        """Returns the story equivalent representation."""
+        return super().as_story_string(e2e=True)
+class WronglyClassifiedUserUtterance(UserUttered):
+    """The NLU model predicted the wrong user utterance.
+    Mostly used to mark wrong predictions and be able to
+    dump them as stories.
+    """
+    type_name = "wrong_utterance"
+    def __init__(self, event: UserUttered, eval_store: EvaluationStore) -> None:
+        """Set `predicted_intent` and `predicted_entities` attributes."""
+        try:
+            self.predicted_intent = eval_store.intent_predictions[0]
+        except LookupError:
+            self.predicted_intent = None
+        self.target_entities = eval_store.entity_targets
+        self.predicted_entities = eval_store.entity_predictions
+        intent = {"name": eval_store.intent_targets[0]}
+        super().__init__(
+            event.text,
+            intent,
+            eval_store.entity_targets,
+            event.parse_data,
+            event.timestamp,
+            event.input_channel,
+        )
+    def inline_comment(self, force_comment_generation: bool = False) -> Optional[Text]:
+        """A comment attached to this event. Used during dumping."""
+        from rasa.shared.core.events import format_message
+        if force_comment_generation or self.predicted_intent != self.intent["name"]:
+            predicted_message = format_message(
+                self.text, self.predicted_intent, self.predicted_entities
+            )
+            return f"predicted: {self.predicted_intent}: {predicted_message}"
+        else:
+            return None
+    @staticmethod
+    def inline_comment_for_entity(
+        predicted: Dict[Text, Any], entity: Dict[Text, Any]
+    ) -> Optional[Text]:
+        """Returns the predicted entity which is then printed as a comment."""
+        if predicted["entity"] != entity["entity"]:
+            return "predicted: " + predicted["entity"] + ": " + predicted["value"]
+        else:
+            return None
+    def as_story_string(self, e2e: bool = True) -> Text:
+        """Returns text representation of event."""
+        from rasa.shared.core.events import format_message
+        correct_message = format_message(
+            self.text, self.intent.get("name"), self.entities
+        )
+        return (
+            f"{self.intent.get('name')}: {correct_message}   "
+            f"<!-- {self.inline_comment()} -->"
+        )
+def _create_data_generator(
+    resource_name: Text,
+    agent: "Agent",
+    max_stories: Optional[int] = None,
+    use_conversation_test_files: bool = False,
+) -> "TrainingDataGenerator":
+    from rasa.shared.core.generator import TrainingDataGenerator
+    tmp_domain_path = Path(tempfile.mkdtemp()) / "domain.yaml"
+    domain = agent.domain if agent.domain is not None else Domain.empty()
+    domain.persist(tmp_domain_path)
+    test_data_importer = TrainingDataImporter.load_from_dict(
+        training_data_paths=[resource_name], domain_path=str(tmp_domain_path)
+    )
+    if use_conversation_test_files:
+        story_graph = test_data_importer.get_conversation_tests()
+    else:
+        story_graph = test_data_importer.get_stories()
+    return TrainingDataGenerator(
+        story_graph,
+        agent.domain,
+        use_story_concatenation=False,
+        augmentation_factor=0,
+        tracker_limit=max_stories,
+    )
+def _clean_entity_results(
+    text: Text, entity_results: List[Dict[Text, Any]]
+) -> List["EntityPrediction"]:
+    """Extract only the token variables from an entity dict."""
+    cleaned_entities = []
+    for r in tuple(entity_results):
+        cleaned_entity: EntityPrediction = {ENTITY_ATTRIBUTE_TEXT: text}  # type: ignore[misc]  # noqa E501
+        for k in (
+            ENTITY_ATTRIBUTE_START,
+            ENTITY_ATTRIBUTE_END,
+            ENTITY_ATTRIBUTE_TYPE,
+            ENTITY_ATTRIBUTE_VALUE,
+        ):
+            if k in set(r):
+                if k == ENTITY_ATTRIBUTE_VALUE and EXTRACTOR in set(r):
+                    # convert values to strings for evaluation as
+                    # target values are all of type string
+                    r[k] = str(r[k])
+                cleaned_entity[k] = r[k]  # type: ignore[literal-required]
+        cleaned_entities.append(cleaned_entity)
+    return cleaned_entities
+def _get_full_retrieval_intent(parsed: Dict[Text, Any]) -> Text:
+    """Return full retrieval intent, if it's present, or normal intent otherwise.
+    Args:
+        parsed: Predicted parsed data.
+    Returns:
+        The extracted intent.
+    """
+    base_intent = parsed.get(INTENT, {}).get(INTENT_NAME_KEY)
+    response_selector = parsed.get(RESPONSE_SELECTOR, {})
+    # return normal intent if it's not a retrieval intent
+    if base_intent not in response_selector.get(
+        RESPONSE_SELECTOR_RETRIEVAL_INTENTS, {}
+    ):
+        return base_intent
+    # extract full retrieval intent
+    # if the response selector parameter was not specified in config,
+    # the response selector contains a "default" key
+    if RESPONSE_SELECTOR_DEFAULT_INTENT in response_selector:
+        full_retrieval_intent = (
+            response_selector.get(RESPONSE_SELECTOR_DEFAULT_INTENT, {})
+            .get(RESPONSE, {})
+            .get(INTENT_RESPONSE_KEY)
+        )
+        return full_retrieval_intent if full_retrieval_intent else base_intent
+    # if specified, the response selector contains the base intent as key
+    full_retrieval_intent = (
+        response_selector.get(base_intent, {})
+        .get(RESPONSE, {})
+        .get(INTENT_RESPONSE_KEY)
+    )
+    return full_retrieval_intent if full_retrieval_intent else base_intent
+def _collect_user_uttered_predictions(
+    event: UserUttered,
+    predicted: Dict[Text, Any],
+    partial_tracker: DialogueStateTracker,
+    fail_on_prediction_errors: bool,
+) -> EvaluationStore:
+    user_uttered_eval_store = EvaluationStore()
+    # intent from the test story, may either be base intent or full retrieval intent
+    base_intent = event.intent.get(INTENT_NAME_KEY)
+    full_retrieval_intent = event.intent.get(FULL_RETRIEVAL_INTENT_NAME_KEY)
+    intent_gold = full_retrieval_intent if full_retrieval_intent else base_intent
+    # predicted intent: note that this is only the base intent at this point
+    predicted_base_intent = predicted.get(INTENT, {}).get(INTENT_NAME_KEY)
+    # if the test story only provides the base intent AND the prediction was correct,
+    # we are not interested in full retrieval intents and skip this section.
+    # In any other case we are interested in the full retrieval intent (e.g. for report)
+    if intent_gold != predicted_base_intent:
+        predicted_base_intent = _get_full_retrieval_intent(predicted)
+    user_uttered_eval_store.add_to_store(
+        intent_targets=[intent_gold], intent_predictions=[predicted_base_intent]
+    )
+    entity_gold = event.entities
+    predicted_entities = predicted.get(ENTITIES)
+    if entity_gold or predicted_entities:
+        user_uttered_eval_store.add_to_store(
+            entity_targets=_clean_entity_results(event.text, entity_gold),
+            entity_predictions=_clean_entity_results(event.text, predicted_entities),
+        )
+    if user_uttered_eval_store.check_prediction_target_mismatch():
+        partial_tracker.update(
+            WronglyClassifiedUserUtterance(event, user_uttered_eval_store)
+        )
+        if fail_on_prediction_errors:
+            story_dump = YAMLStoryWriter().dumps(partial_tracker.as_story().story_steps)
+            raise WrongPredictionException(
+                f"NLU model predicted a wrong intent or entities. Failed Story:"
+                f" \n\n{story_dump}"
+            )
+    else:
+        response_selector_info = (
+            {
+                RESPONSE_SELECTOR_PROPERTY_NAME: predicted[
+                    RESPONSE_SELECTOR_PROPERTY_NAME
+                ]
+            }
+            if RESPONSE_SELECTOR_PROPERTY_NAME in predicted
+            else None
+        )
+        end_to_end_user_utterance = EndToEndUserUtterance(
+            text=event.text,
+            intent=event.intent,
+            entities=event.entities,
+            parse_data=response_selector_info,
+        )
+        partial_tracker.update(end_to_end_user_utterance)
+    return user_uttered_eval_store
+def emulate_loop_rejection(partial_tracker: DialogueStateTracker) -> None:
+    """Add `ActionExecutionRejected` event to the tracker.
+    During evaluation, we don't run action server, therefore in order to correctly
+    test unhappy paths of the loops, we need to emulate loop rejection.
+    Args:
+        partial_tracker: a :class:`rasa.core.trackers.DialogueStateTracker`
+    """
+    from rasa.shared.core.events import ActionExecutionRejected
+    rejected_action_name = partial_tracker.active_loop_name
+    partial_tracker.update(ActionExecutionRejected(rejected_action_name))
+async def _get_e2e_entity_evaluation_result(
+    processor: "MessageProcessor",
+    tracker: DialogueStateTracker,
+    prediction: PolicyPrediction,
+) -> Optional[EntityEvaluationResult]:
+    previous_event: Optional["Event"] = tracker.events[-1]
+    if isinstance(previous_event, SlotSet):
+        # UserUttered events with entities can be followed by SlotSet events
+        # if slots are defined in the domain
+        previous_event = tracker.get_last_event_for((UserUttered, ActionExecuted))
+    if isinstance(previous_event, UserUttered):
+        entities_predicted_by_policies = [
+            entity
+            for prediction_event in prediction.events
+            if isinstance(prediction_event, EntitiesAdded)
+            for entity in prediction_event.entities
+        ]
+        entity_targets = previous_event.entities
+        if entity_targets or entities_predicted_by_policies:
+            text = previous_event.text
+            if text:
+                parsed_message = await processor.parse_message(UserMessage(text=text))
+                if parsed_message:
+                    tokens = [
+                        Token(text[start:end], start, end)
+                        for start, end in parsed_message.get(TOKENS_NAMES[TEXT], [])
+                    ]
+                    return EntityEvaluationResult(
+                        entity_targets, entities_predicted_by_policies, tokens, text
+                    )
+    return None
+def _get_predicted_action_name(
+    predicted_action: rasa.core.actions.action.Action,
+    partial_tracker: DialogueStateTracker,
+    expected_action_name: Text,
+) -> Text:
+    """Get the name of predicted action.
+    If the action is instance of `ActionRetrieveResponse`, we need to return full
+    action name with its retrieval intent (e.g. utter_faq/is-this-legit).
+    The only case when we should not do it is when an expected action given in
+    a test story is a retrieval action but it's not specified in the test story.
+    To illustrate this, we're basically avoiding this unnecessary mismatch:
+    utter_faq (expected) != utter_faq/is-this-legit (predicted).
+    In this case or if the action isn't instance of `ActionRetrieveResponse`,
+    the function returns only the action name (e.g. utter_faq).
+    """
+    if (
+        isinstance(predicted_action, ActionRetrieveResponse)
+        and expected_action_name != predicted_action.name()
+    ):
+        full_retrieval_name = predicted_action.get_full_retrieval_name(partial_tracker)
+        predicted_action_name = (
+            full_retrieval_name if full_retrieval_name else predicted_action.name()
+        )
+    else:
+        predicted_action_name = predicted_action.name()
+    return predicted_action_name
+async def _run_action_prediction(
+    processor: "MessageProcessor",
+    partial_tracker: DialogueStateTracker,
+    expected_action: Text,
+) -> Tuple[Text, PolicyPrediction, Optional[EntityEvaluationResult]]:
+    action, prediction = await processor.predict_next_with_tracker_if_should(
+        partial_tracker
+    )
+    predicted_action = _get_predicted_action_name(
+        action, partial_tracker, expected_action
+    )
+    policy_entity_result = await _get_e2e_entity_evaluation_result(
+        processor, partial_tracker, prediction
+    )
+    if (
+        prediction.policy_name
+        and predicted_action != expected_action
+        and _form_might_have_been_rejected(
+            processor.domain, partial_tracker, predicted_action
+        )
+    ):
+        # Wrong action was predicted,
+        # but it might be Ok if form action is rejected.
+        emulate_loop_rejection(partial_tracker)
+        # try again
+        action, prediction = await processor.predict_next_with_tracker_if_should(
+            partial_tracker
+        )
+        # Even if the prediction is also wrong, we don't have to undo the emulation
+        # of the action rejection as we know that the user explicitly specified
+        # that something else than the form was supposed to run.
+        predicted_action = _get_predicted_action_name(
+            action, partial_tracker, expected_action
+        )
+    return predicted_action, prediction, policy_entity_result
+async def _collect_action_executed_predictions(
+    processor: "MessageProcessor",
+    partial_tracker: DialogueStateTracker,
+    event: ActionExecuted,
+    fail_on_prediction_errors: bool,
+) -> Tuple[EvaluationStore, PolicyPrediction, Optional[EntityEvaluationResult]]:
+    action_executed_eval_store = EvaluationStore()
+    expected_action_name = event.action_name
+    expected_action_text = event.action_text
+    expected_action = expected_action_name or expected_action_text
+    policy_entity_result = None
+    prev_action_unlikely_intent = False
+    try:
+        (
+            predicted_action,
+            prediction,
+            policy_entity_result,
+        ) = await _run_action_prediction(processor, partial_tracker, expected_action)
+    except ActionLimitReached:
+        prediction = PolicyPrediction([], policy_name=None)
+        predicted_action = "circuit breaker tripped"
+    predicted_action_unlikely_intent = predicted_action == ACTION_UNLIKELY_INTENT_NAME
+    if predicted_action_unlikely_intent and predicted_action != expected_action:
+        partial_tracker.update(
+            WronglyPredictedAction(
+                predicted_action,
+                expected_action_text,
+                predicted_action,
+                prediction.policy_name,
+                prediction.max_confidence,
+                event.timestamp,
+                metadata=prediction.action_metadata,
+            )
+        )
+        prev_action_unlikely_intent = True
+        try:
+            (
+                predicted_action,
+                prediction,
+                policy_entity_result,
+            ) = await _run_action_prediction(
+                processor, partial_tracker, expected_action
+            )
+        except ActionLimitReached:
+            prediction = PolicyPrediction([], policy_name=None)
+            predicted_action = "circuit breaker tripped"
+    action_executed_eval_store.add_to_store(
+        action_predictions=[predicted_action], action_targets=[expected_action]
+    )
+    if action_executed_eval_store.check_prediction_target_mismatch():
+        partial_tracker.update(
+            WronglyPredictedAction(
+                expected_action_name,
+                expected_action_text,
+                predicted_action,
+                prediction.policy_name,
+                prediction.max_confidence,
+                event.timestamp,
+                metadata=prediction.action_metadata,
+                predicted_action_unlikely_intent=prev_action_unlikely_intent,
+            )
+        )
+        if (
+            fail_on_prediction_errors
+            and predicted_action != ACTION_UNLIKELY_INTENT_NAME
+            and predicted_action != expected_action
+        ):
+            story_dump = YAMLStoryWriter().dumps(partial_tracker.as_story().story_steps)
+            error_msg = (
+                f"Model predicted a wrong action. Failed Story: " f"\n\n{story_dump}"
+            )
+            raise WrongPredictionException(error_msg)
+    elif prev_action_unlikely_intent:
+        partial_tracker.update(
+            WarningPredictedAction(
+                ACTION_UNLIKELY_INTENT_NAME,
+                predicted_action,
+                prediction.policy_name,
+                prediction.max_confidence,
+                event.timestamp,
+                prediction.action_metadata,
+            )
+        )
+    else:
+        partial_tracker.update(
+            ActionExecuted(
+                predicted_action,
+                prediction.policy_name,
+                prediction.max_confidence,
+                event.timestamp,
+                metadata=prediction.action_metadata,
+            )
+        )
+    return action_executed_eval_store, prediction, policy_entity_result
+def _form_might_have_been_rejected(
+    domain: Domain, tracker: DialogueStateTracker, predicted_action_name: Text
+) -> bool:
+    return (
+        tracker.active_loop_name == predicted_action_name
+        and predicted_action_name in domain.form_names
+    )
+async def _predict_tracker_actions(
+    tracker: DialogueStateTracker,
+    agent: "Agent",
+    fail_on_prediction_errors: bool = False,
+    use_e2e: bool = False,
+) -> Tuple[
+    EvaluationStore,
+    DialogueStateTracker,
+    List[Dict[Text, Any]],
+    List[EntityEvaluationResult],
+]:
+    processor = agent.processor
+    if agent.processor is not None:
+        processor = agent.processor
+    else:
+        raise RasaException(
+            "The agent's processor has not been instantiated. "
+            "The processor needs to be defined before running "
+            "prediction."
+        )
+    tracker_eval_store = EvaluationStore()
+    events = list(tracker.events)
+    slots = agent.domain.slots if agent.domain is not None else []
+    partial_tracker = DialogueStateTracker.from_events(
+        tracker.sender_id,
+        events[:1],
+        slots,
+        sender_source=tracker.sender_source,
+    )
+    tracker_actions = []
+    policy_entity_results = []
+    for event in events[1:]:
+        if isinstance(event, ActionExecuted):
+            (
+                action_executed_result,
+                prediction,
+                entity_result,
+            ) = await _collect_action_executed_predictions(
+                processor, partial_tracker, event, fail_on_prediction_errors
+            )
+            if entity_result:
+                policy_entity_results.append(entity_result)
+            if action_executed_result.action_targets:
+                tracker_eval_store.merge_store(action_executed_result)
+                tracker_actions.append(
+                    {
+                        "action": action_executed_result.action_targets[0],
+                        "predicted": action_executed_result.action_predictions[0],
+                        "policy": prediction.policy_name,
+                        "confidence": prediction.max_confidence,
+                    }
+                )
+        elif use_e2e and isinstance(event, UserUttered):
+            # This means that user utterance didn't have a user message, only intent,
+            # so we can skip the NLU part and take the parse data directly.
+            # Indirectly that means that the test story was in YAML format.
+            if not event.text:
+                # FIXME: better type annotation for `parse_data` would require
+                # a larger refactoring (e.g. switch to dataclass)
+                predicted = cast(Dict[Text, Any], event.parse_data)
+            # Indirectly that means that the test story was either:
+            # in YAML format containing a user message, or in Markdown format.
+            # Leaving that as it is because Markdown is in legacy mode.
+            else:
+                predicted = await processor.parse_message(UserMessage(event.text))
+            user_uttered_result = _collect_user_uttered_predictions(
+                event, predicted, partial_tracker, fail_on_prediction_errors
+            )
+            tracker_eval_store.merge_store(user_uttered_result)
+        else:
+            partial_tracker.update(event)
+    return tracker_eval_store, partial_tracker, tracker_actions, policy_entity_results
+def _in_training_data_fraction(action_list: List[Dict[Text, Any]]) -> float:
+    """Given a list of actions, returns the fraction predicted by non ML policies."""
+    import rasa.core.policies.ensemble
+    in_training_data = [
+        a["action"]
+        for a in action_list
+        if a["policy"]
+        and not rasa.core.policies.ensemble.is_not_in_training_data(a["policy"])
+    ]
+    return len(in_training_data) / len(action_list) if action_list else 0
+def _sort_trackers_with_severity_of_warning(
+    trackers_to_sort: List[DialogueStateTracker],
+) -> List[DialogueStateTracker]:
+    """Sort the given trackers according to 'severity' of `action_unlikely_intent`.
+    Severity is calculated by `IntentTEDPolicy` and is attached as
+    metadata to `ActionExecuted` event.
+    Args:
+        trackers_to_sort: Trackers to be sorted
+    Returns:
+        Sorted trackers in descending order of severity.
+    """
+    tracker_severity_scores = []
+    for tracker in trackers_to_sort:
+        max_severity = 0
+        for event in tracker.applied_events():
+            if (
+                isinstance(event, WronglyPredictedAction)
+                and event.action_name_prediction == ACTION_UNLIKELY_INTENT_NAME
+            ):
+                max_severity = max(
+                    max_severity,
+                    event.metadata.get(QUERY_INTENT_KEY, {}).get(SEVERITY_KEY, 0),
+                )
+        tracker_severity_scores.append(max_severity)
+    sorted_trackers_with_severity = sorted(
+        zip(tracker_severity_scores, trackers_to_sort),
+        # tuple unpacking is not supported in
+        # python 3.x that's why it might look a bit weird
+        key=lambda severity_tracker_tuple: -severity_tracker_tuple[0],
+    )
+    return [tracker for (_, tracker) in sorted_trackers_with_severity]
+async def _collect_story_predictions(
+    completed_trackers: List["DialogueStateTracker"],
+    agent: "Agent",
+    fail_on_prediction_errors: bool = False,
+    use_e2e: bool = False,
+) -> Tuple[StoryEvaluation, int, List[EntityEvaluationResult]]:
+    """Test the stories from a file, running them through the stored model."""
+    from sklearn.metrics import accuracy_score
+    from tqdm import tqdm
+    story_eval_store = EvaluationStore()
+    failed_stories = []
+    successful_stories = []
+    stories_with_warnings = []
+    correct_dialogues = []
+    number_of_stories = len(completed_trackers)
+    logger.info(f"Evaluating {number_of_stories} stories\nProgress:")
+    action_list = []
+    entity_results = []
+    if agent.domain:
+        for slot in agent.domain.slots:
+            # set the routing slot to False in case the coexistence feature is used
+            # this way the DM1 policies will run and the CALM policies will keep silent
+            if slot.name == ROUTE_TO_CALM_SLOT:
+                slot.initial_value = False
+    for tracker in tqdm(completed_trackers):
+        (
+            tracker_results,
+            predicted_tracker,
+            tracker_actions,
+            tracker_entity_results,
+        ) = await _predict_tracker_actions(
+            tracker, agent, fail_on_prediction_errors, use_e2e
+        )
+        entity_results.extend(tracker_entity_results)
+        story_eval_store.merge_store(tracker_results)
+        action_list.extend(tracker_actions)
+        if tracker_results.check_prediction_target_mismatch():
+            # there is at least one wrong prediction
+            failed_stories.append(predicted_tracker)
+            correct_dialogues.append(0)
+        else:
+            successful_stories.append(predicted_tracker)
+            correct_dialogues.append(1)
+            if any(
+                isinstance(event, WronglyPredictedAction)
+                and event.action_name_prediction == ACTION_UNLIKELY_INTENT_NAME
+                for event in predicted_tracker.events
+            ):
+                stories_with_warnings.append(predicted_tracker)
+    logger.info("Finished collecting predictions.")
+    in_training_data_fraction = _in_training_data_fraction(action_list)
+    if len(correct_dialogues):
+        accuracy = accuracy_score([1] * len(correct_dialogues), correct_dialogues)
+    else:
+        accuracy = 0
+    _log_evaluation_table([1] * len(completed_trackers), "CONVERSATION", accuracy)
+    return (
+        StoryEvaluation(
+            evaluation_store=story_eval_store,
+            failed_stories=failed_stories,
+            successful_stories=successful_stories,
+            stories_with_warnings=_sort_trackers_with_severity_of_warning(
+                stories_with_warnings
+            ),
+            action_list=action_list,
+            in_training_data_fraction=in_training_data_fraction,
+        ),
+        number_of_stories,
+        entity_results,
+    )
+def _filter_step_events(step: StoryStep) -> StoryStep:
+    events = []
+    for event in step.events:
+        if (
+            isinstance(event, WronglyPredictedAction)
+            and event.action_name
+            == event.action_name_prediction
+            == ACTION_UNLIKELY_INTENT_NAME
+        ):
+            continue
+        events.append(event)
+    updated_step = step.create_copy(use_new_id=False)
+    updated_step.events = events
+    return updated_step
+def _log_stories(
+    trackers: List[DialogueStateTracker], file_path: Text, message_if_no_trackers: Text
+) -> None:
+    """Write given stories to the given file."""
+    with open(file_path, "w", encoding=DEFAULT_ENCODING) as f:
+        if not trackers:
+            f.write(f"# {message_if_no_trackers}")
+        else:
+            stories = [tracker.as_story(include_source=True) for tracker in trackers]
+            steps = [
+                _filter_step_events(step)
+                for story in stories
+                for step in story.story_steps
+            ]
+            f.write(YAMLStoryWriter().dumps(steps))
+async def test(
+    stories: Text,
+    agent: "Agent",
+    max_stories: Optional[int] = None,
+    out_directory: Optional[Text] = None,
+    fail_on_prediction_errors: bool = False,
+    e2e: bool = False,
+    disable_plotting: bool = False,
+    successes: bool = False,
+    errors: bool = True,
+    warnings: bool = True,
+) -> Dict[Text, Any]:
+    """Run the evaluation of the stories, optionally plot the results.
+    Args:
+        stories: the stories to evaluate on
+        agent: the agent
+        max_stories: maximum number of stories to consider
+        out_directory: path to directory to results to
+        fail_on_prediction_errors: boolean indicating whether to fail on prediction
+            errors or not
+        e2e: boolean indicating whether to use end to end evaluation or not
+        disable_plotting: boolean indicating whether to disable plotting or not
+        successes: boolean indicating whether to write down successful predictions or
+            not
+        errors: boolean indicating whether to write down incorrect predictions or not
+        warnings: boolean indicating whether to write down prediction warnings or not
+    Returns:
+        Evaluation summary.
+    """
+    from rasa.model_testing import get_evaluation_metrics
+    generator = _create_data_generator(stories, agent, max_stories, e2e)
+    completed_trackers = generator.generate_story_trackers()
+    story_evaluation, _, entity_results = await _collect_story_predictions(
+        completed_trackers, agent, fail_on_prediction_errors, use_e2e=e2e
+    )
+    evaluation_store = story_evaluation.evaluation_store
+    with pywarnings.catch_warnings():
+        from sklearn.exceptions import UndefinedMetricWarning
+        pywarnings.simplefilter("ignore", UndefinedMetricWarning)
+        targets, predictions = evaluation_store.serialise()
+        report, precision, f1, action_accuracy = get_evaluation_metrics(
+            targets, predictions, output_dict=True
+        )
+        if out_directory:
+            # Add conversation level accuracy to story report.
+            num_failed = len(story_evaluation.failed_stories)
+            num_correct = len(story_evaluation.successful_stories)
+            num_warnings = len(story_evaluation.stories_with_warnings)
+            num_convs = num_failed + num_correct
+            if num_convs and isinstance(report, Dict):
+                conv_accuracy = num_correct / num_convs
+                report["conversation_accuracy"] = {
+                    "accuracy": conv_accuracy,
+                    "correct": num_correct,
+                    "with_warnings": num_warnings,
+                    "total": num_convs,
+                }
+            report_filename = os.path.join(out_directory, REPORT_STORIES_FILE)
+            rasa.shared.utils.io.dump_obj_as_json_to_file(report_filename, report)
+            logger.info(f"Stories report saved to {report_filename}.")
+        evaluate_entities(
+            entity_results,
+            POLICIES_THAT_EXTRACT_ENTITIES,
+            out_directory,
+            successes,
+            errors,
+            disable_plotting,
+        )
+    telemetry.track_core_model_test(len(generator.story_graph.story_steps), e2e, agent)
+    _log_evaluation_table(
+        evaluation_store.action_targets,
+        "ACTION",
+        action_accuracy,
+        precision=precision,
+        f1=f1,
+        in_training_data_fraction=story_evaluation.in_training_data_fraction,
+    )
+    if not disable_plotting and out_directory:
+        _plot_story_evaluation(
+            evaluation_store.action_targets,
+            evaluation_store.action_predictions,
+            out_directory,
+        )
+    if errors and out_directory:
+        _log_stories(
+            story_evaluation.failed_stories,
+            os.path.join(out_directory, FAILED_STORIES_FILE),
+            "None of the test stories failed - all good!",
+        )
+    if successes and out_directory:
+        _log_stories(
+            story_evaluation.successful_stories,
+            os.path.join(out_directory, SUCCESSFUL_STORIES_FILE),
+            "None of the test stories succeeded :(",
+        )
+    if warnings and out_directory:
+        _log_stories(
+            story_evaluation.stories_with_warnings,
+            os.path.join(out_directory, STORIES_WITH_WARNINGS_FILE),
+            "No warnings for test stories",
+        )
+    return {
+        "report": report,
+        "precision": precision,
+        "f1": f1,
+        "accuracy": action_accuracy,
+        "actions": story_evaluation.action_list,
+        "in_training_data_fraction": story_evaluation.in_training_data_fraction,
+        "is_end_to_end_evaluation": e2e,
+    }
+def _log_evaluation_table(
+    golds: List[Any],
+    name: Text,
+    accuracy: float,
+    report: Optional[Dict[Text, Any]] = None,
+    precision: Optional[float] = None,
+    f1: Optional[float] = None,
+    in_training_data_fraction: Optional[float] = None,
+    include_report: bool = True,
+) -> None:  # pragma: no cover
+    """Log the sklearn evaluation metrics."""
+    logger.info(f"Evaluation Results on {name} level:")
+    logger.info(f"\tCorrect:          {int(len(golds) * accuracy)} / {len(golds)}")
+    if f1 is not None:
+        logger.info(f"\tF1-Score:         {f1:.3f}")
+    if precision is not None:
+        logger.info(f"\tPrecision:        {precision:.3f}")
+    logger.info(f"\tAccuracy:         {accuracy:.3f}")
+    if in_training_data_fraction is not None:
+        logger.info(f"\tIn-data fraction: {in_training_data_fraction:.3g}")
+    if include_report and report is not None:
+        logger.info(f"\tClassification report: \n{report}")
+def _plot_story_evaluation(
+    targets: PredictionList,
+    predictions: PredictionList,
+    output_directory: Optional[Text],
+) -> None:
+    """Plot a confusion matrix of story evaluation."""
+    from sklearn.metrics import confusion_matrix
+    from sklearn.utils.multiclass import unique_labels
+    from rasa.utils.plotting import plot_confusion_matrix
+    confusion_matrix_filename = CONFUSION_MATRIX_STORIES_FILE
+    if output_directory:
+        confusion_matrix_filename = os.path.join(
+            output_directory, confusion_matrix_filename
+        )
+    cnf_matrix = confusion_matrix(targets, predictions)
+    plot_confusion_matrix(
+        cnf_matrix,
+        classes=unique_labels(targets, predictions),
+        title="Action Confusion matrix",
+        output_file=confusion_matrix_filename,
+    )
+async def compare_models_in_dir(
+    model_dir: Text,
+    stories_file: Text,
+    output: Text,
+    use_conversation_test_files: bool = False,
+) -> None:
+    """Evaluates multiple trained models in a directory on a test set.
+    Args:
+        model_dir: path to directory that contains the models to evaluate
+        stories_file: path to the story file
+        output: output directory to store results to
+        use_conversation_test_files: `True` if conversation test files should be used
+            for testing instead of regular Core story files.
+    """
+    number_correct = defaultdict(list)
+    for run in rasa.shared.utils.io.list_subdirectories(model_dir):
+        number_correct_in_run = defaultdict(list)
+        for model in sorted(rasa.shared.utils.io.list_files(run)):
+            if not model.endswith("tar.gz"):
+                continue
+            # The model files are named like <config-name>PERCENTAGE_KEY<number>.tar.gz
+            # Remove the percentage key and number from the name to get the config name
+            config_name = os.path.basename(model).split(PERCENTAGE_KEY)[0]
+            number_of_correct_stories = await _evaluate_core_model(
+                model,
+                stories_file,
+                use_conversation_test_files=use_conversation_test_files,
+            )
+            number_correct_in_run[config_name].append(number_of_correct_stories)
+        for k, v in number_correct_in_run.items():
+            number_correct[k].append(v)
+    rasa.shared.utils.io.dump_obj_as_json_to_file(
+        os.path.join(output, RESULTS_FILE), number_correct
+    )
+async def compare_models(
+    models: List[Text],
+    stories_file: Text,
+    output: Text,
+    use_conversation_test_files: bool = False,
+) -> None:
+    """Evaluates multiple trained models on a test set.
+    Args:
+        models: Paths to model files.
+        stories_file: path to the story file
+        output: output directory to store results to
+        use_conversation_test_files: `True` if conversation test files should be used
+            for testing instead of regular Core story files.
+    """
+    number_correct = defaultdict(list)
+    for model in models:
+        number_of_correct_stories = await _evaluate_core_model(
+            model, stories_file, use_conversation_test_files=use_conversation_test_files
+        )
+        number_correct[os.path.basename(model)].append(number_of_correct_stories)
+    rasa.shared.utils.io.dump_obj_as_json_to_file(
+        os.path.join(output, RESULTS_FILE), number_correct
+    )
+async def _evaluate_core_model(
+    model: Text, stories_file: Text, use_conversation_test_files: bool = False
+) -> int:
+    from rasa.core.agent import Agent
+    logger.info(f"Evaluating model '{model}'")
+    agent = Agent.load(model)
+    generator = _create_data_generator(
+        stories_file, agent, use_conversation_test_files=use_conversation_test_files
+    )
+    completed_trackers = generator.generate_story_trackers()
+    # Entities are ignored here as we only compare number of correct stories.
+    story_eval_store, number_of_stories, _ = await _collect_story_predictions(
+        completed_trackers, agent
+    )
+    failed_stories = story_eval_store.failed_stories
+    return number_of_stories - len(failed_stories)