PyPI - rasa-pro - Versions diffs - 3.8.18__py3-none-any.whl → 3.9.15__py3-none-any.whl - Mend

rasa-pro 3.8.18py3-none-any.whl → 3.9.15py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of rasa-pro might be problematic. Click here for more details.

Files changed (278) hide show

README.md +6 -42
rasa/__main__.py +14 -9
rasa/anonymization/anonymization_pipeline.py +0 -1
rasa/anonymization/anonymization_rule_executor.py +3 -3
rasa/anonymization/utils.py +4 -3
rasa/api.py +2 -2
rasa/cli/arguments/default_arguments.py +1 -1
rasa/cli/arguments/run.py +2 -2
rasa/cli/arguments/test.py +1 -1
rasa/cli/arguments/train.py +10 -10
rasa/cli/e2e_test.py +27 -7
rasa/cli/export.py +0 -1
rasa/cli/license.py +3 -3
rasa/cli/project_templates/calm/actions/action_template.py +1 -1
rasa/cli/project_templates/calm/config.yml +1 -1
rasa/cli/project_templates/calm/credentials.yml +1 -1
rasa/cli/project_templates/calm/data/flows/add_contact.yml +1 -1
rasa/cli/project_templates/calm/data/flows/remove_contact.yml +1 -1
rasa/cli/project_templates/calm/domain/add_contact.yml +8 -2
rasa/cli/project_templates/calm/domain/list_contacts.yml +3 -0
rasa/cli/project_templates/calm/domain/remove_contact.yml +9 -2
rasa/cli/project_templates/calm/domain/shared.yml +5 -0
rasa/cli/project_templates/calm/endpoints.yml +4 -4
rasa/cli/project_templates/default/actions/actions.py +1 -1
rasa/cli/project_templates/default/config.yml +5 -5
rasa/cli/project_templates/default/credentials.yml +1 -1
rasa/cli/project_templates/default/endpoints.yml +4 -4
rasa/cli/project_templates/default/tests/test_stories.yml +1 -1
rasa/cli/project_templates/tutorial/config.yml +1 -1
rasa/cli/project_templates/tutorial/credentials.yml +1 -1
rasa/cli/project_templates/tutorial/data/patterns.yml +6 -0
rasa/cli/project_templates/tutorial/domain.yml +4 -0
rasa/cli/project_templates/tutorial/endpoints.yml +6 -6
rasa/cli/run.py +0 -1
rasa/cli/scaffold.py +3 -2
rasa/cli/studio/download.py +11 -0
rasa/cli/studio/studio.py +180 -24
rasa/cli/studio/upload.py +0 -8
rasa/cli/telemetry.py +18 -6
rasa/cli/utils.py +21 -10
rasa/cli/x.py +3 -2
rasa/constants.py +1 -1
rasa/core/actions/action.py +90 -315
rasa/core/actions/action_exceptions.py +24 -0
rasa/core/actions/constants.py +3 -0
rasa/core/actions/custom_action_executor.py +188 -0
rasa/core/actions/forms.py +11 -7
rasa/core/actions/grpc_custom_action_executor.py +251 -0
rasa/core/actions/http_custom_action_executor.py +140 -0
rasa/core/actions/loops.py +3 -0
rasa/core/actions/two_stage_fallback.py +1 -1
rasa/core/agent.py +2 -4
rasa/core/brokers/pika.py +1 -2
rasa/core/channels/audiocodes.py +1 -1
rasa/core/channels/botframework.py +0 -1
rasa/core/channels/callback.py +0 -1
rasa/core/channels/console.py +6 -8
rasa/core/channels/development_inspector.py +1 -1
rasa/core/channels/facebook.py +0 -3
rasa/core/channels/hangouts.py +0 -6
rasa/core/channels/inspector/dist/assets/{arc-5623b6dc.js → arc-b6e548fe.js} +1 -1
rasa/core/channels/inspector/dist/assets/{c4Diagram-d0fbc5ce-685c106a.js → c4Diagram-d0fbc5ce-fa03ac9e.js} +1 -1
rasa/core/channels/inspector/dist/assets/{classDiagram-936ed81e-8cbed007.js → classDiagram-936ed81e-ee67392a.js} +1 -1
rasa/core/channels/inspector/dist/assets/{classDiagram-v2-c3cb15f1-5889cf12.js → classDiagram-v2-c3cb15f1-9b283fae.js} +1 -1
rasa/core/channels/inspector/dist/assets/{createText-62fc7601-24c249d7.js → createText-62fc7601-8b6fcc2a.js} +1 -1
rasa/core/channels/inspector/dist/assets/{edges-f2ad444c-7dd06a75.js → edges-f2ad444c-22e77f4f.js} +1 -1
rasa/core/channels/inspector/dist/assets/{erDiagram-9d236eb7-62c1e54c.js → erDiagram-9d236eb7-60ffc87f.js} +1 -1
rasa/core/channels/inspector/dist/assets/{flowDb-1972c806-ce49b86f.js → flowDb-1972c806-9dd802e4.js} +1 -1
rasa/core/channels/inspector/dist/assets/{flowDiagram-7ea5b25a-4067e48f.js → flowDiagram-7ea5b25a-5fa1912f.js} +1 -1
rasa/core/channels/inspector/dist/assets/flowDiagram-v2-855bc5b3-1844e5a5.js +1 -0
rasa/core/channels/inspector/dist/assets/{flowchart-elk-definition-abe16c3d-59fe4051.js → flowchart-elk-definition-abe16c3d-622a1fd2.js} +1 -1
rasa/core/channels/inspector/dist/assets/{ganttDiagram-9b5ea136-47e3a43b.js → ganttDiagram-9b5ea136-e285a63a.js} +1 -1
rasa/core/channels/inspector/dist/assets/{gitGraphDiagram-99d0ae7c-5a2ac0d9.js → gitGraphDiagram-99d0ae7c-f237bdca.js} +1 -1
rasa/core/channels/inspector/dist/assets/{index-2c4b9a3b-dfb8efc4.js → index-2c4b9a3b-4b03d70e.js} +1 -1
rasa/core/channels/inspector/dist/assets/{index-268a75c0.js → index-a5d3e69d.js} +4 -4
rasa/core/channels/inspector/dist/assets/{infoDiagram-736b4530-b0c470f2.js → infoDiagram-736b4530-72a0fa5f.js} +1 -1
rasa/core/channels/inspector/dist/assets/{journeyDiagram-df861f2b-2edb829a.js → journeyDiagram-df861f2b-82218c41.js} +1 -1
rasa/core/channels/inspector/dist/assets/{layout-b6873d69.js → layout-78cff630.js} +1 -1
rasa/core/channels/inspector/dist/assets/{line-1efc5781.js → line-5038b469.js} +1 -1
rasa/core/channels/inspector/dist/assets/{linear-661e9b94.js → linear-c4fc4098.js} +1 -1
rasa/core/channels/inspector/dist/assets/{mindmap-definition-beec6740-2d2e727f.js → mindmap-definition-beec6740-c33c8ea6.js} +1 -1
rasa/core/channels/inspector/dist/assets/{pieDiagram-dbbf0591-9d3ea93d.js → pieDiagram-dbbf0591-a8d03059.js} +1 -1
rasa/core/channels/inspector/dist/assets/{quadrantDiagram-4d7f4fd6-06a178a2.js → quadrantDiagram-4d7f4fd6-6a0e56b2.js} +1 -1
rasa/core/channels/inspector/dist/assets/{requirementDiagram-6fc4c22a-0bfedffc.js → requirementDiagram-6fc4c22a-2dc7c7bd.js} +1 -1
rasa/core/channels/inspector/dist/assets/{sankeyDiagram-8f13d901-d76d0a04.js → sankeyDiagram-8f13d901-2360fe39.js} +1 -1
rasa/core/channels/inspector/dist/assets/{sequenceDiagram-b655622a-37bb4341.js → sequenceDiagram-b655622a-41b9f9ad.js} +1 -1
rasa/core/channels/inspector/dist/assets/{stateDiagram-59f0c015-f52f7f57.js → stateDiagram-59f0c015-0aad326f.js} +1 -1
rasa/core/channels/inspector/dist/assets/{stateDiagram-v2-2b26beab-4a986a20.js → stateDiagram-v2-2b26beab-9847d984.js} +1 -1
rasa/core/channels/inspector/dist/assets/{styles-080da4f6-7dd9ae12.js → styles-080da4f6-564d890e.js} +1 -1
rasa/core/channels/inspector/dist/assets/{styles-3dcbcfbf-46e1ca14.js → styles-3dcbcfbf-38957613.js} +1 -1
rasa/core/channels/inspector/dist/assets/{styles-9c745c82-4a97439a.js → styles-9c745c82-f0fc6921.js} +1 -1
rasa/core/channels/inspector/dist/assets/{svgDrawCommon-4835440b-823917a3.js → svgDrawCommon-4835440b-ef3c5a77.js} +1 -1
rasa/core/channels/inspector/dist/assets/{timeline-definition-5b62e21b-9ea72896.js → timeline-definition-5b62e21b-bf3e91c1.js} +1 -1
rasa/core/channels/inspector/dist/assets/{xychartDiagram-2b33534f-b631a8b6.js → xychartDiagram-2b33534f-4d4026c0.js} +1 -1
rasa/core/channels/inspector/dist/index.html +1 -1
rasa/core/channels/inspector/src/components/DiagramFlow.tsx +10 -0
rasa/core/channels/inspector/src/helpers/formatters.test.ts +4 -7
rasa/core/channels/inspector/src/helpers/formatters.ts +3 -2
rasa/core/channels/rest.py +36 -21
rasa/core/channels/rocketchat.py +0 -1
rasa/core/channels/socketio.py +1 -1
rasa/core/channels/telegram.py +3 -3
rasa/core/channels/webexteams.py +0 -1
rasa/core/concurrent_lock_store.py +1 -1
rasa/core/evaluation/marker_base.py +1 -3
rasa/core/evaluation/marker_stats.py +1 -2
rasa/core/featurizers/single_state_featurizer.py +3 -26
rasa/core/featurizers/tracker_featurizers.py +18 -122
rasa/core/information_retrieval/__init__.py +7 -0
rasa/core/information_retrieval/faiss.py +9 -4
rasa/core/information_retrieval/information_retrieval.py +64 -7
rasa/core/information_retrieval/milvus.py +7 -14
rasa/core/information_retrieval/qdrant.py +8 -15
rasa/core/lock_store.py +0 -1
rasa/core/migrate.py +1 -2
rasa/core/nlg/callback.py +3 -4
rasa/core/policies/enterprise_search_policy.py +86 -22
rasa/core/policies/enterprise_search_prompt_template.jinja2 +4 -41
rasa/core/policies/enterprise_search_prompt_with_citation_template.jinja2 +60 -0
rasa/core/policies/flows/flow_executor.py +104 -2
rasa/core/policies/intentless_policy.py +7 -9
rasa/core/policies/memoization.py +3 -3
rasa/core/policies/policy.py +18 -9
rasa/core/policies/rule_policy.py +8 -11
rasa/core/policies/ted_policy.py +61 -88
rasa/core/policies/unexpected_intent_policy.py +8 -17
rasa/core/processor.py +136 -47
rasa/core/run.py +41 -25
rasa/core/secrets_manager/endpoints.py +2 -2
rasa/core/secrets_manager/vault.py +6 -8
rasa/core/test.py +3 -5
rasa/core/tracker_store.py +49 -14
rasa/core/train.py +1 -3
rasa/core/training/interactive.py +9 -6
rasa/core/utils.py +5 -10
rasa/dialogue_understanding/coexistence/intent_based_router.py +11 -4
rasa/dialogue_understanding/coexistence/llm_based_router.py +2 -3
rasa/dialogue_understanding/commands/__init__.py +4 -0
rasa/dialogue_understanding/commands/can_not_handle_command.py +9 -0
rasa/dialogue_understanding/commands/cancel_flow_command.py +9 -0
rasa/dialogue_understanding/commands/change_flow_command.py +38 -0
rasa/dialogue_understanding/commands/chit_chat_answer_command.py +9 -0
rasa/dialogue_understanding/commands/clarify_command.py +9 -0
rasa/dialogue_understanding/commands/correct_slots_command.py +9 -0
rasa/dialogue_understanding/commands/error_command.py +12 -0
rasa/dialogue_understanding/commands/handle_code_change_command.py +9 -0
rasa/dialogue_understanding/commands/human_handoff_command.py +9 -0
rasa/dialogue_understanding/commands/knowledge_answer_command.py +9 -0
rasa/dialogue_understanding/commands/noop_command.py +9 -0
rasa/dialogue_understanding/commands/set_slot_command.py +38 -3
rasa/dialogue_understanding/commands/skip_question_command.py +9 -0
rasa/dialogue_understanding/commands/start_flow_command.py +9 -0
rasa/dialogue_understanding/generator/__init__.py +16 -1
rasa/dialogue_understanding/generator/command_generator.py +92 -6
rasa/dialogue_understanding/generator/constants.py +18 -0
rasa/dialogue_understanding/generator/flow_retrieval.py +7 -5
rasa/dialogue_understanding/generator/llm_based_command_generator.py +467 -0
rasa/dialogue_understanding/generator/llm_command_generator.py +39 -609
rasa/dialogue_understanding/generator/multi_step/__init__.py +0 -0
rasa/dialogue_understanding/generator/multi_step/fill_slots_prompt.jinja2 +62 -0
rasa/dialogue_understanding/generator/multi_step/handle_flows_prompt.jinja2 +38 -0
rasa/dialogue_understanding/generator/multi_step/multi_step_llm_command_generator.py +827 -0
rasa/dialogue_understanding/generator/nlu_command_adapter.py +69 -8
rasa/dialogue_understanding/generator/single_step/__init__.py +0 -0
rasa/dialogue_understanding/generator/single_step/single_step_llm_command_generator.py +345 -0
rasa/dialogue_understanding/patterns/default_flows_for_patterns.yml +36 -31
rasa/dialogue_understanding/processor/command_processor.py +112 -3
rasa/e2e_test/constants.py +1 -0
rasa/e2e_test/e2e_test_case.py +44 -0
rasa/e2e_test/e2e_test_runner.py +114 -11
rasa/e2e_test/e2e_test_schema.yml +18 -0
rasa/engine/caching.py +0 -1
rasa/engine/graph.py +18 -6
rasa/engine/recipes/config_files/default_config.yml +3 -3
rasa/engine/recipes/default_components.py +1 -1
rasa/engine/recipes/default_recipe.py +4 -5
rasa/engine/recipes/recipe.py +1 -1
rasa/engine/runner/dask.py +3 -9
rasa/engine/storage/local_model_storage.py +0 -2
rasa/engine/validation.py +179 -145
rasa/exceptions.py +2 -2
rasa/graph_components/validators/default_recipe_validator.py +3 -5
rasa/hooks.py +0 -1
rasa/model.py +1 -1
rasa/model_training.py +1 -0
rasa/nlu/classifiers/diet_classifier.py +33 -52
rasa/nlu/classifiers/logistic_regression_classifier.py +9 -22
rasa/nlu/classifiers/sklearn_intent_classifier.py +16 -37
rasa/nlu/extractors/crf_entity_extractor.py +54 -97
rasa/nlu/extractors/duckling_entity_extractor.py +1 -1
rasa/nlu/featurizers/dense_featurizer/convert_featurizer.py +1 -5
rasa/nlu/featurizers/dense_featurizer/lm_featurizer.py +0 -4
rasa/nlu/featurizers/featurizer.py +1 -1
rasa/nlu/featurizers/sparse_featurizer/count_vectors_featurizer.py +18 -49
rasa/nlu/featurizers/sparse_featurizer/lexical_syntactic_featurizer.py +26 -64
rasa/nlu/featurizers/sparse_featurizer/regex_featurizer.py +3 -5
rasa/nlu/persistor.py +68 -26
rasa/nlu/selectors/response_selector.py +7 -10
rasa/nlu/test.py +0 -3
rasa/nlu/utils/hugging_face/registry.py +1 -1
rasa/nlu/utils/spacy_utils.py +1 -3
rasa/server.py +22 -7
rasa/shared/constants.py +12 -1
rasa/shared/core/command_payload_reader.py +109 -0
rasa/shared/core/constants.py +4 -5
rasa/shared/core/domain.py +57 -56
rasa/shared/core/events.py +4 -7
rasa/shared/core/flows/flow.py +9 -0
rasa/shared/core/flows/flows_list.py +12 -0
rasa/shared/core/flows/steps/action.py +7 -2
rasa/shared/core/generator.py +12 -11
rasa/shared/core/slot_mappings.py +315 -24
rasa/shared/core/slots.py +4 -2
rasa/shared/core/trackers.py +32 -14
rasa/shared/core/training_data/loading.py +0 -1
rasa/shared/core/training_data/story_reader/story_reader.py +3 -3
rasa/shared/core/training_data/story_reader/yaml_story_reader.py +11 -11
rasa/shared/core/training_data/story_writer/yaml_story_writer.py +5 -3
rasa/shared/core/training_data/structures.py +1 -1
rasa/shared/core/training_data/visualization.py +1 -1
rasa/shared/data.py +58 -1
rasa/shared/exceptions.py +36 -2
rasa/shared/importers/importer.py +1 -2
rasa/shared/importers/rasa.py +0 -1
rasa/shared/nlu/constants.py +2 -0
rasa/shared/nlu/training_data/entities_parser.py +1 -2
rasa/shared/nlu/training_data/features.py +2 -120
rasa/shared/nlu/training_data/formats/dialogflow.py +3 -2
rasa/shared/nlu/training_data/formats/rasa_yaml.py +3 -5
rasa/shared/nlu/training_data/formats/readerwriter.py +0 -1
rasa/shared/nlu/training_data/message.py +13 -0
rasa/shared/nlu/training_data/training_data.py +0 -2
rasa/shared/providers/openai/session_handler.py +2 -2
rasa/shared/utils/constants.py +3 -0
rasa/shared/utils/io.py +11 -1
rasa/shared/utils/llm.py +1 -2
rasa/shared/utils/pykwalify_extensions.py +1 -0
rasa/shared/utils/schemas/domain.yml +3 -0
rasa/shared/utils/yaml.py +44 -35
rasa/studio/auth.py +26 -10
rasa/studio/constants.py +2 -0
rasa/studio/data_handler.py +114 -107
rasa/studio/download.py +160 -27
rasa/studio/results_logger.py +137 -0
rasa/studio/train.py +6 -7
rasa/studio/upload.py +159 -134
rasa/telemetry.py +188 -34
rasa/tracing/config.py +18 -3
rasa/tracing/constants.py +26 -2
rasa/tracing/instrumentation/attribute_extractors.py +50 -41
rasa/tracing/instrumentation/instrumentation.py +290 -44
rasa/tracing/instrumentation/intentless_policy_instrumentation.py +7 -5
rasa/tracing/instrumentation/metrics.py +109 -21
rasa/tracing/metric_instrument_provider.py +83 -3
rasa/utils/cli.py +2 -1
rasa/utils/common.py +1 -1
rasa/utils/endpoints.py +1 -2
rasa/utils/io.py +72 -6
rasa/utils/licensing.py +246 -31
rasa/utils/ml_utils.py +1 -1
rasa/utils/tensorflow/data_generator.py +1 -1
rasa/utils/tensorflow/environment.py +1 -1
rasa/utils/tensorflow/model_data.py +201 -12
rasa/utils/tensorflow/model_data_utils.py +499 -500
rasa/utils/tensorflow/models.py +5 -6
rasa/utils/tensorflow/rasa_layers.py +15 -15
rasa/utils/train_utils.py +1 -1
rasa/utils/url_tools.py +53 -0
rasa/validator.py +305 -3
rasa/version.py +1 -1
{rasa_pro-3.8.18.dist-info → rasa_pro-3.9.15.dist-info}/METADATA +25 -61
{rasa_pro-3.8.18.dist-info → rasa_pro-3.9.15.dist-info}/RECORD +276 -259
rasa/core/channels/inspector/dist/assets/flowDiagram-v2-855bc5b3-85583a23.js +0 -1
rasa/utils/tensorflow/feature_array.py +0 -370
/rasa/dialogue_understanding/generator/{command_prompt_template.jinja2 → single_step/command_prompt_template.jinja2} +0 -0
{rasa_pro-3.8.18.dist-info → rasa_pro-3.9.15.dist-info}/NOTICE +0 -0
{rasa_pro-3.8.18.dist-info → rasa_pro-3.9.15.dist-info}/WHEEL +0 -0
{rasa_pro-3.8.18.dist-info → rasa_pro-3.9.15.dist-info}/entry_points.txt +0 -0

rasa/nlu/classifiers/diet_classifier.py CHANGED Viewed

@@ -1,17 +1,18 @@
 from __future__ import annotations
 import copy
 import logging
 from collections import defaultdict
 from pathlib import Path
-from typing import Any, Dict, List, Optional, Text, Tuple, Union, TypeVar, Type
+from rasa.exceptions import ModelNotFound
+from rasa.nlu.featurizers.featurizer import Featurizer
 import numpy as np
 import scipy.sparse
 import tensorflow as tf
-from rasa.exceptions import ModelNotFound
-from rasa.nlu.featurizers.featurizer import Featurizer
+from typing import Any, Dict, List, Optional, Text, Tuple, Union, TypeVar, Type
 from rasa.engine.graph import ExecutionContext, GraphComponent
 from rasa.engine.recipes.default_recipe import DefaultV1Recipe
 from rasa.engine.storage.resource import Resource
@@ -19,21 +20,18 @@ from rasa.engine.storage.storage import ModelStorage
 from rasa.nlu.extractors.extractor import EntityExtractorMixin
 from rasa.nlu.classifiers.classifier import IntentClassifier
 import rasa.shared.utils.io
+import rasa.utils.io as io_utils
 import rasa.nlu.utils.bilou_utils as bilou_utils
 from rasa.shared.constants import DIAGNOSTIC_DATA
 from rasa.nlu.extractors.extractor import EntityTagSpec
 from rasa.nlu.classifiers import LABEL_RANKING_LENGTH
 from rasa.utils import train_utils
 from rasa.utils.tensorflow import rasa_layers
-from rasa.utils.tensorflow.feature_array import (
-    FeatureArray,
-    serialize_nested_feature_arrays,
-    deserialize_nested_feature_arrays,
-)
 from rasa.utils.tensorflow.models import RasaModel, TransformerRasaModel
 from rasa.utils.tensorflow.model_data import (
     RasaModelData,
     FeatureSignature,
+    FeatureArray,
 )
 from rasa.nlu.constants import TOKENS_NAMES, DEFAULT_TRANSFORMER_SIZE
 from rasa.shared.nlu.constants import (
@@ -120,6 +118,7 @@ LABEL_SUB_KEY = IDS
 POSSIBLE_TAGS = [ENTITY_ATTRIBUTE_TYPE, ENTITY_ATTRIBUTE_ROLE, ENTITY_ATTRIBUTE_GROUP]
 DIETClassifierT = TypeVar("DIETClassifierT", bound="DIETClassifier")
@@ -511,7 +510,6 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
     def _extract_features(
         self, message: Message, attribute: Text
     ) -> Dict[Text, Union[scipy.sparse.spmatrix, np.ndarray]]:
         (
             sparse_sequence_features,
             sparse_sentence_features,
@@ -781,7 +779,6 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
         sparse_feature_sizes: Dict[Text, Dict[Text, List[int]]],
         label_attribute: Optional[Text] = None,
     ) -> Dict[Text, Dict[Text, List[int]]]:
         if label_attribute in sparse_feature_sizes:
             del sparse_feature_sizes[label_attribute]
         return sparse_feature_sizes
@@ -1086,24 +1083,18 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
             self.model.save(str(tf_model_file))
-            # save data example
-            serialize_nested_feature_arrays(
-                self._data_example,
-                model_path / f"{file_name}.data_example.st",
-                model_path / f"{file_name}.data_example_metadata.json",
+            io_utils.pickle_dump(
+                model_path / f"{file_name}.data_example.pkl", self._data_example
             )
-            # save label data
-            serialize_nested_feature_arrays(
-                dict(self._label_data.data) if self._label_data is not None else {},
-                model_path / f"{file_name}.label_data.st",
-                model_path / f"{file_name}.label_data_metadata.json",
-            )
-            rasa.shared.utils.io.dump_obj_as_json_to_file(
-                model_path / f"{file_name}.sparse_feature_sizes.json",
+            io_utils.pickle_dump(
+                model_path / f"{file_name}.sparse_feature_sizes.pkl",
                 self._sparse_feature_sizes,
             )
-            rasa.shared.utils.io.dump_obj_as_json_to_file(
+            io_utils.pickle_dump(
+                model_path / f"{file_name}.label_data.pkl",
+                dict(self._label_data.data) if self._label_data is not None else {},
+            )
+            io_utils.json_pickle(
                 model_path / f"{file_name}.index_label_id_mapping.json",
                 self.index_label_id_mapping,
             )
@@ -1192,22 +1183,15 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
     ]:
         file_name = cls.__name__
-        # load data example
-        data_example = deserialize_nested_feature_arrays(
-            str(model_path / f"{file_name}.data_example.st"),
-            str(model_path / f"{file_name}.data_example_metadata.json"),
+        data_example = io_utils.pickle_load(
+            model_path / f"{file_name}.data_example.pkl"
         )
-        # load label data
-        loaded_label_data = deserialize_nested_feature_arrays(
-            str(model_path / f"{file_name}.label_data.st"),
-            str(model_path / f"{file_name}.label_data_metadata.json"),
-        )
-        label_data = RasaModelData(data=loaded_label_data)
-        sparse_feature_sizes = rasa.shared.utils.io.read_json_file(
-            model_path / f"{file_name}.sparse_feature_sizes.json"
+        label_data = io_utils.pickle_load(model_path / f"{file_name}.label_data.pkl")
+        label_data = RasaModelData(data=label_data)
+        sparse_feature_sizes = io_utils.pickle_load(
+            model_path / f"{file_name}.sparse_feature_sizes.pkl"
         )
-        index_label_id_mapping = rasa.shared.utils.io.read_json_file(
+        index_label_id_mapping = io_utils.json_unpickle(
             model_path / f"{file_name}.index_label_id_mapping.json"
         )
         entity_tag_specs = rasa.shared.utils.io.read_json_file(
@@ -1227,6 +1211,7 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
             for tag_spec in entity_tag_specs
         ]
+        # jsonpickle converts dictionary keys to strings
         index_label_id_mapping = {
             int(key): value for key, value in index_label_id_mapping.items()
         }
@@ -1280,7 +1265,6 @@ class DIETClassifier(GraphComponent, IntentClassifier, EntityExtractorMixin):
         config: Dict[Text, Any],
         finetune_mode: bool,
     ) -> "RasaModel":
         predict_data_example = RasaModelData(
             label_key=model_data_example.label_key,
             data={
@@ -1467,10 +1451,10 @@ class DIET(TransformerRasaModel):
         # everything using a transformer and optionally also do masked language
         # modeling.
         self.text_name = TEXT
-        self._tf_layers[
-            f"sequence_layer.{self.text_name}"
-        ] = rasa_layers.RasaSequenceLayer(
-            self.text_name, self.data_signature[self.text_name], self.config
+        self._tf_layers[f"sequence_layer.{self.text_name}"] = (
+            rasa_layers.RasaSequenceLayer(
+                self.text_name, self.data_signature[self.text_name], self.config
+            )
         )
         if self.config[MASKED_LM]:
             self._prepare_mask_lm_loss(self.text_name)
@@ -1488,10 +1472,10 @@ class DIET(TransformerRasaModel):
                 {SPARSE_INPUT_DROPOUT: False, DENSE_INPUT_DROPOUT: False}
             )
-            self._tf_layers[
-                f"feature_combining_layer.{self.label_name}"
-            ] = rasa_layers.RasaFeatureCombiningLayer(
-                self.label_name, self.label_signature[self.label_name], label_config
+            self._tf_layers[f"feature_combining_layer.{self.label_name}"] = (
+                rasa_layers.RasaFeatureCombiningLayer(
+                    self.label_name, self.label_signature[self.label_name], label_config
+                )
             )
             self._prepare_ffnn_layer(
@@ -1523,7 +1507,6 @@ class DIET(TransformerRasaModel):
         sequence_feature_lengths: tf.Tensor,
         name: Text,
     ) -> tf.Tensor:
         x, _ = self._tf_layers[f"feature_combining_layer.{name}"](
             (sequence_features, sentence_features, sequence_feature_lengths),
             training=self._training,
@@ -1705,7 +1688,6 @@ class DIET(TransformerRasaModel):
         return loss
     def _update_label_metrics(self, loss: tf.Tensor, acc: tf.Tensor) -> None:
         self.intent_loss.update_state(loss)
         self.intent_acc.update_state(acc)
@@ -1864,7 +1846,6 @@ class DIET(TransformerRasaModel):
         combined_sequence_sentence_feature_lengths: tf.Tensor,
         text_transformed: tf.Tensor,
     ) -> Dict[Text, tf.Tensor]:
         if self.all_labels_embed is None:
             raise ValueError(
                 "The model was not prepared for prediction. "

rasa/nlu/classifiers/logistic_regression_classifier.py CHANGED Viewed

@@ -1,21 +1,22 @@
 from typing import Any, Text, Dict, List, Type, Tuple
+import joblib
 import structlog
 from scipy.sparse import hstack, vstack, csr_matrix
 from sklearn.exceptions import NotFittedError
 from sklearn.linear_model import LogisticRegression
 from sklearn.utils.validation import check_is_fitted
-from rasa.engine.graph import ExecutionContext, GraphComponent
-from rasa.engine.recipes.default_recipe import DefaultV1Recipe
 from rasa.engine.storage.resource import Resource
 from rasa.engine.storage.storage import ModelStorage
+from rasa.engine.recipes.default_recipe import DefaultV1Recipe
+from rasa.engine.graph import ExecutionContext, GraphComponent
 from rasa.nlu.classifiers import LABEL_RANKING_LENGTH
-from rasa.nlu.classifiers.classifier import IntentClassifier
 from rasa.nlu.featurizers.featurizer import Featurizer
-from rasa.shared.nlu.constants import TEXT, INTENT
-from rasa.shared.nlu.training_data.message import Message
+from rasa.nlu.classifiers.classifier import IntentClassifier
 from rasa.shared.nlu.training_data.training_data import TrainingData
+from rasa.shared.nlu.training_data.message import Message
+from rasa.shared.nlu.constants import TEXT, INTENT
 from rasa.utils.tensorflow.constants import RANKING_LENGTH
 structlogger = structlog.get_logger()
@@ -183,11 +184,9 @@ class LogisticRegressionClassifier(IntentClassifier, GraphComponent):
     def persist(self) -> None:
         """Persist this model into the passed directory."""
-        import skops.io as sio
         with self._model_storage.write_to(self._resource) as model_dir:
-            path = model_dir / f"{self._resource.name}.skops"
-            sio.dump(self.clf, path)
+            path = model_dir / f"{self._resource.name}.joblib"
+            joblib.dump(self.clf, path)
             structlogger.debug(
                 "logistic_regression_classifier.persist",
                 event_info=f"Saved intent classifier to '{path}'.",
@@ -203,21 +202,9 @@ class LogisticRegressionClassifier(IntentClassifier, GraphComponent):
         **kwargs: Any,
     ) -> "LogisticRegressionClassifier":
         """Loads trained component (see parent class for full docstring)."""
-        import skops.io as sio
         try:
             with model_storage.read_from(resource) as model_dir:
-                classifier_file = model_dir / f"{resource.name}.skops"
-                unknown_types = sio.get_untrusted_types(file=classifier_file)
-                if unknown_types:
-                    structlogger.error(
-                        f"Untrusted types found when loading {classifier_file}!",
-                        unknown_types=unknown_types,
-                    )
-                    raise ValueError()
-                classifier = sio.load(classifier_file, trusted=unknown_types)
+                classifier = joblib.load(model_dir / f"{resource.name}.joblib")
                 component = cls(
                     config, execution_context.node_name, model_storage, resource
                 )

rasa/nlu/classifiers/sklearn_intent_classifier.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from __future__ import annotations
 import logging
+from rasa.nlu.featurizers.dense_featurizer.dense_featurizer import DenseFeaturizer
 import typing
 import warnings
 from typing import Any, Dict, List, Optional, Text, Tuple, Type
@@ -8,18 +8,18 @@ from typing import Any, Dict, List, Optional, Text, Tuple, Type
 import numpy as np
 import rasa.shared.utils.io
+import rasa.utils.io as io_utils
 from rasa.engine.graph import GraphComponent, ExecutionContext
 from rasa.engine.recipes.default_recipe import DefaultV1Recipe
 from rasa.engine.storage.resource import Resource
 from rasa.engine.storage.storage import ModelStorage
-from rasa.nlu.classifiers import LABEL_RANKING_LENGTH
-from rasa.nlu.classifiers.classifier import IntentClassifier
-from rasa.nlu.featurizers.dense_featurizer.dense_featurizer import DenseFeaturizer
 from rasa.shared.constants import DOCS_URL_TRAINING_DATA_NLU
+from rasa.nlu.classifiers import LABEL_RANKING_LENGTH
 from rasa.shared.exceptions import RasaException
 from rasa.shared.nlu.constants import TEXT
-from rasa.shared.nlu.training_data.message import Message
+from rasa.nlu.classifiers.classifier import IntentClassifier
 from rasa.shared.nlu.training_data.training_data import TrainingData
+from rasa.shared.nlu.training_data.message import Message
 from rasa.utils.tensorflow.constants import FEATURIZERS
 logger = logging.getLogger(__name__)
@@ -266,20 +266,14 @@ class SklearnIntentClassifier(GraphComponent, IntentClassifier):
     def persist(self) -> None:
         """Persist this model into the passed directory."""
-        import skops.io as sio
         with self._model_storage.write_to(self._resource) as model_dir:
             file_name = self.__class__.__name__
-            classifier_file_name = model_dir / f"{file_name}_classifier.skops"
-            encoder_file_name = model_dir / f"{file_name}_encoder.json"
+            classifier_file_name = model_dir / f"{file_name}_classifier.pkl"
+            encoder_file_name = model_dir / f"{file_name}_encoder.pkl"
             if self.clf and self.le:
-                # convert self.le.classes_ (numpy array of strings) to a list in order
-                # to use json dump
-                rasa.shared.utils.io.dump_obj_as_json_to_file(
-                    encoder_file_name, list(self.le.classes_)
-                )
-                sio.dump(self.clf.best_estimator_, classifier_file_name)
+                io_utils.json_pickle(encoder_file_name, self.le.classes_)
+                io_utils.json_pickle(classifier_file_name, self.clf.best_estimator_)
     @classmethod
     def load(
@@ -292,36 +286,21 @@ class SklearnIntentClassifier(GraphComponent, IntentClassifier):
     ) -> SklearnIntentClassifier:
         """Loads trained component (see parent class for full docstring)."""
         from sklearn.preprocessing import LabelEncoder
-        import skops.io as sio
         try:
             with model_storage.read_from(resource) as model_dir:
                 file_name = cls.__name__
-                classifier_file = model_dir / f"{file_name}_classifier.skops"
+                classifier_file = model_dir / f"{file_name}_classifier.pkl"
                 if classifier_file.exists():
-                    unknown_types = sio.get_untrusted_types(file=classifier_file)
-                    if unknown_types:
-                        logger.error(
-                            f"Untrusted types ({unknown_types}) found when "
-                            f"loading {classifier_file}!"
-                        )
-                        raise ValueError()
-                    else:
-                        classifier = sio.load(classifier_file, trusted=unknown_types)
-                    encoder_file = model_dir / f"{file_name}_encoder.json"
-                    classes = rasa.shared.utils.io.read_json_file(encoder_file)
+                    classifier = io_utils.json_unpickle(classifier_file)
+                    encoder_file = model_dir / f"{file_name}_encoder.pkl"
+                    classes = io_utils.json_unpickle(encoder_file)
                     encoder = LabelEncoder()
-                    intent_classifier = cls(
-                        config, model_storage, resource, classifier, encoder
-                    )
-                    # convert list of strings (class labels) back to numpy array of
-                    # strings
-                    intent_classifier.transform_labels_str2num(classes)
-                    return intent_classifier
+                    encoder.classes_ = classes
+                    return cls(config, model_storage, resource, classifier, encoder)
         except ValueError:
             logger.debug(
                 f"Failed to load '{cls.__name__}' from model storage. Resource "

rasa/nlu/extractors/crf_entity_extractor.py CHANGED Viewed

@@ -4,9 +4,9 @@ from collections import OrderedDict
 from enum import Enum
 import logging
 import typing
-from typing import Any, Dict, List, Optional, Text, Tuple, Callable, Type
 import numpy as np
+from typing import Any, Dict, List, Optional, Text, Tuple, Callable, Type
 import rasa.nlu.utils.bilou_utils as bilou_utils
 import rasa.shared.utils.io
@@ -41,9 +41,6 @@ if typing.TYPE_CHECKING:
     from sklearn_crfsuite import CRF
-CONFIG_FEATURES = "features"
 class CRFToken:
     def __init__(
         self,
@@ -63,29 +60,6 @@ class CRFToken:
         self.entity_role_tag = entity_role_tag
         self.entity_group_tag = entity_group_tag
-    def to_dict(self) -> Dict[str, Any]:
-        return {
-            "text": self.text,
-            "pos_tag": self.pos_tag,
-            "pattern": self.pattern,
-            "dense_features": [str(x) for x in list(self.dense_features)],
-            "entity_tag": self.entity_tag,
-            "entity_role_tag": self.entity_role_tag,
-            "entity_group_tag": self.entity_group_tag,
-        }
-    @classmethod
-    def create_from_dict(cls, data: Dict[str, Any]) -> "CRFToken":
-        return cls(
-            data["text"],
-            data["pos_tag"],
-            data["pattern"],
-            np.array([float(x) for x in data["dense_features"]]),
-            data["entity_tag"],
-            data["entity_role_tag"],
-            data["entity_group_tag"],
-        )
 class CRFEntityExtractorOptions(str, Enum):
     """Features that can be used for the 'CRFEntityExtractor'."""
@@ -114,6 +88,8 @@ class CRFEntityExtractorOptions(str, Enum):
 class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
     """Implements conditional random fields (CRF) to do named entity recognition."""
+    CONFIG_FEATURES = "features"
     function_dict: Dict[Text, Callable[[CRFToken], Any]] = {  # noqa: RUF012
         CRFEntityExtractorOptions.LOW: lambda crf_token: crf_token.text.lower(),
         CRFEntityExtractorOptions.TITLE: lambda crf_token: crf_token.text.istitle(),
@@ -132,7 +108,7 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
         CRFEntityExtractorOptions.DIGIT: lambda crf_token: crf_token.text.isdigit(),
         CRFEntityExtractorOptions.PATTERN: lambda crf_token: crf_token.pattern,
         CRFEntityExtractorOptions.TEXT_DENSE_FEATURES: (
-            lambda crf_token: CRFEntityExtractor._convert_dense_features_for_crfsuite(  # noqa: E501
+            lambda crf_token: CRFEntityExtractor._convert_dense_features_for_crfsuite(
                 crf_token
             )
         ),
@@ -161,7 +137,7 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
             # "is the preceding token in title case?"
             # POS features require SpacyTokenizer
             # pattern feature require RegexFeaturizer
-            CONFIG_FEATURES: [
+            CRFEntityExtractor.CONFIG_FEATURES: [
                 [
                     CRFEntityExtractorOptions.LOW,
                     CRFEntityExtractorOptions.TITLE,
@@ -224,7 +200,7 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
         )
     def _validate_configuration(self) -> None:
-        if len(self.component_config.get(CONFIG_FEATURES, [])) % 2 != 1:
+        if len(self.component_config.get(self.CONFIG_FEATURES, [])) % 2 != 1:
             raise ValueError(
                 "Need an odd number of crf feature lists to have a center word."
             )
@@ -275,11 +251,9 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
         ]
         dataset = [self._convert_to_crf_tokens(example) for example in entity_examples]
-        self.entity_taggers = self.train_model(
-            dataset, self.component_config, self.crf_order
-        )
+        self._train_model(dataset)
-        self.persist(dataset)
+        self.persist()
         return self._resource
@@ -325,9 +299,7 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
             if include_tag_features:
                 self._add_tag_to_crf_token(crf_tokens, predictions)
-            features = self._crf_tokens_to_features(
-                crf_tokens, self.component_config, include_tag_features
-            )
+            features = self._crf_tokens_to_features(crf_tokens, include_tag_features)
             predictions[tag_name] = entity_tagger.predict_marginals_single(features)
         # convert predictions into a list of tags and a list of confidences
@@ -417,25 +389,27 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
         **kwargs: Any,
     ) -> CRFEntityExtractor:
         """Loads trained component (see parent class for full docstring)."""
+        import joblib
         try:
+            entity_taggers = OrderedDict()
             with model_storage.read_from(resource) as model_dir:
-                dataset = rasa.shared.utils.io.read_json_file(
-                    model_dir / "crf_dataset.json"
-                )
-                crf_order = rasa.shared.utils.io.read_json_file(
-                    model_dir / "crf_order.json"
-                )
-                dataset = [
-                    [CRFToken.create_from_dict(token_data) for token_data in sub_list]
-                    for sub_list in dataset
-                ]
+                # We have to load in the same order as we persisted things as otherwise
+                # the predictions might be off
+                file_names = sorted(model_dir.glob("**/*.pkl"))
+                if not file_names:
+                    logger.debug(
+                        "Failed to load model for 'CRFEntityExtractor'. "
+                        "Maybe you did not provide enough training data and "
+                        "no model was trained."
+                    )
+                    return cls(config, model_storage, resource)
-                entity_taggers = cls.train_model(dataset, config, crf_order)
+                for file_name in file_names:
+                    name = file_name.stem[1:]
+                    entity_taggers[name] = joblib.load(file_name)
-                entity_extractor = cls(config, model_storage, resource, entity_taggers)
-                entity_extractor.crf_order = crf_order
-                return entity_extractor
+                return cls(config, model_storage, resource, entity_taggers)
         except ValueError:
             logger.warning(
                 f"Failed to load {cls.__name__} from model storage. Resource "
@@ -443,29 +417,23 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
             )
             return cls(config, model_storage, resource)
-    def persist(self, dataset: List[List[CRFToken]]) -> None:
+    def persist(self) -> None:
         """Persist this model into the passed directory."""
-        with self._model_storage.write_to(self._resource) as model_dir:
-            data_to_store = [
-                [token.to_dict() for token in sub_list] for sub_list in dataset
-            ]
+        import joblib
-            rasa.shared.utils.io.dump_obj_as_json_to_file(
-                model_dir / "crf_dataset.json", data_to_store
-            )
-            rasa.shared.utils.io.dump_obj_as_json_to_file(
-                model_dir / "crf_order.json", self.crf_order
-            )
+        with self._model_storage.write_to(self._resource) as model_dir:
+            if self.entity_taggers:
+                for idx, (name, entity_tagger) in enumerate(
+                    self.entity_taggers.items()
+                ):
+                    model_file_name = model_dir / f"{idx}{name}.pkl"
+                    joblib.dump(entity_tagger, model_file_name)
-    @classmethod
     def _crf_tokens_to_features(
-        cls,
-        crf_tokens: List[CRFToken],
-        config: Dict[str, Any],
-        include_tag_features: bool = False,
+        self, crf_tokens: List[CRFToken], include_tag_features: bool = False
     ) -> List[Dict[Text, Any]]:
         """Convert the list of tokens into discrete features."""
-        configured_features = config[CONFIG_FEATURES]
+        configured_features = self.component_config[self.CONFIG_FEATURES]
         sentence_features = []
         for token_idx in range(len(crf_tokens)):
@@ -476,31 +444,28 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
             half_window_size = window_size // 2
             window_range = range(-half_window_size, half_window_size + 1)
-            token_features = cls._create_features_for_token(
+            token_features = self._create_features_for_token(
                 crf_tokens,
                 token_idx,
                 half_window_size,
                 window_range,
                 include_tag_features,
-                config,
             )
             sentence_features.append(token_features)
         return sentence_features
-    @classmethod
     def _create_features_for_token(
-        cls,
+        self,
         crf_tokens: List[CRFToken],
         token_idx: int,
         half_window_size: int,
         window_range: range,
         include_tag_features: bool,
-        config: Dict[str, Any],
     ) -> Dict[Text, Any]:
         """Convert a token into discrete features including words before and after."""
-        configured_features = config[CONFIG_FEATURES]
+        configured_features = self.component_config[self.CONFIG_FEATURES]
         prefixes = [str(i) for i in window_range]
         token_features = {}
@@ -540,13 +505,13 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
                         # set in the training data, 'matched' is either 'True' or
                         # 'False' depending on whether the token actually matches the
                         # pattern or not
-                        regex_patterns = cls.function_dict[feature](token)
+                        regex_patterns = self.function_dict[feature](token)
                         for pattern_name, matched in regex_patterns.items():
-                            token_features[
-                                f"{prefix}:{feature}:{pattern_name}"
-                            ] = matched
+                            token_features[f"{prefix}:{feature}:{pattern_name}"] = (
+                                matched
+                            )
                     else:
-                        value = cls.function_dict[feature](token)
+                        value = self.function_dict[feature](token)
                         token_features[f"{prefix}:{feature}"] = value
         return token_features
@@ -670,46 +635,38 @@ class CRFEntityExtractor(GraphComponent, EntityExtractorMixin):
         return tags
-    @classmethod
-    def train_model(
-        cls,
-        df_train: List[List[CRFToken]],
-        config: Dict[str, Any],
-        crf_order: List[str],
-    ) -> OrderedDict[str, CRF]:
+    def _train_model(self, df_train: List[List[CRFToken]]) -> None:
         """Train the crf tagger based on the training data."""
         import sklearn_crfsuite
-        entity_taggers = OrderedDict()
+        self.entity_taggers = OrderedDict()
-        for tag_name in crf_order:
+        for tag_name in self.crf_order:
             logger.debug(f"Training CRF for '{tag_name}'.")
             # add entity tag features for second level CRFs
             include_tag_features = tag_name != ENTITY_ATTRIBUTE_TYPE
             X_train = (
-                cls._crf_tokens_to_features(sentence, config, include_tag_features)
+                self._crf_tokens_to_features(sentence, include_tag_features)
                 for sentence in df_train
             )
             y_train = (
-                cls._crf_tokens_to_tags(sentence, tag_name) for sentence in df_train
+                self._crf_tokens_to_tags(sentence, tag_name) for sentence in df_train
             )
             entity_tagger = sklearn_crfsuite.CRF(
                 algorithm="lbfgs",
                 # coefficient for L1 penalty
-                c1=config["L1_c"],
+                c1=self.component_config["L1_c"],
                 # coefficient for L2 penalty
-                c2=config["L2_c"],
+                c2=self.component_config["L2_c"],
                 # stop earlier
-                max_iterations=config["max_iterations"],
+                max_iterations=self.component_config["max_iterations"],
                 # include transitions that are possible, but not observed
                 all_possible_transitions=True,
             )
             entity_tagger.fit(X_train, y_train)
-            entity_taggers[tag_name] = entity_tagger
+            self.entity_taggers[tag_name] = entity_tagger
             logger.debug("Training finished.")
-        return entity_taggers

rasa-pro 3.8.18__py3-none-any.whl → 3.9.15__py3-none-any.whl

Potentially problematic release.

rasa-pro 3.8.18py3-none-any.whl → 3.9.15py3-none-any.whl