PyPI - vtlengine - Versions diffs - 1.0.0__py3-none-any.whl → 1.0.1__py3-none-any.whl - Mend

vtlengine 1.0.0py3-none-any.whl → 1.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of vtlengine might be problematic. Click here for more details.

Files changed (54) hide show

vtlengine/API/_InternalApi.py +153 -100
vtlengine/API/__init__.py +109 -67
vtlengine/AST/ASTConstructor.py +188 -98
vtlengine/AST/ASTConstructorModules/Expr.py +306 -200
vtlengine/AST/ASTConstructorModules/ExprComponents.py +172 -102
vtlengine/AST/ASTConstructorModules/Terminals.py +158 -95
vtlengine/AST/ASTEncoders.py +1 -1
vtlengine/AST/ASTTemplate.py +8 -9
vtlengine/AST/ASTVisitor.py +8 -12
vtlengine/AST/DAG/__init__.py +43 -35
vtlengine/AST/DAG/_words.py +4 -4
vtlengine/AST/Grammar/lexer.py +732 -142
vtlengine/AST/Grammar/parser.py +2188 -826
vtlengine/AST/Grammar/tokens.py +128 -128
vtlengine/AST/VtlVisitor.py +7 -4
vtlengine/AST/__init__.py +22 -11
vtlengine/DataTypes/NumericTypesHandling.py +5 -4
vtlengine/DataTypes/TimeHandling.py +194 -301
vtlengine/DataTypes/__init__.py +304 -218
vtlengine/Exceptions/__init__.py +52 -27
vtlengine/Exceptions/messages.py +134 -62
vtlengine/Interpreter/__init__.py +781 -487
vtlengine/Model/__init__.py +165 -121
vtlengine/Operators/Aggregation.py +156 -95
vtlengine/Operators/Analytic.py +115 -59
vtlengine/Operators/Assignment.py +7 -4
vtlengine/Operators/Boolean.py +27 -32
vtlengine/Operators/CastOperator.py +177 -131
vtlengine/Operators/Clause.py +137 -99
vtlengine/Operators/Comparison.py +148 -117
vtlengine/Operators/Conditional.py +149 -98
vtlengine/Operators/General.py +68 -47
vtlengine/Operators/HROperators.py +91 -72
vtlengine/Operators/Join.py +217 -118
vtlengine/Operators/Numeric.py +89 -44
vtlengine/Operators/RoleSetter.py +16 -15
vtlengine/Operators/Set.py +61 -36
vtlengine/Operators/String.py +213 -139
vtlengine/Operators/Time.py +334 -216
vtlengine/Operators/Validation.py +117 -76
vtlengine/Operators/__init__.py +340 -213
vtlengine/Utils/__init__.py +195 -40
vtlengine/__init__.py +1 -1
vtlengine/files/output/__init__.py +15 -6
vtlengine/files/output/_time_period_representation.py +10 -9
vtlengine/files/parser/__init__.py +77 -52
vtlengine/files/parser/_rfc_dialect.py +6 -5
vtlengine/files/parser/_time_checking.py +46 -37
vtlengine-1.0.1.dist-info/METADATA +236 -0
vtlengine-1.0.1.dist-info/RECORD +58 -0
{vtlengine-1.0.dist-info → vtlengine-1.0.1.dist-info}/WHEEL +1 -1
vtlengine-1.0.dist-info/METADATA +0 -104
vtlengine-1.0.dist-info/RECORD +0 -58
{vtlengine-1.0.dist-info → vtlengine-1.0.1.dist-info}/LICENSE.md +0 -0

vtlengine/Operators/Validation.py CHANGED Viewed

@@ -9,13 +9,20 @@ from vtlengine.AST.Grammar.tokens import CHECK, CHECK_HIERARCHY
 from vtlengine.Exceptions import SemanticError
 from vtlengine.Model import Component, Dataset, Role
 # noinspection PyTypeChecker
 class Check(Operator):
     op = CHECK
     @classmethod
-    def validate(cls, validation_element: Dataset, imbalance_element: Optional[Dataset],
-                 error_code: Optional[str], error_level: Optional[int], invalid: bool) -> Dataset:
+    def validate(
+        cls,
+        validation_element: Dataset,
+        imbalance_element: Optional[Dataset],
+        error_code: Optional[str],
+        error_level: Optional[int],
+        invalid: bool,
+    ) -> Dataset:
         if len(validation_element.get_measures()) != 1:
             raise SemanticError("1-1-10-1", op=cls.op, op_type="validation", me_type="Boolean")
         measure = validation_element.get_measures()[0]
@@ -28,7 +35,8 @@ class Check(Operator):
             imbalance_identifiers = imbalance_element.get_identifiers_names()
             if operand_identifiers != imbalance_identifiers:
                 raise Exception(
-                    "The validation and imbalance operands must have the same identifiers")
+                    "The validation and imbalance operands must have the same identifiers"
+                )
             if len(imbalance_element.get_measures()) != 1:
                 raise SemanticError("1-1-10-1", op=cls.op, op_type="imbalance", me_type="Numeric")
@@ -37,39 +45,54 @@ class Check(Operator):
                 raise SemanticError("1-1-10-1", op=cls.op, op_type="imbalance", me_type="Numeric")
         # Generating the result dataset components
-        result_components = {comp.name: comp for comp in validation_element.components.values()
-                             if comp.role in [Role.IDENTIFIER, Role.MEASURE]}
+        result_components = {
+            comp.name: comp
+            for comp in validation_element.components.values()
+            if comp.role in [Role.IDENTIFIER, Role.MEASURE]
+        }
         if imbalance_measure is None:
-            result_components['imbalance'] = Component(name='imbalance', data_type=Number,
-                                                       role=Role.MEASURE, nullable=True)
+            result_components["imbalance"] = Component(
+                name="imbalance", data_type=Number, role=Role.MEASURE, nullable=True
+            )
         else:
-            result_components['imbalance'] = copy(imbalance_measure)
-            result_components['imbalance'].name = 'imbalance'
+            result_components["imbalance"] = copy(imbalance_measure)
+            result_components["imbalance"].name = "imbalance"
-        result_components['errorcode'] = Component(name='errorcode', data_type=String,
-                                                   role=Role.MEASURE, nullable=True)
-        result_components['errorlevel'] = Component(name='errorlevel', data_type=Integer,
-                                                    role=Role.MEASURE,
-                                                    nullable=True)
+        result_components["errorcode"] = Component(
+            name="errorcode", data_type=String, role=Role.MEASURE, nullable=True
+        )
+        result_components["errorlevel"] = Component(
+            name="errorlevel", data_type=Integer, role=Role.MEASURE, nullable=True
+        )
         return Dataset(name="result", components=result_components, data=None)
     @classmethod
-    def evaluate(cls, validation_element: Dataset, imbalance_element: Optional[Dataset],
-                 error_code: Optional[str], error_level: Optional[int], invalid: bool) -> Dataset:
-        result = cls.validate(validation_element, imbalance_element, error_code, error_level,
-                              invalid)
-        columns_to_keep = (validation_element.get_identifiers_names() +
-                           validation_element.get_measures_names())
+    def evaluate(
+        cls,
+        validation_element: Dataset,
+        imbalance_element: Optional[Dataset],
+        error_code: Optional[str],
+        error_level: Optional[int],
+        invalid: bool,
+    ) -> Dataset:
+        result = cls.validate(
+            validation_element, imbalance_element, error_code, error_level, invalid
+        )
+        if validation_element.data is None:
+            validation_element.data = pd.DataFrame()
+        columns_to_keep = (
+            validation_element.get_identifiers_names() + validation_element.get_measures_names()
+        )
         result.data = validation_element.data.loc[:, columns_to_keep]
-        if imbalance_element is not None:
+        if imbalance_element is not None and imbalance_element.data is not None:
             imbalance_measure_name = imbalance_element.get_measures_names()[0]
-            result.data['imbalance'] = imbalance_element.data[imbalance_measure_name]
+            result.data["imbalance"] = imbalance_element.data[imbalance_measure_name]
         else:
-            result.data['imbalance'] = None
+            result.data["imbalance"] = None
-        result.data['errorcode'] = error_code
-        result.data['errorlevel'] = error_level
+        result.data["errorcode"] = error_code
+        result.data["errorlevel"] = error_level
         if invalid:
             # TODO: Is this always bool_var?? In any case this does the trick for more use cases
             validation_measure_name = validation_element.get_measures_names()[0]
@@ -85,10 +108,10 @@ class Validation(Operator):
     def _generate_result_data(cls, rule_info: Dict[str, Any]) -> pd.DataFrame:
         rule_list_df = []
         for rule_name, rule_data in rule_info.items():
-            rule_df = rule_data['output']
-            rule_df['ruleid'] = rule_name
-            rule_df['errorcode'] = rule_df['bool_var'].map({False: rule_data['errorcode']})
-            rule_df['errorlevel'] = rule_df['bool_var'].map({False: rule_data['errorlevel']})
+            rule_df = rule_data["output"]
+            rule_df["ruleid"] = rule_name
+            rule_df["errorcode"] = rule_df["bool_var"].map({False: rule_data["errorcode"]})
+            rule_df["errorlevel"] = rule_df["bool_var"].map({False: rule_data["errorlevel"]})
             rule_list_df.append(rule_df)
         if len(rule_list_df) == 1:
@@ -99,26 +122,32 @@ class Validation(Operator):
     @classmethod
     def validate(cls, dataset_element: Dataset, rule_info: Dict[str, Any], output: str) -> Dataset:
         result_components = {comp.name: comp for comp in dataset_element.get_identifiers()}
-        result_components['ruleid'] = Component(name='ruleid', data_type=String,
-                                                role=Role.IDENTIFIER, nullable=False)
-        if output == 'invalid':
-            result_components = {**result_components,
-                                 **{comp.name: copy(comp) for comp in
-                                    dataset_element.get_measures()}
-                                 }
-        elif output == 'all':
-            result_components['bool_var'] = Component(name='bool_var', data_type=Boolean,
-                                                      role=Role.MEASURE, nullable=True)
+        result_components["ruleid"] = Component(
+            name="ruleid", data_type=String, role=Role.IDENTIFIER, nullable=False
+        )
+        if output == "invalid":
+            result_components = {
+                **result_components,
+                **{comp.name: copy(comp) for comp in dataset_element.get_measures()},
+            }
+        elif output == "all":
+            result_components["bool_var"] = Component(
+                name="bool_var", data_type=Boolean, role=Role.MEASURE, nullable=True
+            )
         else:  # output == 'all_measures'
-            result_components = {**result_components,
-                                 **{comp.name: copy(comp) for comp in
-                                    dataset_element.get_measures()},
-                                 'bool_var': Component(name='bool_var', data_type=Boolean,
-                                                       role=Role.MEASURE, nullable=True)}
-        result_components['errorcode'] = Component(name='errorcode', data_type=String,
-                                                   role=Role.MEASURE, nullable=True)
-        result_components['errorlevel'] = Component(name='errorlevel', data_type=Number,
-                                                    role=Role.MEASURE, nullable=True)
+            result_components = {
+                **result_components,
+                **{comp.name: copy(comp) for comp in dataset_element.get_measures()},
+                "bool_var": Component(
+                    name="bool_var", data_type=Boolean, role=Role.MEASURE, nullable=True
+                ),
+            }
+        result_components["errorcode"] = Component(
+            name="errorcode", data_type=String, role=Role.MEASURE, nullable=True
+        )
+        result_components["errorlevel"] = Component(
+            name="errorlevel", data_type=Number, role=Role.MEASURE, nullable=True
+        )
         return Dataset(name="result", components=result_components, data=None)
@@ -127,25 +156,27 @@ class Validation(Operator):
         result = cls.validate(dataset_element, rule_info, output)
         result.data = cls._generate_result_data(rule_info)
-        result.data = result.data.dropna(subset=result.get_identifiers_names(),
-                                         how="any")
+        result.data = result.data.dropna(subset=result.get_identifiers_names(), how="any")
         result.data = result.data.drop_duplicates(
-            subset=result.get_identifiers_names() + ['ruleid']).reset_index(drop=True)
-        validation_measures = ['bool_var', 'errorcode', 'errorlevel']
+            subset=result.get_identifiers_names() + ["ruleid"]
+        ).reset_index(drop=True)
+        validation_measures = ["bool_var", "errorcode", "errorlevel"]
         # Only for check hierarchy
-        if 'imbalance' in result.components:
-            validation_measures.append('imbalance')
-        if output == 'invalid':
-            result.data = result.data[result.data['bool_var'] == False]
-            result.data = result.data.drop(columns=['bool_var'])
+        if "imbalance" in result.components:
+            validation_measures.append("imbalance")
+        if output == "invalid":
+            result.data = result.data[result.data["bool_var"] == False]
+            result.data = result.data.drop(columns=["bool_var"])
             result.data.reset_index(drop=True, inplace=True)
-        elif output == 'all':
-            result.data = result.data[
-                result.get_identifiers_names() + validation_measures]
+        elif output == "all":
+            result.data = result.data[result.get_identifiers_names() + validation_measures]
         else:  # output == 'all_measures'
             result.data = result.data[
-                result.get_identifiers_names() + dataset_element.get_measures_names() + validation_measures]
+                result.get_identifiers_names()
+                + dataset_element.get_measures_names()
+                + validation_measures
+            ]
         result.data = result.data[result.get_components_names()]
         return result
@@ -162,38 +193,48 @@ class Check_Hierarchy(Validation):
     def _generate_result_data(cls, rule_info: Dict[str, Any]) -> pd.DataFrame:
         df = None
         for rule_name, rule_data in rule_info.items():
-            rule_df = rule_data['output']
-            rule_df['ruleid'] = rule_name
-            rule_df['errorcode'] = rule_data['errorcode']
-            rule_df['errorlevel'] = rule_data['errorlevel']
+            rule_df = rule_data["output"]
+            rule_df["ruleid"] = rule_name
+            rule_df["errorcode"] = rule_data["errorcode"]
+            rule_df["errorlevel"] = rule_data["errorlevel"]
             if df is None:
                 df = rule_df
             else:
                 df = pd.concat([df, rule_df], ignore_index=True)
+        if df is None:
+            df = pd.DataFrame()
         return df
     @classmethod
     def validate(cls, dataset_element: Dataset, rule_info: Dict[str, Any], output: str) -> Dataset:
         result = super().validate(dataset_element, rule_info, output)
-        result.components['imbalance'] = Component(name='imbalance', data_type=Number,
-                                                   role=Role.MEASURE, nullable=True)
+        result.components["imbalance"] = Component(
+            name="imbalance", data_type=Number, role=Role.MEASURE, nullable=True
+        )
         return result
     @staticmethod
-    def validate_hr_dataset(dataset: Dataset, component_name: str):
+    def validate_hr_dataset(dataset: Dataset, component_name: str) -> None:
         if len(dataset.get_measures()) != 1:
-            raise SemanticError("1-1-10-1", op=Check_Hierarchy.op, op_type="hierarchy",
-                                me_type="Number")
+            raise SemanticError(
+                "1-1-10-1", op=Check_Hierarchy.op, op_type="hierarchy", me_type="Number"
+            )
         measure = dataset.get_measures()[0]
         if not check_unary_implicit_promotion(measure.data_type, Number):
-            raise SemanticError("1-1-10-1", op=Check_Hierarchy.op, op_type="hierarchy",
-                                me_type="Number")
+            raise SemanticError(
+                "1-1-10-1", op=Check_Hierarchy.op, op_type="hierarchy", me_type="Number"
+            )
         if component_name not in dataset.components:
-            raise SemanticError("1-1-1-10", op=Check_Hierarchy.op, comp_name=component_name,
-                                dataset_name=dataset.name)
+            raise SemanticError(
+                "1-1-1-10",
+                op=Check_Hierarchy.op,
+                comp_name=component_name,
+                dataset_name=dataset.name,
+            )
         if dataset.components[component_name].role != Role.IDENTIFIER:
-            raise SemanticError("1-3-20", name=component_name,
-                                role=dataset.components[component_name].role.value)
+            raise SemanticError(
+                "1-3-20", name=component_name, role=dataset.components[component_name].role.value
+            )
         # Remove attributes from dataset
         if len(dataset.get_attributes()) > 0:
             for x in dataset.get_attributes():

vtlengine 1.0.0__py3-none-any.whl → 1.0.1__py3-none-any.whl

Potentially problematic release.

vtlengine 1.0.0py3-none-any.whl → 1.0.1py3-none-any.whl