PyPI - vtlengine - Versions diffs - 1.0.0__py3-none-any.whl → 1.0.1__py3-none-any.whl - Mend

vtlengine 1.0.0py3-none-any.whl → 1.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of vtlengine might be problematic. Click here for more details.

Files changed (54) hide show

vtlengine/API/_InternalApi.py +153 -100
vtlengine/API/__init__.py +109 -67
vtlengine/AST/ASTConstructor.py +188 -98
vtlengine/AST/ASTConstructorModules/Expr.py +306 -200
vtlengine/AST/ASTConstructorModules/ExprComponents.py +172 -102
vtlengine/AST/ASTConstructorModules/Terminals.py +158 -95
vtlengine/AST/ASTEncoders.py +1 -1
vtlengine/AST/ASTTemplate.py +8 -9
vtlengine/AST/ASTVisitor.py +8 -12
vtlengine/AST/DAG/__init__.py +43 -35
vtlengine/AST/DAG/_words.py +4 -4
vtlengine/AST/Grammar/lexer.py +732 -142
vtlengine/AST/Grammar/parser.py +2188 -826
vtlengine/AST/Grammar/tokens.py +128 -128
vtlengine/AST/VtlVisitor.py +7 -4
vtlengine/AST/__init__.py +22 -11
vtlengine/DataTypes/NumericTypesHandling.py +5 -4
vtlengine/DataTypes/TimeHandling.py +194 -301
vtlengine/DataTypes/__init__.py +304 -218
vtlengine/Exceptions/__init__.py +52 -27
vtlengine/Exceptions/messages.py +134 -62
vtlengine/Interpreter/__init__.py +781 -487
vtlengine/Model/__init__.py +165 -121
vtlengine/Operators/Aggregation.py +156 -95
vtlengine/Operators/Analytic.py +115 -59
vtlengine/Operators/Assignment.py +7 -4
vtlengine/Operators/Boolean.py +27 -32
vtlengine/Operators/CastOperator.py +177 -131
vtlengine/Operators/Clause.py +137 -99
vtlengine/Operators/Comparison.py +148 -117
vtlengine/Operators/Conditional.py +149 -98
vtlengine/Operators/General.py +68 -47
vtlengine/Operators/HROperators.py +91 -72
vtlengine/Operators/Join.py +217 -118
vtlengine/Operators/Numeric.py +89 -44
vtlengine/Operators/RoleSetter.py +16 -15
vtlengine/Operators/Set.py +61 -36
vtlengine/Operators/String.py +213 -139
vtlengine/Operators/Time.py +334 -216
vtlengine/Operators/Validation.py +117 -76
vtlengine/Operators/__init__.py +340 -213
vtlengine/Utils/__init__.py +195 -40
vtlengine/__init__.py +1 -1
vtlengine/files/output/__init__.py +15 -6
vtlengine/files/output/_time_period_representation.py +10 -9
vtlengine/files/parser/__init__.py +77 -52
vtlengine/files/parser/_rfc_dialect.py +6 -5
vtlengine/files/parser/_time_checking.py +46 -37
vtlengine-1.0.1.dist-info/METADATA +236 -0
vtlengine-1.0.1.dist-info/RECORD +58 -0
{vtlengine-1.0.dist-info → vtlengine-1.0.1.dist-info}/WHEEL +1 -1
vtlengine-1.0.dist-info/METADATA +0 -104
vtlengine-1.0.dist-info/RECORD +0 -58
{vtlengine-1.0.dist-info → vtlengine-1.0.1.dist-info}/LICENSE.md +0 -0

vtlengine/Operators/Clause.py CHANGED Viewed

@@ -1,7 +1,15 @@
-from copy import copy
-from typing import List, Union
+import pandas as pd
-from vtlengine.DataTypes import Boolean, String, check_unary_implicit_promotion, unary_implicit_promotion
+from copy import copy
+from typing import List, Union, Type
+from vtlengine.DataTypes import (
+    Boolean,
+    String,
+    check_unary_implicit_promotion,
+    unary_implicit_promotion,
+    ScalarType,
+)
 from vtlengine.Operators import Operator
 from vtlengine.AST import RenameNode
@@ -14,7 +22,7 @@ class Calc(Operator):
     op = CALC
     @classmethod
-    def validate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset):
+    def validate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset) -> Dataset:
         result_components = {name: copy(comp) for name, comp in dataset.components.items()}
         result_dataset = Dataset(name=dataset.name, components=result_components, data=None)
@@ -23,32 +31,35 @@ class Calc(Operator):
             if operand.name in result_dataset.components:
                 if result_dataset.components[operand.name].role == Role.IDENTIFIER:
-                    raise SemanticError("1-1-6-13", op=cls.op,
-                                        comp_name=operand.name)
+                    raise SemanticError("1-1-6-13", op=cls.op, comp_name=operand.name)
                 # Override component with same name
                 # TODO: Check this for version 2.1
                 result_dataset.delete_component(operand.name)
             if isinstance(operand, Scalar):
-                result_dataset.add_component(Component(
-                    name=operand.name,
-                    data_type=operand.data_type,
-                    role=Role.MEASURE,
-                    nullable=True
-                ))
+                result_dataset.add_component(
+                    Component(
+                        name=operand.name,
+                        data_type=operand.data_type,
+                        role=Role.MEASURE,
+                        nullable=True,
+                    )
+                )
             else:
-                result_dataset.add_component(Component(
-                    name=operand.name,
-                    data_type=operand.data_type,
-                    role=operand.role,
-                    nullable=operand.nullable
-                ))
+                result_dataset.add_component(
+                    Component(
+                        name=operand.name,
+                        data_type=operand.data_type,
+                        role=operand.role,
+                        nullable=operand.nullable,
+                    )
+                )
         return result_dataset
     @classmethod
-    def evaluate(cls, operands: List[DataComponent], dataset: Dataset):
+    def evaluate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.copy()
+        result_dataset.data = dataset.data.copy() if dataset.data is not None else pd.DataFrame()
         for operand in operands:
             if isinstance(operand, Scalar):
                 result_dataset.data[operand.name] = operand.value
@@ -61,12 +72,14 @@ class Aggregate(Operator):
     op = AGGREGATE
     @classmethod
-    def validate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset):
+    def validate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset) -> Dataset:
         result_dataset = Dataset(name=dataset.name, components=dataset.components, data=None)
         for operand in operands:
-            if operand.name in dataset.get_identifiers_names() or operand.role == Role.IDENTIFIER:
+            if operand.name in dataset.get_identifiers_names() or (
+                isinstance(operand, DataComponent) and operand.role == Role.IDENTIFIER
+            ):
                 raise SemanticError("1-1-6-13", op=cls.op, comp_name=operand.name)
             elif operand.name in dataset.components:
@@ -74,30 +87,34 @@ class Aggregate(Operator):
                 dataset.delete_component(operand.name)
             if isinstance(operand, Scalar):
-                result_dataset.add_component(Component(
-                    name=operand.name,
-                    data_type=operand.data_type,
-                    role=Role.MEASURE,
-                    nullable=True
-                ))
+                result_dataset.add_component(
+                    Component(
+                        name=operand.name,
+                        data_type=operand.data_type,
+                        role=Role.MEASURE,
+                        nullable=True,
+                    )
+                )
             else:
-                result_dataset.add_component(Component(
-                    name=operand.name,
-                    data_type=operand.data_type,
-                    role=operand.role,
-                    nullable=operand.nullable
-                ))
+                result_dataset.add_component(
+                    Component(
+                        name=operand.name,
+                        data_type=operand.data_type,
+                        role=operand.role,
+                        nullable=operand.nullable,
+                    )
+                )
         return result_dataset
     @classmethod
-    def evaluate(cls, operands: List[DataComponent], dataset: Dataset):
+    def evaluate(cls, operands: List[Union[DataComponent, Scalar]], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.copy()
+        result_dataset.data = copy(dataset.data) if dataset.data is not None else pd.DataFrame()
         for operand in operands:
             if isinstance(operand, Scalar):
                 result_dataset.data[operand.name] = operand.value
             else:
-                if len(operand.data) > 0:
+                if operand.data is not None and len(operand.data) > 0:
                     result_dataset.data[operand.name] = operand.data
                 else:
                     result_dataset.data[operand.name] = None
@@ -107,16 +124,16 @@ class Aggregate(Operator):
 class Filter(Operator):
     @classmethod
-    def validate(cls, condition: DataComponent, dataset: Dataset):
+    def validate(cls, condition: DataComponent, dataset: Dataset) -> Dataset:
         if condition.data_type != Boolean:
             raise ValueError(f"Filter condition must be of type {Boolean}")
         return Dataset(name=dataset.name, components=dataset.components, data=None)
     @classmethod
-    def evaluate(cls, condition: DataComponent, dataset: Dataset):
+    def evaluate(cls, condition: DataComponent, dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(condition, dataset)
-        result_dataset.data = dataset.data.copy()
-        if len(condition.data) > 0:
+        result_dataset.data = dataset.data.copy() if dataset.data is not None else pd.DataFrame()
+        if condition.data is not None and len(condition.data) > 0 and dataset.data is not None:
             true_indexes = condition.data[condition.data == True].index
             result_dataset.data = dataset.data.iloc[true_indexes].reset_index(drop=True)
         return result_dataset
@@ -126,27 +143,31 @@ class Keep(Operator):
     op = KEEP
     @classmethod
-    def validate(cls, operands: List[str], dataset: Dataset):
+    def validate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         for operand in operands:
             if operand not in dataset.get_components_names():
-                raise SemanticError("1-1-1-10", op=cls.op, comp_name=operand,
-                                    dataset_name=dataset.name)
+                raise SemanticError(
+                    "1-1-1-10", op=cls.op, comp_name=operand, dataset_name=dataset.name
+                )
             if dataset.get_component(operand).role == Role.IDENTIFIER:
                 raise SemanticError("1-1-6-2", op=cls.op, name=operand, dataset=dataset.name)
-        result_components = {name: comp for name, comp in dataset.components.items()
-                             if comp.name in operands or comp.role == Role.IDENTIFIER}
+        result_components = {
+            name: comp
+            for name, comp in dataset.components.items()
+            if comp.name in operands or comp.role == Role.IDENTIFIER
+        }
         return Dataset(name=dataset.name, components=result_components, data=None)
     @classmethod
     def evaluate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         if len(operands) == 0:
-            raise ValueError('Keep clause requires at least one operand')
+            raise ValueError("Keep clause requires at least one operand")
         if dataset is None:
             if sum(isinstance(operand, Dataset) for operand in operands) != 1:
-                raise ValueError('Keep clause requires at most one dataset operand')
+                raise ValueError("Keep clause requires at most one dataset operand")
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data[dataset.get_identifiers_names() + operands]
+        if dataset.data is not None:
+            result_dataset.data = dataset.data[dataset.get_identifiers_names() + operands]
         return result_dataset
@@ -154,7 +175,7 @@ class Drop(Operator):
     op = DROP
     @classmethod
-    def validate(cls, operands: List[str], dataset: Dataset):
+    def validate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         for operand in operands:
             if operand not in dataset.components:
                 raise SemanticError("1-1-1-10", comp_name=operand, dataset_name=dataset.name)
@@ -162,15 +183,16 @@ class Drop(Operator):
                 raise SemanticError("1-1-6-2", op=cls.op, name=operand, dataset=dataset.name)
         if len(dataset.components) == len(operands):
             raise SemanticError("1-1-6-12", op=cls.op)
-        result_components = {name: comp for name, comp in dataset.components.items()
-                             if comp.name not in operands}
+        result_components = {
+            name: comp for name, comp in dataset.components.items() if comp.name not in operands
+        }
         return Dataset(name=dataset.name, components=result_components, data=None)
     @classmethod
-    def evaluate(cls, operands: List[str], dataset: Dataset):
+    def evaluate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.drop(columns=operands, axis=1)
+        if dataset.data is not None:
+            result_dataset.data = dataset.data.drop(columns=operands, axis=1)
         return result_dataset
@@ -178,26 +200,26 @@ class Rename(Operator):
     op = RENAME
     @classmethod
-    def validate(cls, operands: List[RenameNode], dataset: Dataset):
+    def validate(cls, operands: List[RenameNode], dataset: Dataset) -> Dataset:
         from_names = [operand.old_name for operand in operands]
         if len(from_names) != len(set(from_names)):
-            duplicates = set(
-                [name for name in from_names if from_names.count(name) > 1])
+            duplicates = set([name for name in from_names if from_names.count(name) > 1])
             raise SemanticError("1-1-6-9", op=cls.op, from_components=duplicates)
         to_names = [operand.new_name for operand in operands]
-        if len(to_names) != len(set(to_names)):  # Si hay duplicados
-            duplicates = set(
-                [name for name in to_names if to_names.count(name) > 1])
+        if len(to_names) != len(set(to_names)):  # If duplicates
+            duplicates = set([name for name in to_names if to_names.count(name) > 1])
             raise SemanticError("1-3-1", alias=duplicates)
         for operand in operands:
             if operand.old_name not in dataset.components.keys():
-                raise SemanticError("1-1-1-10", op=cls.op, comp_name=operand.old_name,
-                                    dataset_name=dataset.name)
+                raise SemanticError(
+                    "1-1-1-10", op=cls.op, comp_name=operand.old_name, dataset_name=dataset.name
+                )
             if operand.new_name in dataset.components.keys():
-                raise SemanticError("1-1-6-8", op=cls.op, comp_name=operand.new_name,
-                                    dataset_name=dataset.name)
+                raise SemanticError(
+                    "1-1-6-8", op=cls.op, comp_name=operand.new_name, dataset_name=dataset.name
+                )
         result_components = {comp.name: comp for comp in dataset.components.values()}
         for operand in operands:
@@ -205,35 +227,37 @@ class Rename(Operator):
                 name=operand.new_name,
                 data_type=result_components[operand.old_name].data_type,
                 role=result_components[operand.old_name].role,
-                nullable=result_components[operand.old_name].nullable
+                nullable=result_components[operand.old_name].nullable,
             )
             del result_components[operand.old_name]
         return Dataset(name=dataset.name, components=result_components, data=None)
     @classmethod
-    def evaluate(cls, operands: List[RenameNode], dataset: Dataset):
+    def evaluate(cls, operands: List[RenameNode], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.rename(columns={operand.old_name: operand.new_name
-                                                           for operand in operands})
+        if dataset.data is not None:
+            result_dataset.data = dataset.data.rename(
+                columns={operand.old_name: operand.new_name for operand in operands}
+            )
         return result_dataset
 class Pivot(Operator):
     @classmethod
-    def validate(cls, operands: List[str], dataset: Dataset):
+    def validate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         raise NotImplementedError
     @classmethod
-    def evaluate(cls, operands: List[str], dataset: Dataset):
+    def evaluate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         raise NotImplementedError
 class Unpivot(Operator):
     @classmethod
-    def validate(cls, operands: List[str], dataset: Dataset):
+    def validate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         if len(operands) != 2:
             raise ValueError("Unpivot clause requires two operands")
         identifier, measure = operands
@@ -246,10 +270,11 @@ class Unpivot(Operator):
         result_components = {comp.name: comp for comp in dataset.get_identifiers()}
         result_dataset = Dataset(name=dataset.name, components=result_components, data=None)
         # noinspection PyTypeChecker
-        result_dataset.add_component(Component(name=identifier, data_type=String,
-                                               role=Role.IDENTIFIER, nullable=False))
+        result_dataset.add_component(
+            Component(name=identifier, data_type=String, role=Role.IDENTIFIER, nullable=False)
+        )
         base_type = None
-        final_type = String
+        final_type: Type[ScalarType] = String
         for comp in dataset.get_measures():
             if base_type is None:
                 base_type = comp.data_type
@@ -258,18 +283,23 @@ class Unpivot(Operator):
                     raise ValueError("All measures must have the same data type on unpivot clause")
             final_type = unary_implicit_promotion(base_type, comp.data_type)
-        result_dataset.add_component(Component(name=measure, data_type=final_type,
-                                               role=Role.MEASURE, nullable=True))
+        result_dataset.add_component(
+            Component(name=measure, data_type=final_type, role=Role.MEASURE, nullable=True)
+        )
         return result_dataset
     @classmethod
-    def evaluate(cls, operands: List[str], dataset: Dataset):
+    def evaluate(cls, operands: List[str], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.melt(id_vars=dataset.get_identifiers_names(),
-                                                value_vars=dataset.get_measures_names(),
-                                                var_name=operands[0], value_name="NEW_COLUMN")
-        result_dataset.data.rename(columns={"NEW_COLUMN": operands[1]}, inplace=True)
-        result_dataset.data = result_dataset.data.dropna().reset_index(drop=True)
+        if dataset.data is not None:
+            result_dataset.data = dataset.data.melt(
+                id_vars=dataset.get_identifiers_names(),
+                value_vars=dataset.get_measures_names(),
+                var_name=operands[0],
+                value_name="NEW_COLUMN",
+            )
+            result_dataset.data.rename(columns={"NEW_COLUMN": operands[1]}, inplace=True)
+            result_dataset.data = result_dataset.data.dropna().reset_index(drop=True)
         return result_dataset
@@ -277,39 +307,47 @@ class Sub(Operator):
     op = SUBSPACE
     @classmethod
-    def validate(cls, operands: List[DataComponent], dataset: Dataset):
+    def validate(cls, operands: List[DataComponent], dataset: Dataset) -> Dataset:
         if len(dataset.get_identifiers()) < 1:
             raise SemanticError("1-3-27", op=cls.op)
         for operand in operands:
             if operand.name not in dataset.components:
-                raise SemanticError("1-1-1-10", op=cls.op, comp_name=operand.name,
-                                    dataset_name=dataset.name)
+                raise SemanticError(
+                    "1-1-1-10", op=cls.op, comp_name=operand.name, dataset_name=dataset.name
+                )
             if operand.role != Role.IDENTIFIER:
-                raise SemanticError("1-1-6-10", op=cls.op, operand=operand.name,
-                                    dataset_name=dataset.name)
+                raise SemanticError(
+                    "1-1-6-10", op=cls.op, operand=operand.name, dataset_name=dataset.name
+                )
             if isinstance(operand, Scalar):
                 raise SemanticError("1-1-6-5", op=cls.op, name=operand.name)
-        result_components = {name: comp for name, comp in dataset.components.items()
-                             if comp.name not in [operand.name for operand in operands]}
+        result_components = {
+            name: comp
+            for name, comp in dataset.components.items()
+            if comp.name not in [operand.name for operand in operands]
+        }
         return Dataset(name=dataset.name, components=result_components, data=None)
     @classmethod
-    def evaluate(cls, operands: List[DataComponent], dataset: Dataset):
+    def evaluate(cls, operands: List[DataComponent], dataset: Dataset) -> Dataset:
         result_dataset = cls.validate(operands, dataset)
-        result_dataset.data = dataset.data.copy()
+        result_dataset.data = copy(dataset.data) if dataset.data is not None else pd.DataFrame()
         operand_names = [operand.name for operand in operands]
-        if len(dataset.data) > 0:
+        if dataset.data is not None and len(dataset.data) > 0:
             # Filter the Dataframe
             # by intersecting the indexes of the Data Component with True values
             true_indexes = set()
             is_first = True
             for operand in operands:
-                if is_first:
-                    true_indexes = set(operand.data[operand.data == True].index)
-                    is_first = False
-                else:
-                    true_indexes.intersection_update(set(operand.data[operand.data == True].index))
+                if operand.data is not None:
+                    if is_first:
+                        true_indexes = set(operand.data[operand.data == True].index)
+                        is_first = False
+                    else:
+                        true_indexes.intersection_update(
+                            set(operand.data[operand.data == True].index)
+                        )
             result_dataset.data = result_dataset.data.iloc[list(true_indexes)]
         result_dataset.data = result_dataset.data.drop(columns=operand_names, axis=1)
         result_dataset.data = result_dataset.data.reset_index(drop=True)

vtlengine 1.0.0__py3-none-any.whl → 1.0.1__py3-none-any.whl

Potentially problematic release.

vtlengine 1.0.0py3-none-any.whl → 1.0.1py3-none-any.whl